250x250
반응형
Notice
Link
«   2025/05   »
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
Archives
관리 메뉴

슬슬슬렁슬렁

통계용어_기본편 본문

Bigdata Marketing/통계용어

통계용어_기본편

lazymom 2023. 4. 17. 17:24
728x90
반응형
SMALL

통계적 판단의 원리 : 표본자료로부터 모집단의 특성을 파악.

 

추론통계 : 신뢰구간이나 표준오차를 제시하여 모집단에 대한 추론(통계적 검증필요, 모수추정법)

 

명칭척도: 상호 배타적으로 서로 겹치지 않는 상태에서 범주로 구분하며, 특정 상태를 지칭해주는 의미만 있어 수학적 연산 불가능 (ex.혈액형, 성별, 인종, 실험군, 치료결과 등)

 

순위척도 : 대소관계, 서열성에 관한 정보도 내포. (ex.교육정도, 사회경제적 수준, 병리조직학적 소견 등)

간격척도 : 특정상태 지칭이나 대소관계 개념 이외에도 측정치 간의 간격에 의미

비척도 : 수학적으로 완전한 형태의 변수. 예로 연령이나 혈압 등과 같은 변수는 태어나기 직정의 상태나 사망자의 혈압처럼 워넌적인 영점을 갖고 있음

모수적 통계분석 : 표본이 특정 분포를 따른다고 하는 경우 모집단에 대한 가정을 전

비모수적 통계분석 : 표본의 수가 매우 적거나 변수 분포가 특정 분포를 따른다고 가정할 수 없는 경우

t 검정(t-test)은 통계학에서 두 개의 집단 간에 차이가 있는지 검증하기 위해 사용되는 가설검정 방법 중 하나입니다. 이 검정 방법은 집단의 평균값을 비교하여 두 집단이 유의하게 차이가 있는지 여부를 판단합니다.

-독립표본t 검정 : 두 개의 독립적인 집단 간에 차이가 있는지 검증

-대응표본t 검정 : 동일한 개체 또는 집단의 서로 다른 시점에서 측정된 두 개의 변수 가네 차아가 있는지 검증

 

[회귀분석]

회귀분석 공식

y = β0 + β1x + ε

여기서 y는 종속변수, x는 독립변수, β0는 y절편, β1은 기울기, ε는 오차항을 나타냅니다.

이 공식에서 β0과 β1은 회귀계수(regression coefficients)이며, 이를 추정하기 위해 최소제곱법(OLS, Ordinary Least Squares)이라는 방법을 사용합니다.

β1, 즉 회귀계수는 다음과 같은 공식으로 계산됩니다

β1 = Cov(x, y) / Var(x)

여기서 Cov(x, y)는 x와 y의 공분산(covariance)을, Var(x)는 x의 분산(variance)을 나타냅니다.

β0은 y절편을 나타내며, 다음과 같은 공식으로 계산됩니다:

β0 = y의 평균 - (β1 * x의 평균)

이렇게 구한 회귀직선은 x가 주어졌을 때, y를 예측하는 데 사용될 수 있습니다.

 

[산포도]

범위 : range

정상범위 : normal range (전체 관측치의 95%를 포함하는 범위를 신뢰구간이라 하고 낮은 관측치의 2.5%, 높은 관측치 2.5% 제외한 구간을 정상범위라 함

분산 : 정규분포 같이 봉우리가 하나이고 좌우가 대칭인 분포의 산포도를 표시하는 가장 좋은 방법

표준편차 : 분산은 인위적으로 제곱을 해준 제곱단위이므로 원래의 단위로 재환원한 결과가 표준편차

728x90
반응형
LIST