슬슬슬렁슬렁
통계용어_기본편 본문
통계적 판단의 원리 : 표본자료로부터 모집단의 특성을 파악.
추론통계 : 신뢰구간이나 표준오차를 제시하여 모집단에 대한 추론(통계적 검증필요, 모수추정법)
명칭척도: 상호 배타적으로 서로 겹치지 않는 상태에서 범주로 구분하며, 특정 상태를 지칭해주는 의미만 있어 수학적 연산 불가능 (ex.혈액형, 성별, 인종, 실험군, 치료결과 등)
순위척도 : 대소관계, 서열성에 관한 정보도 내포. (ex.교육정도, 사회경제적 수준, 병리조직학적 소견 등)
간격척도 : 특정상태 지칭이나 대소관계 개념 이외에도 측정치 간의 간격에 의미
비척도 : 수학적으로 완전한 형태의 변수. 예로 연령이나 혈압 등과 같은 변수는 태어나기 직정의 상태나 사망자의 혈압처럼 워넌적인 영점을 갖고 있음
모수적 통계분석 : 표본이 특정 분포를 따른다고 하는 경우 모집단에 대한 가정을 전
비모수적 통계분석 : 표본의 수가 매우 적거나 변수 분포가 특정 분포를 따른다고 가정할 수 없는 경우
t 검정(t-test)은 통계학에서 두 개의 집단 간에 차이가 있는지 검증하기 위해 사용되는 가설검정 방법 중 하나입니다. 이 검정 방법은 집단의 평균값을 비교하여 두 집단이 유의하게 차이가 있는지 여부를 판단합니다.
-독립표본t 검정 : 두 개의 독립적인 집단 간에 차이가 있는지 검증
-대응표본t 검정 : 동일한 개체 또는 집단의 서로 다른 시점에서 측정된 두 개의 변수 가네 차아가 있는지 검증
[회귀분석]
회귀분석 공식
y = β0 + β1x + ε
여기서 y는 종속변수, x는 독립변수, β0는 y절편, β1은 기울기, ε는 오차항을 나타냅니다.
이 공식에서 β0과 β1은 회귀계수(regression coefficients)이며, 이를 추정하기 위해 최소제곱법(OLS, Ordinary Least Squares)이라는 방법을 사용합니다.
β1, 즉 회귀계수는 다음과 같은 공식으로 계산됩니다
β1 = Cov(x, y) / Var(x)
여기서 Cov(x, y)는 x와 y의 공분산(covariance)을, Var(x)는 x의 분산(variance)을 나타냅니다.
β0은 y절편을 나타내며, 다음과 같은 공식으로 계산됩니다:
β0 = y의 평균 - (β1 * x의 평균)
이렇게 구한 회귀직선은 x가 주어졌을 때, y를 예측하는 데 사용될 수 있습니다.
[산포도]
범위 : range
정상범위 : normal range (전체 관측치의 95%를 포함하는 범위를 신뢰구간이라 하고 낮은 관측치의 2.5%, 높은 관측치 2.5% 제외한 구간을 정상범위라 함
분산 : 정규분포 같이 봉우리가 하나이고 좌우가 대칭인 분포의 산포도를 표시하는 가장 좋은 방법
표준편차 : 분산은 인위적으로 제곱을 해준 제곱단위이므로 원래의 단위로 재환원한 결과가 표준편차
'Bigdata Marketing > 통계용어' 카테고리의 다른 글
회귀분석 다중회귀분석 단순회귀분석 상관분석 예시_이해하기 (0) | 2023.04.24 |
---|