T-test
2024. 1. 17. 01:51ㆍ1. Data Analyst/1-0-2. Statistics (통계)
728x90
반응형
패스트캠퍼스 데이터분석 마스터클래스
** 쌍체비교 : 동일 집단(두 집단의 관측수 동일)의 전후 비교 (예: 마케팅 전/후 효과 분석)
유의수준 0.05: 5%(0.05)안에 작으면 우연이 아니다.
자유도: 관측수 -1
T-통계량(t-value): 5%안에 드는 포인트를 지나냐 안지나냐?
> 5%안에 든다. == T-통계량 > T-기각치
> 5%안에 못든다. == T-통계량 < T-기각치
양측검정 : 같냐, 틀리냐
단측검정: 높냐, 낮냐
예. 2023년 2022년 유치고객 평균은 같냐 틀리냐 =>양측검정
2023년 고객평균매출이 2022년보다 크다 작다 => 단측검정
P-value < 유의계수(0.05) : 우연이 아니다. (==유의미한 값이다)
** 독립표본 검정
필요조건: 두 집단이 등분산성을 만족하는가?
> 등분산성 만족여부 아는 방법: F-검점(:두 집단이 등분산인가 아닌가 하는 결론 내는법)
> P 단측 검정 < 0.05 : 두 집단의 분산이 다르다
> 두 집단의 분산이 다른게 왜 중요? 같을 때 다를 때 사용하는 T-TEST가 다름.
같을 때: 등분산 가정 두집단
다를 때: 이분산 가정 두집단
728x90
반응형
'1. Data Analyst > 1-0-2. Statistics (통계)' 카테고리의 다른 글
차트 - 데이터 분포확인이 중요한 이유 (0) | 2024.01.19 |
---|---|
사분위수 - 이상치(outlier) 탐지 (0) | 2024.01.19 |
1종 오류와 2종 오류란?, 실생활 예시 5가지 (0) | 2023.09.19 |
Linear Regression - 선형회귀 개념 및 결과 해석방법 (매우쉬움) -2 (1) | 2023.09.07 |
Linear Regression - 선형회귀 개념 및 결과 해석방법 (매우쉬움) -1 (0) | 2023.09.07 |