1️⃣ 데이터드리븐 의사결정을 위한 절차
1. 가설 생성 (Formulate a hypothesis)
2. 바른 테스트 방법 찾기 (Find the right test)
3. 테스트 실행 (Execute the test)
4. 의사결정 내리기 (Make a decision)
2️⃣ 가설검정(hypothesis testing)
가설
테스트 될 수 있는 아이디어
추가 조사를 할 수 있는 제한된 증거물을 기반으로 추정되거나 제안되는 설명
가설검정
분석자가 세운 가설을 검증하기 위한 방법
p값(p-value)를 사용하여 가설 지지 여부를 판단함
가설 검증하기
확증적 자료분석(가설검증형 데이터 분석) : 미리 세운 가설을 검증하는 접근법
탐색적 자료분석 : 가설을 미리 세우지 않고 전체 데이터를 탐색적으로 해석하는 접근법
실험군(treatment group) : 어떤 조치를 취한 집단
대조군(control group) : 실험군과 비교/대조를 위해 마련한 집단
3️⃣ 귀무가설과 대립가설
귀무가설/영가설(null hypothesis)
밝히고자 하는 가설의 부정 명제
테스트 되는 가설
현재 상황
*귀무(歸無) : 무(無)로 돌아간다는 뜻
대립가설(alternative hypothesis)
밝히고 싶은 가설
현재 상황에 반하는 가설
우리가 주장하고 싶은 것
ex. 가설 : "신약에 효과가 있다."
귀무가설 : 신약에 효과가 없다.
대립가설 : 신약에 효과가 있다.
가설검정에서는 상정한 가설을 확인하고자 귀무가설을 세우고, 그 귀무가설이 틀렸음을 주장하는 것으로 대립가설을 지지한다는 흐름을 취함.
단, 귀무가설과 대립가설에는 비대칭성이 있음으로 역은 성립하지 않음. (대립가설을 부정하여 귀무가설 지지 불가)
[출처]
통계 101 X 데이터 분석, 아베 마사토, 2022
Statistics for Data Science and Business Analysis, 유데미
'통계' 카테고리의 다른 글
7. 가설검정 (3) 제1종 오류와 제2종 오류 (1) | 2023.11.30 |
---|---|
7. 가설검정 (2) 기각역과 p-value (0) | 2023.11.30 |
6. 추정량과 추정값 (3) 신뢰구간 공식 모음 (모집단 1, 2개일 때/종속, 독립일 때) (0) | 2023.11.16 |
6. 추정량과 추정값 (2) 신뢰수준과 신뢰구간 (1) | 2023.11.08 |
6. 추정량과 추정값 (1) 추정량(estimator)와 추정값(estimate) (0) | 2023.11.08 |
5. 분포 (2) 표본오차, 중심극한정리, 표준오차 (1) | 2023.11.08 |
5. 분포 (1) 분포의 정의와 정규분포, 표준정규분포 (3) | 2023.11.08 |
4. 중심경향치, 비대칭, 산포도 (4) 공분산(Covariance), 상관계수(Correlation coefficient) (0) | 2023.10.19 |