728x90
단측검정
- 귀무가설 : 모평균(130g)과 표본평균(128.451g)은 같다
- 대립가설 : 모평균(130g)은 표본평균(128.451g)보다 작다
< 검정통계량으로 표본 평균을 사용할 경우 - 검정통계량과 임계값으로 가설검정 >
1. 표본 평균을 구함
1) 무게를 배열로 가져온다
np의 array는 수치계산에 강점을 지닌 다차원 배열!
df = pd.read_csv('data/ch11_potato.csv')
sample = np.array(df['무게'])
sample
2) 표본평균을 구한다
s_mean = np.mean(sample)
s_mean
2. 임계값 구함
1) 확률 변수 구함
(* 확률변수는 확률적인 변수로 보는 것, 확률을 가지는 변수)
모분산이 9임을 알고 있다고 전제 , 표본은 14개
- norm(평균, 표준편차)
- 표준편차는 분산을 제곱근한 것
2) 임계값 구함
유의수준을 5%로 설정
.isf() : 생존함수의 역함수
rv = stats.norm(130, np.sqrt(9/14))
rv.isf(0.95)
결론: 표본평균(128.451g)은 임계값(128.681g)보다 작기 때문에, 귀무가설을 기각한다
< 검정통계량을 구하여 가설검정 - 검정통계량과 임계값으로 가설검정 >
1. 검정통계량 구함
(포본평균 - 모평균) / 표준편차
z = (s_mean - 130) / np.sqrt(9/14)
z
2. 검정통계량에 관한 임계값 구함
isf : 생존함수의 역함수
표준 정규분포를 따르고 있어서 stats.norm() 안에 생략해도 됨
표준정규분포 : 평균이 0, 표준편차가 1
rv = stats.norm()
rv.isf(0.95)
결론: 검정통계량이 (-1.932) 임계값(-1.645)보다 작기때문에, 귀무가설을 기각한다.
< P값을 사용한 가설검정>
검정통계량으로부터 p값을 구함
cdf : 누적분포함수 (주어진 확률변수가 특정 값보다 작거나 같은 확률)
rv = stats.norm()
z = (s_mean - 130) / np.sqrt(9/14)
rv.cdf(z)
결론 : p 값은 0.027로 유의수준 (0.05)보다 작기 때문에, 귀무가설을 기각한다.
양측검정
- 귀무가설 : 모평균(130g)과 표본평균(128.451g)은 같다
- 대립가설 : 모평균(130g)과 표본평균(128.451g)은 같지않다
양측검정은 어느 쪽으로 방향을 정하지 않고 가설을 세우는 것
< 검정통계량을 구하여 가설검정 검정통계량과 임계값으로 가설검정 >
1. 검정통계량 구하기
z = (s_mean - 130) / np.sqrt(9/14)
z
2. 임계값 구하기
신뢰구간 95%
rv = stats.norm()
rv.interval(0.95)
결론 : 검정통계량이 채택역 사이에 들어가 있기 때문에, 양측검정에서는 귀무가설이 채택
< P값을 사용한 가설검정>
양측검정의 p값을 구할 때는 양쪽 면적을 고려할 필요가 있으므로 누적밀도함수의 값을 2배로 함
z = (s_mean - 130) / np.sqrt(9/14)
rv = stats.norm()
rv.cdf(z) * 2
결론 : p 값은 0.053로 유의수준 (0.05)보다 크기 때문에, 귀무가설을 채택한다
728x90
'Python > 통계' 카테고리의 다른 글
카이제곱 독립성검정 예시 (0) | 2024.01.14 |
---|---|
단순회귀분석 예시 (0) | 2024.01.14 |
비모수검정 - 윌콕슨의 부호순위검정 (0) | 2024.01.13 |
대응비교 t 검정, 독립비교 t 검정 stats.ttest_1samp, stats.ttest_rel, stats.ttest_ind (0) | 2024.01.13 |
통계 개념 정리 (1) | 2024.01.10 |