귀무 가설 대립 가설 | [손으로 푸는 통계] #21. 귀무가설과 대립가설 10922 투표 이 답변

당신은 주제를 찾고 있습니까 “귀무 가설 대립 가설 – [손으로 푸는 통계] #21. 귀무가설과 대립가설“? 다음 카테고리의 웹사이트 you.charoenmotorcycles.com 에서 귀하의 모든 질문에 답변해 드립니다: https://you.charoenmotorcycles.com/blog. 바로 아래에서 답을 찾을 수 있습니다. 작성자 통계의 본질 EOStatistics 이(가) 작성한 기사에는 조회수 30,924회 및 좋아요 253개 개의 좋아요가 있습니다.

연구는 검증해야 할 가설을 필요로 하는데, 일반적으로 연구에서 검증하는 가설을 귀무가설이라 하고, 귀무가설과 반대되는 가설을 대립가설이라고 한다. 대립가설은 연구자가 연구를 통해 입증되기를 기대하는 예상이나 주장하는 내용이다.

Table of Contents

귀무 가설 대립 가설 주제에 대한 동영상 보기

여기에서 이 주제에 대한 비디오를 시청하십시오. 주의 깊게 살펴보고 읽고 있는 내용에 대한 피드백을 제공하세요!

아래 동영상 보기

d여기에서 [손으로 푸는 통계] #21. 귀무가설과 대립가설 – 귀무 가설 대립 가설 주제에 대한 세부정보를 참조하세요

아래 링크에 강의 내용이 정리되어 있습니다 .
http://hsm-edu.tistory.com/129
#통계강의 #통계

귀무 가설 대립 가설 주제에 대한 자세한 내용은 여기를 참조하세요.

[개념 통계 18] 귀무가설과 대립가설이란 무엇인가?

쉽게 설명하면 “귀무가설이 틀렸다고 판단했을 때 (기각 되었을 때), 대안적으로 선택하는 (채택되는) 가설”을 말합니다. 앞서 귀무가설을 설명할 때 든 …

+ 여기에 자세히 보기

Source: drhongdatanote.tistory.com

Date Published: 9/24/2021

귀무가설 – 인코덤, 생물정보 전문위키

대립가설은 귀무가설과 반대되는 의미로, 가설을 만든 사람이 실제로 주장하거나 증명하고 싶은 내용을 담고 있다. 예를 들어 ‘지구는 둥글다’라는 가설을 …

+ 여기에 자세히 보기

Source: www.incodom.kr

Date Published: 6/10/2022

실패를 기도하는 이론 – 귀무가설과 대립가설

귀무가설을 이용한 검증 방식을 비유하자면 “무죄 추정의 원칙”과 같다고 할 수 있다. 무죄 추정의 원칙을 따르면 용의자나 피고인은 유죄로 판결이 확정( …

+ 여기에 자세히 보기

Source: angeloyeo.github.io

Date Published: 4/25/2022

귀무가설, 대립가설의 의미와 예시 – velog

귀무가설 (Null Hypothesis) … 귀무가설은 새로울 게 없다 인 가설이다. 다른 말로 귀무가설은 부정적 , 소극적 , 보수적 , 전통적 인 입장이며, 우리가 …

+ 더 읽기

Source: velog.io

Date Published: 6/15/2021

[기초 통계학] 귀무가설 VS. 대립가설 비교! – 네이버 블로그

귀무 가설은 모집단의 파라미터, 예를 들어 평균, 표준편차 등이 가정된 값과 같다는 것이다. 귀무 가설은 종종 초기의 주장으로, 이전 분석이나, 특화된 …

+ 자세한 내용은 여기를 클릭하십시오

Source: m.blog.naver.com

Date Published: 11/13/2022

귀무가설 대립가설 개념 쉽게 이해하기 – 모던매뉴얼

귀무가설 대립가설 정의 … 귀무가설은 모집단에 대해 사실이라고 알려진 특성치에 대한 정보이다. 예를 들어 ‘1번 버스의 배차간격은 평균 10분이다.’라는 …

+ 여기에 보기

Source: modern-manual.tistory.com

Date Published: 12/18/2021

[논문] 귀무가설, 대립가설 이란? – 팡귄랜드 – Tistory

귀무가설 : 연구에서 검증해야하는 가설 (H0, 영가설, null hypothesis). 기본적으로는 참으로 추정하며 이를 거부하기 위해서는 증거가 필요함. 모집단의 …

+ 여기를 클릭

Source: pangguinland.tistory.com

Date Published: 2/1/2021

[통계, 처음입니다] 가설검정 (귀무가설과 대립가설, p-value)

저는 이제 이 가설을 검정해보려고해요. 여기서 우리는 ‘사람들은 대중교통비에 15만원을 쓴다’라는 가설을 ‘귀무가설’이라고합니다. 말이 어렵죠?

+ 더 읽기

Source: exupery-1.tistory.com

Date Published: 9/11/2021

주제와 관련된 이미지 귀무 가설 대립 가설

주제와 관련된 더 많은 사진을 참조하십시오 [손으로 푸는 통계] #21. 귀무가설과 대립가설. 댓글에서 더 많은 관련 이미지를 보거나 필요한 경우 더 많은 관련 기사를 볼 수 있습니다.

주제에 대한 기사 평가 귀무 가설 대립 가설

Author: 통계의 본질 EOStatistics
Views: 조회수 30,924회
Likes: 좋아요 253개
Date Published: 2018. 5. 11.
Video Url link: https://www.youtube.com/watch?v=h3hnXOz26U8

위키백과, 우리 모두의 백과사전

귀무 가설(歸無假說, 영어: null hypothesis, 기호 H 0 ) 또는 영 가설(零假說)은 통계학에서 처음부터 버릴 것을 예상하는 가설이다. 차이가 없거나 의미있는 차이가 없는 경우의 가설이며 이것이 맞거나 맞지 않다는 통계학적 증거를 통해 증명하려는 가설이다. 예를 들어 범죄 사건에서 용의자가 있을 때 형사는 이 용의자가 범죄를 저질렀다는 추정인 대립가설을 세우게 된다.[1] 이때 귀무가설은 용의자는 무죄라는 가설이다.[1] 통계적인 방법으로 가설검정(hypothesis test)을 시도할 때 쓰인다.[2] 로널드 피셔가 1966년에 정의하였다.[3]
예 [ 편집 ]
기본적으로는 참으로 추정되며 이를 거부하기 위해서는 증거가 꼭 필요하다. 예를 들어 남학생과 여학생들의 두 성적 샘플을 비교해 볼 때, 귀무가설은 남학생들의 평균이 여학생들의 평균과 같은 것이라는 것이다.

H 0 : μ 1 = μ 2

여기서:

H 0 = 귀무가설 μ 1 = 집단1의 평균 μ 2 = 집단2의 평균

또한 귀무가설이 같은 집단으로부터 뽑힌 두 샘플들이라고 가정하고 그래서 평균과 더불어 분산과 분포는 같다고 가정한다. 이러한 귀무가설의 설정은 통계적 유의성을 시험하는 데 중요한 단계이다. 이러한 가설을 형성하고 얻어진 데이터에서 확률적 검정을 해봄으로써 귀무가설이 예측하는 것이 맞는지 아닌지를 알아 볼 수 있다. 또한 만약 이것이 참이라면 여기서 얻어진 확률은 결과의 유의수준으로 부른다.

귀무가설과 대립가설 [ 편집 ]
이 부분의 본문은 이 부분의 본문은 대립가설 입니다.

연구는 검증해야 할 가설을 필요로 하는데, 일반적으로 연구에서 검증하는 가설을 귀무가설이라 하고, 귀무가설과 반대되는 가설을 대립가설이라고 한다.[4] 대립가설은 연구자가 연구를 통해 입증되기를 기대하는 예상이나 주장하는 내용이다.[4]
1. 귀무가설을 만들고 (기호는 H 0 )

– 남성과 여성의 보수는 같다.

2. 대립가설을 만든다. (기호 H a 또는 H 1 )

– 남성은 여성보다 보수가 더 많다.

3. 검정 통계를 만들고 측정한다.

검정 통계는 랜덤 값이다.

4. 의사결정을 한다.

H 1 에 대한 증거가 충분하다면 H 0 를 기각하고 H 1 을 받아들인다.

에 대한 증거가 충분하다면 를 기각하고 을 받아들인다. H 1 에 대한 증거가 불충분한 경우 H 0 를 기각하지 않는다.

(재판을 예로 들 수 있다.)

오류 [ 편집 ]
이 부분의 본문은 이 부분의 본문은 1종 오류와 2종 오류 입니다.

– 1종오류 : 가설이 참이어도 기각하는 경우(귀무가설을 기각하는 경우)[5] – 2종오류 : 가설이 거짓이어도 기각하지 않는 경우(귀무가설은 기각하지 않는 경우)[5]
외부 링크 [ 편집 ]
각주 [ 편집 ]

[개념 통계 18] 귀무가설과 대립가설이란 무엇인가?

안녕하세요 홍박사입니다. 이번 포스팅에서는 통계적 가설검정에 대해서 다루어 볼 겁니다. 우선 가설을 어떻게 정의할 수 있을까요? [진실이라고 확증할 수는 없지만 “아마도 그럴 것이다.” 라는 잠정적인 주장]을 가설이라고 말할 수 있을 것 같습니다. 연구자들은 연구하고자 하는 대상이 나타내는 현상을 관찰한 후에, 그 현상을 설명하는 가설을 설정합니다. 그리고 그 가설(Hypothesis)을 통계적인 방식으로 검정(Testing)합니다. 우리는 이를 통계적 가설검정(Hypothesis testing)이라고 부릅니다.

우리가 일반적으로 생각하는 가설은 아마 다음과 같은 것이 아닐까요. “지구는 둥글 것이다.” 또는 “태양이 지구를 돌 것이다.” 하지만 통계적 가설 검정은 어떠한 큰 이론을 제안하는 가설이 아닙니다. 통계에서 쓰이는 가설은 우리가 알고싶어하는 “어떤 모집단의 모수(예: 평균, 분산, 등)에 대한 잠정적인 주장”입니다. 따라서 통계적 가설은 앞서 예를 든 가설들과는 다르게 일정한 형식을 따라야 합니다.

그 형식이 바로 “귀무가설 (Null hypothesis: H0)”과 “대립가설 (Alternative hypothesis: H1)”입니다. 통계적 가설 검정을 하려면 우선 두 가지 형식적 가설 (귀무가설”과 “대립가설)을 설정해야 합니다. 그리고 어떤 가설을 채택을 할지를 확률적으로 따져보고 둘 중 하나를 채택합니다. 그러면 귀무가설은 무엇이고 대립가설은 또 무엇인지 살펴봅시다.

귀무가설 (또는 영가설이라고 부르기도 합니다.)의 정의를 찾아보면 “모집단의 특성에 대해 옳다고 제안하는 잠정적인 주장”이라고 나옵니다. 무슨 말인지 감이 잘 오지 않습니다. 쉽게 풀어보겠습니다. 귀무가설은 “모집단의 모수는 OO와 같다.” 또는 “모집단의 모수는 OO와 차이가 없다.”라고 가정하는 것을 말합니다. 조금 더 구체적인 예를 들어보겠습니다. 1) 만약 전국 20세 이상의 평균 키가 170cm라는 주장을 통계적으로 검정한다면, 이에 대한 귀무 가설은 “20세 이상의 성인 남자의 평균 키는 170cm과 같다. (또는 차이가 없다.)”가 될 것입니다. 2) 또 제약 회사에서 개발한 신약의 효과를 검정한다면, 귀무가설은 “개발한 신약은 효과가 없다. (또는 차이가 없다).”가 됩니다. 즉 귀무가설은 “~와 차이가 없다.” “~의 효과는 없다.” “~와 같다.”라는 형식으로 설정된다는 것을 알 수 있습니다.

대립가설 (또는 대안가설이라고 부르기도 합니다.)은 “귀무가설이 거짓이라면 대안적으로 참이 되는 가설”입니다. 쉽게 설명하면 “귀무가설이 틀렸다고 판단했을 때 (기각 되었을 때), 대안적으로 선택하는 (채택되는) 가설”을 말합니다. 앞서 귀무가설을 설명할 때 든 예로 다시 설명드리면, 대립가설은 “모집단의 모수는 OO와 다르다.” 또는 “모집단의 모수는 OO와 차이가 있다.”라고 가정하는 것을 말합니다. 1) 만약 전국 20세 이상의 평균 키가 170cm라는 주장에 대한 대립가설은 “20세 이상의 성인 남자의 평균 키는 170cm와 다르다. (또는 차이가 있다.)”가 될 것이고, 2) 제약 회사에서 개발한 신약의 효과 검정에 대한 대립가설은 “개발한 신약은 효과가 있다. (또는 차이가 있다).”가 됩니다. 즉 대립가설은 “~와 차이가 있다.” “~의 효과는 있다.” “~와 다르다.”라는 형식으로 이루어집니다.

자. 이렇게 두 가지 가설을 세웠다면, 우리가 수집한 표본 데이를 바탕으로 귀무가설이 옳은지 (채택, Accept) 아니면 옳다고 볼 수 없는지 (기각, Reject)를 판단해야 합니다. 이를 귀무가설의 유의성 검정 (Null Hypothesis Significance Testing, NHST)이라고 합니다. 우리는 표본을 추출하고 그 표본으로부터 얻은 정보를 기초로 하여 귀무가설이 참인지 거짓인지를 판정하게 됩니다. 따라서 항상 오류의 가능성이 존재합니다. 표본을 추출할 때마다 매번 통계치가 달라지기 때문입니다. 따라서 연구자는 귀무가설이 참인지 아니면 거짓인지를 검증하기 위해 수집한 표본을 바탕으로 “귀무가설이 참이라고 가정했을 때, 표본으로 부터 얻어지는 통계치 (예: 표본 평균)가 나타날(관측될) 확률”을 계산합니다. 이때 계산된 확률값을 p값이라고 합니다.

중심극한 정리에서 설명드린 것처럼, 모집단 분포에 상관없이, 표본의 수가 커지게 되면, 표본들의 평균들이 이루는 분포(표본평균분포)는 <모집단의 평균 μ 그리고 표준편차가σ/√n인 정규분포>에 가까워진다고 말씀드렸습니다. (중심극한정리에 대한 자세한 내용은 다음 링크 [통계 노트/통계 개념 정리] – [개념 통계] 중심극한 정리는 무엇이고 왜 중요한가? 에서 확인해 주십시오.) 우리가 이 표본평균분포를 안다면, 표본을 추출해서 얻어진 표본 평균이 표본평균분포 하에서 나타날 확률이 어느정도인가를 계산할 수 있습니다.

다시 p값으로 돌아가 봅시다. p값이 낮다는 것은 무엇을 말할까요? p값이 낮다는 것은 우리가 귀무가설이 참이라는 가정 하에서 표본을 추출했을 때, 이런 표본 평균이 관측될 확률이 낮다는 것을 뜻합니다. 즉 p 값이 매우 낮으면, 이러한 표본 통계량은 우연히 나타나기 어려운 케이스이기 때문에, 우리는 귀무가설을 채택하지 않고(기각하고), 대안적인 가설, 즉 대립가설을 채택하게 됩니다. 이에 대한 자세한 내용은 다음 포스팅에서 다루도록 하겠습니다.

도움이 되셨다면 공감하트를 꾹 눌러주세요~!

인코덤, 생물정보 전문위키

Structured data Category Statistics

통계학의 궁극적인 목표는 기존 주장이 맞는지 아니면 새로운 연구 또는 실험으로 발견된 주장이 맞는지 검정하는 것이다. 그래서 최종적으로 귀무가설을 채택하거나 기각, 또는 대립가설을 채택하거나 기각하는 선택을 하는 것이다. (가설이란 **어떤 사실을 설명하거나 증명하기 위해서 설정한 가정을 의미)

예를 들어 ‘A 유전자가 위암을 유발한다.’ 라는 가설을 입증할 때 ‘A 유전자는 위암을 유발하지 않는다.’ 라는 가설을 설정한다. 이는 ‘A 유전자는 위암을 유발하지 않는다.’ 라는 가설이 틀렸다는 사실을 통해서 ‘A 유전자가 위암을 유발한다.’ 는 가설이 성립되는 것을 증명하는 것이다.

즉, 귀무가설(null hypothesis)은 우리가 증명하고자 하는 가설의 반대되는 가설, 효과와 차이가 없는 가설을 의미하며 우리가 증명 또는 입증하고자 하는 가설, 효과와 차이가 있는 가설을 대립가설이라고 한다.

귀무가설의 의미 #

귀무가설(歸無假說 : Null hypothesis)은 1900년대 중반 영국의 통계/유전학자인 로널드 피셔에 의해 정의된 통계용어로, 처음부터 맞지 않을 것으로 예상하고 세우는 가설이다. 기본적인 의미만 봤을 때 그 쓰임새가 쉽게 와닿지 않을 수 있는 이 귀무가설의 역할은, 어떠한 가설을 주장하고자 하는 사람이 본래의 가설이 옳다는 것을 통계적으로 증명하기 위한 것이다. 본래 자신이 주장하고자 하는 내용과 정반대의 가설(귀무가설)을 세우고 이 가설을 검증하여 잘못된 것임을 밝혀내 본래의 가설이 옳다는 것을 주장하는 방식으로, 오늘날에도 수학이나 통계는 물론 각종 과학분야나 산업계에서 가설 검증을 위해 널리 활용되고 있다.

대립가설과 귀무가설 #

대립가설은 귀무가설과 반대되는 의미로, 가설을 만든 사람이 실제로 주장하거나 증명하고 싶은 내용을 담고 있다. 예를 들어 ‘지구는 둥글다’라는 가설을 검증하고자 할 경우에 ‘지구는 둥글지 않다’라는 가설이 귀무가설이 되고 이에 반대되는 본래의 가설 ’지구는 둥글다’는 대립가설이 된다. 이 예시에서는 지구가 둥글지 않다는 대립가설이 잘못되었음을 증명하여 대립가설인 지구는 둥글다는 것이 맞다고 주장하고자 하는 것이다. 실제로 귀무가설은 통계적인 분석 과정에서 많이 활용되기 때문에 ‘지구는 둥글다’식의 단순 명제보다는 통계값간의 관계에 대한 가설로 많이 설정된다. 예를 들면 발암물질을 발생시키는 공장 주변 지역의 암 발생률이 높은 원인을 분석하는 연구 과정에서, 암을 발생시키는 요인(공장)과 암 발병률과의 상관관계를 따지기 위해 ‘공장의 발암물질은 암 발병률에 영향을 미치지 않았다’라는 귀무가설을 만들고 이에 대한 대립가설로 본래의 가설인 ‘공장의 발암물질은 암 발병률에 영향을 주었다’를 설정하는 식이다. 분석과정에서 귀무가설(공장의 발암물질과 암 발병 관계없음)이 잘못되었음을 증명하면 연구에서 예측했던 결과에 도달하는 것이 된다.

유의성 검정과 유의확률 #

유의성 검정(Null Hypothesis Significance Testing(NHST))은 앞서 구성한 두 개의 가설 중 어느 쪽이 참인지를 판단하기 위해 진행하는 검증 과정이다. 그런데 통계적인 분석에서는 모든 현상이나 대상에 대한 정보를 바탕으로 검증을 하기는 어렵기 때문에 표본을 추출하여 검증을 거치게 된다. 이렇게 추출한 표본을 바탕으로 검증을 실시하는 과정을 유의성 검증이라고 하고, 귀무가설이 맞다고 가정했을 때 표본에서 실제 통계치와 같거나 더 극단적인 통계치가 나올 확률이다. 간단하게 표현하면 귀무가설을 참으로 볼 수 있는 확률) 유의확률은 보통 p-value로 표현하며, 많은 연구에서 p-value가 0.05이하이면 이 귀무가설을 옳지 않은 것으로 본다(‘귀무가설을 기각’한다고 표현함). p-value가 0.05 미만이라면, 이 통계치에서 귀무가설을 참으로 봤을 때 표본에서 실제로 해당되는 통계치가 나올 가능성은 5% 미만이라는 의미가 된다. 즉 해당 통계치는 95%의 확률로 대립가설이 참이 될 가능성이 훨씬 더 높은 것이라고 할 수 있다.

유의확률(p-value)이 활용된 실제 연구 사례(예시) #

귀무가설과 유의확률은 생물체 연구나 약물의 효능 연구에서 가설 검증 시 거의 필수적으로 사용되고 있는데, 간략하게 그러한 사례 중 하나를 살펴보겠다. 아래는 봉독 추출물(꿀벌의 독낭에 들어있는 봉독을 추출가공한 물질)이 피부 노화에 미치는 영향에 대한 연구결과에 포함된 실험결과이다. (봉독이 피부 노화에 미치는 영향(경희대 한의대 연구팀)) 이 연구에서 연구자들은 봉독이 피부노화를 억제하는 역할을 할 것이라는 가설을 설정하고 실험을 통해 이를 검증하는 과정을 거쳤다. 실험결과를 분석할 때 실험 통계치로부터 나온 유의확률의 값에 따라서 가설이 유효한지를 확인하였다. 아무것도 주입하지 않은 대조군(Control)보다 봉독을 주입한 실험군(Syringe)에서 p-value 0.037로 훨씬 더 작은 값이 나온 것으로 보아 해당 실험은 유의한 것으로 볼 수 있었다.

Incoming Links #

Related Data Sciences (DataScience 0) #

Related Articles (Article 1) #

Related Bioinformaticses (Bioinformatics 2) #

Suggested Pages #

실패를 기도하는 이론

분야를 막론하고 새로운 것을 공부하다보면 맞닥뜨리는 어려움 중 하나는 용어이다.

그래서 용어에 대해 친숙해지고 나서야 비로소 해당 분야에 대해서 공부가 풀려가기 시작하는 경우도 많다.

통계학에서 처음 접하는 용어 중 어려운 것들을 꼽으라면 가설에 관한 것이다.

귀무가설, 대립가설이 대표적인데, 한자 용어라 어려운가 싶어서 영문으로 봐도 전혀 도움이 되지 않는 아주 불친절한 용어들이다 (각각은 null hypothesis, alternative hypothesis로 번역할 수 있다).

필자의 경우 대학원에 들어가서야 통계학을 독학으로 공부했는데 이 용어들에 익숙해지는데까지 1년 넘는 시간이 걸렸던 것 같다.

이번 article에서는 해당 가설과 관련된 용어들을 짚어보면서 어떤 의미를 갖고 있고 어떤 이유로 이런 개념들이 필요한지 알아보도록 하자.

귀무가설과 대립가설

우리는 연구/개발을 통해 새로운 사실을 발견했다는 사실을 입증하고자 한다.

이 때, 귀무가설과 대립가설이 사용되는데,귀무가설과 대립가설은 각각 ‘새로울 게 없다’는 가설과 ‘새로운 것이 있다’는 가설로 생각할 수 있다.

가령, 귀무가설과 대립가설은 다음과 같은 것이다.

예) 흡연 여부가 뇌 질환 발생 증가에 영향을 미치는지 연구한다고 하면,

귀무가설: 흡연 여부는 뇌혈관 질환의 발생에 영향을 미치지 않는다.

대립가설: 흡연 여부는 뇌혈관 질환의 발생에 영향을 미친다.

그런데, 상식적인 수준에서 생각했을 때 쉽게 이해되지 않는 것이 하나 있다.

“새로울 것이 있다”는 가설인 대립가설만 사용하면 될 것을

왜 굳이 “귀무가설”이라는 불필요해 보이는 개념을 추가로 도입하는 것일까?

귀무가설을 굳이 도입하는 이유는 여러가지가 있을 수 있겠지만, 대략 세 가지 정도로 추릴 수 있을 것 같다.

참이 아님을 증명하는 것이 참임을 증명하는 것보다 훨씬 쉽기 때문이다. 귀무가설을 “올바르게” 서술하는 것이 대립가설을 “정확하게” 서술하는 것 보다 실패할 가능성이 적다. 우리는 모수에 대해서 알 수 없으며, 연구에 있어 주관성이 개입되어선 안되기 때문이다. 이러한 관점에 있어서 대척점에 서계신 분들이 바로 베이지안 통계학자들이다

이러한 여러가지 이유에 따라 전통적인 통계학에서는 귀무가설을 검증하는 데 실패함으로써 간접적으로 새로운 가설에 대해 확인하고자 한다. 이러한 방법은 귀류법과 궤를 같이한다고 봐도 좋을 것 같다.

귀류법은 어떤 명제를 간접적으로 증명하는 방법이다. 어떤 명제가 참이라고 직접 증명하기 어려우므로 그 부정이 참이라고 가정한 뒤 증명을 해나가다가 모순을 발견하고 이를 통해 해당 명제를 증명한다.

다시 말해, 조사나 연구에서 어떤 변화가 있다는 가설을 검증하고자 한다면 역으로 가설이 없다고 가정한 뒤 실험을 진행한다.

그런 다음 변화가 없다는 가설에 모순이 있다는 것을 발견하게 될 수만 있다면 이것을 근거로 변화가 있다는 사실을 간접적으로 증명할 수 있게 되는 것이다.

따라서, 귀무가설을 이용한 가설검증 과정을 다시 정리하면 다음과 같다.

그림 1. 귀무가설을 이용한 가설 검증 프로세스

귀무가설을 이용한 검증 방식을 비유하자면 “무죄 추정의 원칙”과 같다고 할 수 있다. 무죄 추정의 원칙을 따르면 용의자나 피고인은 유죄로 판결이 확정(귀무가설이 기각된 상태)되기 전 까지는 무죄로 추정한다(귀무가설이 기각되지 않은 상태)는 원칙이다.

이 때, 유죄로 판결하기 위해선 피고인이 실제로 무죄라고 가정했을 때 발생할 수 없는 증거나 상황(통계학적으로 유의한 수준)이 뒷받침 되어야 한다.

귀무가설/대립가설에 대한 주의점

귀무가설/대립가설에 대해 주의할 핵심 내용 중 하나는 귀무가설을 기각할 수 있게 되었다고 해서 대립가설을 증명한 것이 아니라는 점이다.

다시 말해 귀무가설 검증 과정은 오로지 “(검증) 실패”에만 주안점을 두는 과정인 것이다.

이 부분은 연구분야에서 굉장히 중요한 이슈이기도 한데, 이에 대해서는 p-value에 대해 다룰 때 좀 더 자세히 다루도록 하자.

그렇다면, 가설 검증 시에는 귀무가설만 이용해야할까?

그렇지 않다.

가설 검증 시 어떤 이유로 대립가설을 사용할 수 없어서 귀무가설 만을 이용할 수 있다고 생각할 수도 있는데 이는 사실이 아니다.

대립 가설을 간접적으로 이용한 통계적 추론 방법이 있는데, 이 방법이 바로 신뢰구간을 이용한 검정이다. 이에 대해선 추후에 다루도록 하겠다.

또, 아직은 멀게 느껴지긴 하지만 대립 가설을 직접적으로 이용하기 위해 통계 모델을 제안하는 방법이 있는데 베이즈 추론 방법을 이용하면 대립가설을 직접 이용하여 검정할 수도 있다.

참고문헌

[기초 통계학] 귀무가설 VS. 대립가설 비교!

귀무(Null) 가설과 대립(Alternative) 가설은 모집단에 대한 두 개의 상호 배타적인 진술이다. 귀무가설 감정은 샘플 데이터를 사용하여 귀무 가설을 기각할 것인지 아닌지를 판별한다.

귀무 가설(H0):

귀무 가설은 모집단의 파라미터, 예를 들어 평균, 표준편차 등이 가정된 값과 같다는 것이다. 귀무 가설은 종종 초기의 주장으로, 이전 분석이나, 특화된 지식에 기초하여 정해진다.

대립 가설(H1):

대립 가설은 모집단의 파라미터가 귀무가설에서 가정된 값과 다르거나, 크거나, 작은지에 대한 진술이다. 대립 가설은 분석자가 진실로 믿고 싶거나, 진실로 판명되길 소원하는 것이다.

귀무가설 대립가설 개념 쉽게 이해하기

728×90

반응형

가설검정은 모집단에 대해 알려진 정보(귀무가설)에 대해 나의 표본을 통해 정보가 맞지 않다고 주장(대립 가설) 하기 위한 방법이다. 이를 쉽게 이해하기 위해 다음 내용들을 하나씩 살펴보자.

귀무가설 대립가설 정의

귀무가설은 모집단에 대해 사실이라고 알려진 특성치에 대한 정보이다. 예를 들어 ‘1번 버스의 배차간격은 평균 10분이다.’라는 안내문구가 귀무가설이 될 수 있다.

대립가설은 모집단으로부터 추출된 표본자료를 통해 귀무가설과 대치됨을 입증하고자 하는 가설을 의미한다. 예를 들어 하루 동안 1번 버스의 배차 간격을 측정한 나의 표본에 의해 ‘1번 버스의 배차 간격은 평균 10분보다 크다.’가 대립 가설이 될 수 있다.

가설검정은 무죄추정의 원칙에 빗대어 생각해볼 수 있다. 유죄라는 강력한 증거가 나오지 않는 이상 유죄로 판정할 수 없는 것처럼, 귀무가설에 반하는 강력한 검정 결과가 나오지 않으면 귀무가설이 틀렸다고 기각할 수 없다.

가설 유형

가설의 유형에는 3가지가 있다. 모집단의 모평균에 대한 가설을 검정하고자 할 때 귀무가설은 다음과 같이 둘 수 있다.

$H_0 : \mu = \mu_0$

대립가설은 다음과 같이 나눌 수 있다.

왼 꼬리 검정(단측검정) $H_1 : \mu < \mu_0$ 오른 꼬리 검정(단측검정) $H_1 : \mu > \mu_0$ 양쪽 꼬리 검정(양측검정) $H_1 : \mu

eq \mu_0$

버스 배차간격 예시를 표현하면 귀무가설 $H_0 : \mu = 10$, 대립 가설 $H_1 : \mu > 10$ 와 같다.

검정 통계량

가설이 잘 정리되었다면 다음 순서로 확인해야 할 것은 검정 통계량이다. 표본으로부터 계산된 통계량(버스 예시에서는 표본 평균)이 가설 검정에 활용될 때에 검정 통계량이라고 부른다.

검정 통계량의 표본 분포는 다음과 같다.

$\bar{X} \sim N[\mu, \frac{\sigma^2}{n}]$

검정 통계량인 표본 평균을 정규화하면 추후 표준 정규분포를 사용하여 확률 값을 쉽게 구할 수 있다.

$Z = \frac{\bar{X}-\mu}{\sigma/\sqrt{n}}\sim N[0,1]$

가설검정은 귀무가설이 사실이라는 가정에서부터 시작한다. 여기서 만약 귀무가설 $H_0 : \mu = \mu_0$ 가 사실이라면 다음 식이 사실이어야 한다.

$Z = \frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}}\sim N[0,1]$

이때, 표본자료로부터 계산된 검정 통계량($\bar {X}$)을 위와 같이 정규화한 값을 $z_0$이라고 하자. 이 $z_0$가 표준 정규 $N[0,1]$에서 나올 확률이 희박하다면 귀무가설을 기각할 확률이 높아진다.

Standardization

유의 확률 (p-value)

검정 통계량의 관찰 값 $z_0$가 표준정규에서 나왔을 확률이 희박하다고 결론 짓기 위해서는 얼마나 극단적인 값이 관찰되어야 하는지 정의할 필요가 있다. 귀무가설 하의 분포에서 검정통계량의 관찰값 $z_0$보다 더 극단적인 값이 관찰될 확률을 유의 확률이라고 한다. 다음과 같이 가설 유형에 따라 p-value를 구하는 구간은 달라진다.

왼 꼬리 검정(단측 검정) p-value = $P[Z > z_0]$ 오른 꼬리 검정(단측검정) p-value = $P[Z < z_0]$ 양쪽 꼬리 검정(양측 검정) p-value = $min(P[Z > z_0], P[Z < z_0]) \times 2$ 버스 배차시간 예시에서 $z_0$가 1.5로 주어진다면 왼 꼬리 검정에 따라 p-value = $P[Z > 1.5]$임을 알 수 있다. 이렇게 유의 확률 값이 작을수록 해당 표본은 귀무가설이 사실인 모집단의 표본으로 보기 어렵기에 대립 가설을 더욱 지지하게 된다.

유의 수준(Significance level) 100$\alpha$ 검정법

유의 수준은 가설검정에서 발생할 수 있는 제 1종 오류의 최대허용한계이다. 제 1종 오류는 귀무가설을 기각하는 결론을 내렸지만 실제 귀무가설이 사실인 오류를 의미한다. 즉, 우연히 표본들이 치우친 값을 가져 희소한 확률로 귀무가설이 사실임에도 이를 기각하는 오류를 범할 수 있다. 이러한 오류의 가능성을 허용하는 정도를 유의수준이라고 한다. 유의수준은 일반적으로 0.05, 0.01 값을 사용하여 각각 95%, 99%의 신뢰성을 추구한다.

앞서 구한 p-value를 사용하여 유의 수준과 비교한 뒤 귀무가설 기각 여부를 결정한다.

즉, $p-value \leq \alpha$ 인 경우 검정 통계량이 나타날 확률이 유의 수준보다 더 희소한 확률임을 보이기에 귀무가설을 기각한다.

버스 배차시간 예시에서 구한 p-value = $P[Z > 1.5] = 0.067$은 유의 수준 0.05에 비해 크기 때문에 귀무가설을 기각하지 못하는 결론이 나온다.

p-value, significance level

728×90

반응형

[논문] 귀무가설, 대립가설 이란?

반응형

귀무가설 / 대립가설(=대안가설, 연구가설)이 무엇인가요 ?

귀무가설 : 연구에서 검증해야하는 가설 (H0, 영가설, null hypothesis). 기본적으로는 참으로 추정하며 이를 거부하기 위해서는 증거가 필요함. 모집단의 특성에 대하여 옳다고 제안하는 주장임.

* 차이가 없다 / 효과가 없다 / 같다 / 영향을 주지 않는다. 등으로 주로 서술

대립가설 : 귀무가설과 반대되는 가설로 연구자가 입증되기를 기대하는, 예상하는 가설 (대안가설, H1, Ha, alternative hypothesis)

* 차이가 있다 / 효과가 있다 / 다르다 / 영향을 준다. 등으로 주로 서술

귀무가설 대립가설 용의자A는 무죄일 것이다. 용의자A가 범죄를 저질렀을 것이다. 흡연 여부가 뇌혈관 질환에 영향을 주지 않는다. 흡연 여부가 뇌혈관 질환에 영향을 준다. 남자와 여자의 보수는 같다. 남자가 여자보다 보수를 더 받는다.(같지 않다.) 새로 개발한 약품의 효과가 없다. 새로 개발한 약품의 효과가 있다. 남자와 여자의 평균 점수는 차이가 없다. 남자와 여자의 평균 점수는 차이가 있다.

귀무가설의 유의성 검정 (Null Hypothesis Significance Test, NHST)

귀무가설은 대립가설을 위한 것으로 “귀무가설이 거짓이니까 대안으로 참이 되는 가설, 대립가설을 채택한다.”를 이끌어내고자 함. 귀무가설을 검증하는 것을 실패하며 이를 통해 간접적으로 새로운 대립가설을 확인하는 것이 주요 목적임. 이는 귀류법과 같음. ( * 귀류법 : 어떤 명제A를 증명하기위해 “명제A가 거짓이다.”를 가정하고 증명하다가 모순을 발견하여 이를 통해 간접적으로 명제A가 참임을 증명하는 방법.)

그렇다면 귀무가설에 대하 우선 참, 거짓 여부를 알아야함!

즉 표본 데이터로 부터 귀무가설이 참이면 채택(Accept), 거짓이면 기각(Reject)으로 판단을 해야함.

(1) 귀무가설을 만들고, 대립가설을 만든다.

(2) 실험을 수행한다.

(3) 귀무가설이 거짓인 경우 – 귀무가설을 기각하고 그 대안인 대립가설을 채택한다.

귀무가설이 참인 경우 – 귀무가설을 채택한다.

용어 하나하나 차근차근 해야할 것이 산더미입니다..ㅠ

공부하면서 이해한 두 가설의 관계와 각 정의에 대하여 간단하게 정리해보았습니다.

추가로 더 깊이 알아보고 싶다면 아래 두 블로그 글을 강력 추천드립니다!

https://drhongdatanote.tistory.com/59

https://angeloyeo.github.io/2020/03/25/hypothesis.html

책 중에서는 [논문작성을 위한 SPSS 실전 통계분석 쉽게배우기] _ 유성모 저 이책의 설명이 제 머리에는 참 잘 들어오는 것 같습니다. (아직 아주 앞부분 겨우 읽은 것이지만요!..^-^;)

반응형

[통계, 처음입니다] 가설검정 (귀무가설과 대립가설, p-value)

728×90

반응형

통계적 가설검정 Statistical hypothesis test

귀무가설과 대립가설, p-value

통계적 가설 검정(統計的假說檢定, statistical hypothesis test)은 통계적 추측의 하나로서, 모집단 실제의 값이 얼마가 된다는 주장과 관련해, 표본의 정보를 사용해서 가설의 합당성 여부를 판정하는 과정을 의미한다. 간단히 가설 검정(假說檢定)이라고 부르는 경우가 많다. -위키백과 인용

다들 대중교통비에 얼마정도 쓸까요?

한달에 적어도 15만원은 쓰지 않을까요?

그래서 저는 가설을 하나 세웠습니다.

사람들은 대중교통비에 15만원을 쓴다!

귀무가설(H0) vs 대립가설(H1)

저는 이제 이 가설을 검정해보려고해요. 여기서 우리는 ‘사람들은 대중교통비에 15만원을 쓴다’라는 가설을 ‘귀무가설’이라고합니다. 말이 어렵죠? 한자로 歸無라고 하는데요 ‘없을 무’가 보이시죠? 없다는 뜻입니다. 영어로는 Null hypothesis입니다. Null, 없다는 뜻입니다. 귀무가설에서 ‘귀’자는 귀향길과 같은 돌아갈 귀 자를 쓰고있습니다. 없는 것으로 돌아간다는 것입니다. 뭐가 없을까요?

만약 모든사람들이 대중교통비에 20만원을 쓴다고하면 제 가설과 5만원이 차이가 나겠죠? 그럼 가설은 틀린게 되겠네요! 그렇다면 저의 가설대로 모든 사람이 대중교통비에 20만원을 쓴다면? 제 가설과 0원이 차이가 날 것입니다. 즉 차이가 없다. 차이가 0, 그래서 Null hypothesis, 귀무가설입니다.

그렇다면 상관관계에 대해서는 어떨까요? 예를들어 대중교통비를 15만원이상 쓰는 사람은 식비를 50만원이상 쓰는 사람일까요? 이런 상관관계에서는 연관성이 ‘없다’가 귀무가설입니다!

말그대로 대립가설은 제 가설과 되립되는 가설입니다. 사람들이 대중교통비에 15만원을 쓰지 않는다! 대중교통비를 15만원이상 쓰는 사람은 식비를 50만원이상 쓰는 사람이 아니다!그것이 대립가설입니다.

표본추출(Sampling)

가설을 검정하기 위해서는 정말 사람들에게 물어봐야할거에요. 물론 모든사람에게 물어보면 좋겠지만, 시간적, 공간적, 경제적인 여러 현실적인 이유들로 쉽지 않습니다. 그래서 표본을 가지고 검정을 진행합니다. 표본을 추출할 때는 여러 방법이 있습니다. 샘플링에 관해서는 제가 이전에 쓴 포스트를 읽으시면 도움이 될거라 생각합니다.

신뢰도 (Confidence level)

하지만 세상만사가 그렇듯이 모든 사람이 똑같지는 않겠죠? 그러면 어느정도되야 제 가설이 맞다고 인정받을 수 있을까요? 그래서 95%이거나 99%의 신뢰도를 사용하고있습니다. 100번을 다시 조사해도 95번, 99번은 똑같은 결과가 나올것이라는 의미입니다.

잘 이해가 안간다면 다음 통계청의 예를 보시면 훨씬 이해가 쉬울겁니다.

보통은 95%의 신뢰도를 사용한다.

예를 들어, ‘정치인 지지율 조사에서 A후보는 40%, B후보는 25%의 지지율을 얻었다. 신뢰수준 95%에서 표본오차는 3.1%포인트이다’란 말의 의미는 다음과 같다. 동일한 형태의 여론조사를 100번 실시했을 경우에 95번은 A후보가 40%에서 ±3.1% 인 36.9% ~ 43.1%, B후보는 25%에서 ±3.1% 인 21.9% ~ 28.1% 사이의 지지율을 얻을 것으로 기대된다는 의미이다.

ALPHA LEVEL

우리는 앞서 신뢰도를 95%이거나 99%로 정하기로 했습니다. 어떻게 95%임을 알 수 있을 까요? 우리는 이를 수치로 나타냅니다. 퍼센트로 나타내지말고 소수로 나타내볼까요? 1.00은 100%입니다. 95%는 0.95입니다.

알파는 100%에서 신뢰도를 뺀 값입니다. 1-0.95, 즉, 0.05입니다. 당연히 신뢰도를 어떻게 잡느냐에 따라 값이 달라지겠죠?

우리는 이제 기준이 생겼습니다. 알파를 기준으로 잡고 검정결과를 신뢰할 수 있는지 없는지 판단하게 될겁니다.

p-value(유의확률)

주변사람에게 물어봤습니다. (샘플링을 한 것입니다.)

교통비를 얼마쓰냐고 물어보니 1000만원이라고 답하네요!

그렇다면 제 가설이 틀린걸까요? 누가봐도 일반적인 값은 아닙니다. 이건 ‘우연히’ 발생한 일이죠.. 아주 우연히…

실제로는 99%가 식비로 50만원을 사용한다고해도

그럼 이런 상황도 숫자로 나타낼 수는 없을까요? 있습니다! 바로 p-value입니다.

예를 들어, 표본의 평균을 냈더니 25만원이었습니다. 여러 검정법중 하나를 골라서(검정법은 뒤에 포스팅합니다.) 통해서 계산해보니 p-value가 0.5라고하네요. 표본을 뽑았더니 그 표본의 평균이 우연히 10만원 더 비쌌을 확률이 50%라는 뜻입니다.

p – value가 의미하는건 probablitity value, ‘확률’입니다. 어떤 사건이 우연히 발생할 확률입니다.

p-value가 ALPHA LEVEL보다 작으면 귀무가설을 기각할 수 있기로 정했습니다. Alpha level은 0.05, 즉 우연히 발생할 확률이 5%보다 작으면 이 사건이 우연히 일어난게 아닐거라고 보는 것입니다.

말장난같죠? 쉽게말해서 0.05보다 작으면 이건 우연히 일어난일이 아니라는 것! 뭔가 의미가 있다는 것!

그래서 유의하다! 라고 합니다.

p-value가 중요한 이유

여러 가설검정을 하면 그 통계치가 나옵니다. T-test를 하면 평균이 얼마나 떨어져있는지에 대한 수치인 t-값이 나오고 chi제곱검정을 하면 카이제곱값이 나옵니다. 이를 알기쉽게 표준화 시켜주는 것입니다.

728×90

반응형

키워드에 대한 정보 귀무 가설 대립 가설

다음은 Bing에서 귀무 가설 대립 가설 주제에 대한 검색 결과입니다. 필요한 경우 더 읽을 수 있습니다.

이 기사는 인터넷의 다양한 출처에서 편집되었습니다. 이 기사가 유용했기를 바랍니다. 이 기사가 유용하다고 생각되면 공유하십시오. 매우 감사합니다!

사람들이 주제에 대해 자주 검색하는 키워드 [손으로 푸는 통계] #21. 귀무가설과 대립가설

통계
가설검정
귀무가설
대립가설
통계강의
통계 강의
통계영상
통계 영상
통계학강의
통계학 강의
통계 기초

[손으로 #푸는 #통계] # ##21. #귀무가설과 #대립가설

YouTube에서 귀무 가설 대립 가설 주제의 다른 동영상 보기

주제에 대한 기사를 시청해 주셔서 감사합니다 [손으로 푸는 통계] #21. 귀무가설과 대립가설 | 귀무 가설 대립 가설, 이 기사가 유용하다고 생각되면 공유하십시오, 매우 감사합니다.

귀무 가설 대립 가설 주제에 대한 동영상 보기

d여기에서 [손으로 푸는 통계] #21. 귀무가설과 대립가설 – 귀무 가설 대립 가설 주제에 대한 세부정보를 참조하세요

귀무 가설 대립 가설 주제에 대한 자세한 내용은 여기를 참조하세요.

[개념 통계 18] 귀무가설과 대립가설이란 무엇인가?

귀무가설 – 인코덤, 생물정보 전문위키

실패를 기도하는 이론 – 귀무가설과 대립가설

귀무가설, 대립가설의 의미와 예시 – velog

[기초 통계학] 귀무가설 VS. 대립가설 비교! – 네이버 블로그

귀무가설 대립가설 개념 쉽게 이해하기 – 모던매뉴얼

[논문] 귀무가설, 대립가설 이란? – 팡귄랜드 – Tistory

[통계, 처음입니다] 가설검정 (귀무가설과 대립가설, p-value)

주제와 관련된 이미지 귀무 가설 대립 가설

주제에 대한 기사 평가 귀무 가설 대립 가설

위키백과, 우리 모두의 백과사전

[개념 통계 18] 귀무가설과 대립가설이란 무엇인가?

인코덤, 생물정보 전문위키

실패를 기도하는 이론

[기초 통계학] 귀무가설 VS. 대립가설 비교!

귀무가설 대립가설 개념 쉽게 이해하기

[논문] 귀무가설, 대립가설 이란?

[통계, 처음입니다] 가설검정 (귀무가설과 대립가설, p-value)

키워드에 대한 정보 귀무 가설 대립 가설

사람들이 주제에 대해 자주 검색하는 키워드 [손으로 푸는 통계] #21. 귀무가설과 대립가설

Leave a Comment Cancel reply