당신은 주제를 찾고 있습니까 “반복 측정 분산 분석 – 7-1 Repeated Measure ANOVA (반복 측정 분산분석)이란?“? 다음 카테고리의 웹사이트 https://you.charoenmotorcycles.com 에서 귀하의 모든 질문에 답변해 드립니다: https://you.charoenmotorcycles.com/blog. 바로 아래에서 답을 찾을 수 있습니다. 작성자 Sapientia a Dei 이(가) 작성한 기사에는 조회수 10,811회 및 좋아요 121개 개의 좋아요가 있습니다.
반복 측정 분산 분석 주제에 대한 동영상 보기
여기에서 이 주제에 대한 비디오를 시청하십시오. 주의 깊게 살펴보고 읽고 있는 내용에 대한 피드백을 제공하세요!
d여기에서 7-1 Repeated Measure ANOVA (반복 측정 분산분석)이란? – 반복 측정 분산 분석 주제에 대한 세부정보를 참조하세요
통알못을 위한 통계튜브 – 기초편 –
통알못(통계를 알지 못하는 사람)을 위한 통계튜브 기초편입니다.
이런분들에게 적합합니다.
1. p값이 0.05보다 큰지 작은지만 말할 수 있는 분
2. 그런데 p값이 뭔지 모르는 분
3. 논문작성을 위한 통계를 아무리 들어도 어렵기만 하고 이해가 안되는 분
4. 대학원에서 통계 강의 들을 때마다 C학점을 벗어나지 못하는 분
5. 논문을 쓰려고 설문지도 돌리고 데이터도 다 코딩했는데 이제 어떻게 해야할지 모르겠는 분
6. 통계가 배우고 싶은데 아무리 공부해 봐도 어려운 증명만 나와 무슨 말인지 모르겠는 분
7. 문송한데 통계까지 죄송할까봐 아예 통계는 들여다 볼 엄두도 못 내는 분
어려운 수학 하나 없이 최대한 산수 수준에서 문송한 분들을 위한 통계 강의
개념을 이해해야 통계가 보이는데, 무조건 계산하고 풀어서 답을 맞추라고 하니 통계가 어려웠습니다
통계를 보다 쉽게 잘 이해하도록 돕기위해 만든 통계 채널입니다
통계가 왜 어려웠는지에서부터 기초적인 것들부터 시작해서 통계의 핵심을 마스터 합니다.
처음부터 차근차근 들어보세요.
통계가 쉬워집니다.
중고등학생들도 쉽게 통계를 이해하고 분석할 수 있습니다!!
빅데이터 분석을 하고 싶은데 통계를 몰라서 못하겠다고요?
여기서 부터 시작해 보세요!!
천리 길도 한 걸음부터!!
하루에 한 클립씩만 차근 차근 봅시다!!
사용 통계 소프트웨어: JAMOVI
다운로드: https://www.jamovi.org/download.html
#기초통계 #논문통계 #반복측정분산분석
반복 측정 분산 분석 주제에 대한 자세한 내용은 여기를 참조하세요.
[SPSS 22] 반복측정 분산분석(Repeated Measures ANOVA)
반복측정 분산분석은 동일 개체에 대해서 시간의 흐름에 다라 여러 번 해당 결과를 반복측하여 측정한 자료이다. 이렇게 측정한 자료들은 변수 내에서 …
Source: m.blog.naver.com
Date Published: 9/17/2022
View: 5312
③ 반복측정 분산분석(Repeated Measures ANOVA)
SPSS 통계분석 #10. 분산분석(AONOVA): ③ 반복측정 분산분석(Repeated Measures ANOVA). 권코치 2021. 1. 3. 16: …
Source: kwon-coach.tistory.com
Date Published: 1/4/2022
View: 7452
반복측정 분산분석 – SLOG
반복측정은 주로 임상시험에서 동일한 환자가 병원을 여러 차례 반복적으로 방문 해 매 방문 때마다 반응치를 측정하는 경우에 일어납니다. 이렇게 …
Source: be-favorite.tistory.com
Date Published: 10/25/2022
View: 7765
반복측정 분산분석 (repeated measures ANOVA) – velog
반복측정 분산분석 (repeated measures ANOVA) · 동일한 대상에 대해 여러 번 반복측정하여 반복측정 집단 간에 차이가 존재하는지 검정 · 일반적 형태의 …
Source: velog.io
Date Published: 12/28/2022
View: 4352
주제와 관련된 이미지 반복 측정 분산 분석
주제와 관련된 더 많은 사진을 참조하십시오 7-1 Repeated Measure ANOVA (반복 측정 분산분석)이란?. 댓글에서 더 많은 관련 이미지를 보거나 필요한 경우 더 많은 관련 기사를 볼 수 있습니다.
주제에 대한 기사 평가 반복 측정 분산 분석
- Author: Sapientia a Dei
- Views: 조회수 10,811회
- Likes: 좋아요 121개
- Date Published: 2019. 2. 7.
- Video Url link: https://www.youtube.com/watch?v=y88o0i3LcwY
[SPSS 22] 반복측정 분산분석(Repeated Measures ANOVA)
분산분석을 공부할 때 의문이 드는게 있었다.
분산분석의 기본 가정 사항 중 독립성이 있다는 것은 이제 통계를 공부하는 사람이라면 다 알것이다.
그런데 독립성이란 말이 참으로 애매하다.
왜냐하면 이 독립성을 객관적으로 측정해서 보여주는 것이 없이 단순히 연구자의 의도에 따라 독립성일수도 짝지은 표본일수도 있다는 것이었다.
예를들어보면, 팬텀 하나를 놓고 각기 다른 조건으로 3번씩 측정하여 서로 비교하고자 할 때 이것은 독립적일까? 아닐까?
결론적으로 말하면 이것은 독립적이지 않은 것이다.
같은 팬텀이라는 공통의 조건이 존재하기 때문이다.
여기에서 문제가 생긴다.
두번을 측정했다면 대응표본 t 검정을 수행하면 되는데 3번을 측정했으므로 Paired t test 나 Wilcoxon 검정은 안되는 것이다.
그렇다면 비모수 검정인 Kruskal-Wallis test는 가능할까?
위의 경우에는 가능할것 같지만 요인이 하나 더 생기게 되면 이것 역시 힘들어진다.
그럴때를 대비해서 반복측정 분산분석이 등장한것 같다.
반복측정 분산분석은 영어로 Repeated Measures ANOVA로 명칭되며 줄여서 RM ANOVA로 지칭하기도 한다.
또한 일반선형 모형을 사용한다고 해서 반복측정 일반선형모형(Repeated measures general linear model) 이라고도 한다.
시작하기에 앞서 아래의 내용들은 SPSS 20.0 매뉴얼 교재와 데이터 솔루션에서 제공한 강의자료 및 SPSS data를 참고하였다.
데이터 솔루션 (http://www.datasolution.kr/main/main.asp) 에 들어가보면 통계 데이터 파일을 제공 받을 수 있고, 통계 관련 책 및 소프트웨어를 저렴하게 구입할 수도 있다.
반복측정 분산분석은 동일 개체에 대해서 시간의 흐름에 다라 여러 번 해당 결과를 반복측하여 측정한 자료이다. 이렇게 측정한 자료들은 변수 내에서 서로 상관성을 가지고 있는 것이 특징이며, ANOVA에 비해서 작은 변동도 잡아낼 수 있어 연구의 정확도가 증가되는 장점을 가지고 있다.
반복적으로 측정된 자료를 일반적인 t-test 나 ANOVA 로 수행할 경우 오류가 증가하며, 결국엔 결과의 신뢰성이 저하되므로 주의해야 한다.
따라서 반복측정 자료는 t-test 나 ANOVA 대신 반복측정 일반선형 모형을 사용하여야 하며 회귀분석 자료의 경우 혼합모형(Mixed model) 또는 일반화 추정방정식을 사용해서 분석해야 한다.
이 부분에서 추후에 공부해야 할 과제가 하나 더 생긴 기분이다.
도데체 통계의 끝은 어디인가?
통계 학사-석사-박사를 전공하면 이 모든 통계 이론들을 다 외우고 있는 것일까? 하~~~
t-test 및 ANOVA 는 위의 그림과 같이 독립표본일 때 가능하다.
2 표본일때는 t -test, 3 표본일 때 ANOVA를 사용하지만, 2 표본이라고 해서 ANOVA를 사용 못하는 것은 아니다.
다시 말해서, 2 표본, 3표본 모두 F 통계량을 이용해서 ANOVA를 분석할 수 있다.
어쨌든 여기에서 중요한 것은 표본들이 모두 독립적이란 것이다.
그렇다면, 서로 짝지어진 표본들은 어떻게 해야 할까?
통계에서 보면 가끔 헷갈리게 하는게 어떤땐 그룹이라 쓰고 어떤땐 수준이라 표기하는데 읽는 사람들이 알아서 해석해야 할 부분인것 같다.
보통은 그룹으로 얘기하지만 여기서는 같은 그룹이라는 개념에서 수준을 사용하도록 한다.
A라는 하나의 그룹이 있다.
A 그룹에게 조영제를 주입 하기 전과 후의 조영제가 집적되는 양상을 비교하고자 할때 Paired t test 와 Wilcoxon signed-rank test 를 사용하여 분석할 수 있다.
그런데 수준이 둘이 아니고 셋일때는 반복측정 분산분석을 사용한다.
일반적인 분산분석이 독립변수가 한개 일 경우 One-way ANOVA로 표기하듯이 반복측정 분산분석 역시 독립변수가 한개 일때 One-way RM ANOVA 로 표기한다. 물론 독립변수가 2개이면 Two-way RM ANOVA라고 한다.
그런데 실제로는 RM ANOVA 하나로 통일해서 사용하는듯 하다. 분석법이 비슷해서 따로 구분을 안하는것 같다.
A 라는 하나의 뇌종양 그룹이 있는데 처음에는 A 회사의 조영제를 사용해보고, 며칠 후에 B 회사의 조영제를, 그리고 다시 며칠 후에 C 회사의 조영제를 사용해서 과연 어느 회사의 조영제가 뇌종양을 잘 나타내는가 하는 문제이다.
요즘 IRB 때문에 생명 윤리 문제가 대두되고 있기 때문에 뇌종양 그룹은 환자가 아닌 실험용 쥐라고 생각해두자.
어떤분은 이러한 설명에서 진정제를 예로 들기도 하였다.
환자를 진정시켜야 하는데 처음에는 Ativan을 사용해보고 안되면 다시 Ketamine을 투여해보고 그래도 안되면 Dormicum을 사용해서 진정되는 효과를 분석하고자 한다….
이와같이 그룹은 변하지 않고 세번의 처치가 반복적으로 이루어진 상황을 얘기하는 것이다.
다음 예는 시간 개념이 도입된 것이다.
첫번째 예제는 시간 개념 보다는 그냥 단순히 반복적으로 시행한 것이고, 이번은 일정 시간을 두고 측정한 것이다.
하지만 원리는 비슷하다.
A 라는 그룹에게 조영제를 주입 전과 주입 후 12시간, 주입 후 24 시간 후에 몸 속에서 조영제의 집적 농도가 어떻게 변화되는지 측정해보고자 한다…
보통은 24시간 이후에 모두 배설되어야 하는데 신장의 기능에 따라서 또는 조영제의 종류에 따라서 다르게 나타날 수도 있을 것이다.
다음 예제는 시간 개념에 하나의 요인이 더 추가된것이다.
이와 같이 두 요인의 독립변수가 존재 할 때 이원배치 반복측정 분산분석(Two-way Repeated Measures ANOVA)라고 한다.
만약 위와 같은 모형을 ANOVA로 가로열, 세로열 형태로 여러번 분석한다면 1종 오류와 2종 오류가 증가되어 그 분석의 결과는 잘못된 방향으로 가버릴 것이다.
A, B, C 회사의 조영제가 있다. 각각 다른 그룹에게 조영제를 주입 전, 주입 후 12시간, 주입 후 24시간 반복측정하여 조영제의 배설 농도를 측정하고자 한다…
분석은 One-way RM ANOVA와 동일하고, 분석 과정 중에서 몇가지만 더 해석하면 된다.
앞에서도 계속 언급했지만 ANOVA는 그룹 간에 차이를 파악하는 것이 목적이고, RM ANOVA는 개체 별 차이 효과와 개체 내 차이 효과를 잘 분리하여, 그들의 효과를 파악하는 것이 주된 목적이다.
그런데 요인이 더 추가되면서 RM ANOVA에서도 분산의 동일성 외에 개체 내 상관의 일관성을 의미하는 구형성(sphericity) 가정이 필요하다.
ANOVA는 그룹 간 차이 검정과 사후검정을 확인하면 됐었는데 RM ANOVA는 시간의 차이에 따른 검정과 교호작용까지 두가지를 더 해석해야 한다.
교호작용이란 “둘 또는 그 이상의 위험 용인이 있는 질병 발생률이 개별 효과의 결과로 기대되는 발생률과 다를 때” 라고 McMahon 이 1972년도에 정의를 내린바 있다.
말이 조금 어려운것 같은데 한마디로 상호작용이 있느냐의 문제이다.
위의 표에서 Time*GFR 로 표기된 것이 교호작용을 의미한다.
조영제의 체 내 농도가 시간의 흐름에 따라 변하느냐, GFR(glomerular filtration rate; 사구체여과율) 수치에 따라 변하는냐 또는 시간과 GFR의 상호작용에 의해 체 내 조영제 농도가 달라지느냐의 문제이다.
위의 그래프와 같이 시간과 GFR이 서로 같은 방향으로 움직인다면 교호작용이 없는것이고, 4번, 5번 그래프와 같이 어느 한 요인에 의해 다른 요인이 상승하거나 감소했을 때 교호작용이 있다라고 한다.
교호작용이 유의하다고 나올 경우, 다시 말해 교호작용이 있다라고 결과에 제시될 경우 결과 값을 있는 그대로를 해석하는 것은 위험하며, 각 시점별로 별도의 T-test 및 ANOVA 를 사용하여 개별 분석해야 된다.
모수 검정에서 항상 등장하는 기본 가정사항이다.
ANOVA와 마찬가지로 정규성, 등분산성이 있고, 독립성이 빠지고 그 자리에 구형성이 추가되어 있다.
통계를 공부하면서 느끼는 것은 많은 연구자들이 주로 모수 검정을 사용하는데 과연 정규성을 만족하였는가? 라는 것이다.
왜냐하면 열심히 데이터를 측정해서 정규성 검정을 시행해보면 정규성을 통과하지 못하는 경우가 너무도 많기 때문이다.
특히 샘플 수가 7개 미만으로 극히 적거나, 들쑥날쑥한 데이터가 포함될 경우 정규성을 만족하기가 정말 쉽지 않다.
그럼에도 불구하고 대부분 모수 검정을 시행하였고, 학위논문 및 학회논문의 심사과정에서 별 문제없이 통과되고 있다.
그래서 내 나름대로의 결론을 내려보았다.
1. 정규성을 만족하지 않는다고 해서 반드시 비모수로 해야 하는 것은 아닌것 같다. 표본 통계란 것은 모집단을 추정하기 위해 시행하는 것인데 모집단에서 이미 정규성을 만족한 데이터라면 표본(sample)에서 정규성을 만족하지 못했다고 하더라도 모수 통계를 이용할 수 있다. 예를들어 혈압이 거기에 해당된다고 한다.
2. 모수통계는 평균을 이용하지만 비모수통계는 순위를 이용한다. 그런데 연구를 진행하다보면 순위 보다는 평균과 표준편차가 연구에 더 적합한 경우를 볼 수 있다. 따라서, 이런 경우 논문에 모수 통계의 당위성을 충분히 설명하면 되지 않을까? 라는 생각을 해본다.
나의 결론이 맞는지 모르겠다.
누군가 이 문제에 대해 명쾌하게 설명 좀 해줬으면 좋겠다.
이렇게 질문을 던지고 나서 블로그 이웃께서 몇가지 답변을 주셨다.
1. 정규성을 만족하지 못하면 모수통계는 적용할 수 없다.
2. RM ANOVA에서 정규성을 만족하지 못하면 Friedman test 를 시행한다.
두번째 기본가정은 등분산성이다. 이는 다른말로 동일성 또는 동질성이라고도 한다.
One-way ANOVA가 Levene의 동질성 검정에서 등분산을 확인했다면 반복측정 ANOVA에서는 Box의 공분산 행렬 등식 검정 표를 통해 확인할 수 있다.
가설은 다음과 같다.
귀무가설(H0) : 그룹 간 분산 구조는 동일하다.
대립가설(H1) : 그룹 간 분산 구조는 동일하지 않다.
당연한 얘기지만 귀무가설을 만족하려면 P 값이 0.05 보다 크거나 같아야 한다.
반대로 대립가설을 만족하려면 0.05 보다 작아야 한다.
결론적으로 등분산성 가정을 만족하려면 귀무가설을 만족해야 하므로 P 값은 0.05 보다 크거나 같게 나와야 한다.
위의 표를 예로 든다면 P 값이 0.922 로서 0.05보다 크므로 등분산성 가정은 만족하는 것이다.
만약 동질성이 다르게 나온다면, 그룹간의 비교를 할 수 없기 때문에 그 차이를 파악하기가 어렵게 된다.
등분산성과 비슷한 개념의 세번째 구형성 가정이 나온다.
구형성(Sphericity) 가정이란 반복적으로 측정되는 자료들의 시차에 따른 분산이 동일하다는 가정이다.
이것은 분석 결과에서 Mouchly의 단위행렬 검정을 통해 확인 할 수 있는데 이것을 구형성 가정을 통과하지 못해도 다행히 다른 결과 값을 제시해 준다.
구형성 가정 역시 P 값이 0.05 이상이어야 하는데 만족하게 되면 분석 결과에서 개체-내 효과 검정 표를 확인하면 되고, 만족하지 못하면 Greenhouse-Geisser 방법으로 수정된 일변량 분석을 이용하거나 다변량 검정의 Piliai의 트레스 또는 Wilis의 람다 항목응 이용한다.
이렇게 보면 이해하기 힘들겠지만 밑에서 분석 결과를 보면 이해할 수 있을 것이다.
머쉬리(Mauchly)의 단위행렬 검정 표는 등분산성에 대한 적합성 검정으로서, 다음과 같이 가설을 세우고 있다.
귀무가설(H0) : 구형성 가정을 만족한다 (P≥0.05).
대립가설(H1) : 구형성 가정을 만족하지 않는다 (P<0.05). 따라서 구형성 가정을 만족시키기 위해서는 P 값이 0.05 이상으로 나타나 귀무가설을 만족해야 한다는 것을 알 수 있다. 엡실론에서 Greenhouse-Geisser과 Huynh-Feidt 의 값들은 구형성 가설을 보정하는 것으로 1에 가까울수록 구형성 가설이 타당함을 의미한다. 구형성 가정이 만족되었는데 다변량 검정을 해석하면 검정력이 떨어질 수 있으므로 주의한다. 구형성 가정이 만족하면 "개체 내 효과 검정" 을 해석한다. 이는 다변량 검정보다 신뢰성이 높아 주로 활용된다. 해석의 첫번째는 윗 칸에 있는 Greenhouse-Geisser과 Huynh-Feidt 의 P 값을 확인하며, 가설은 다음과 같다. 귀무가설(H0) : 시간의 흐름에 따라 변화가 없다 (P≥0.05). 대립가설(H1) : 시간의 흐름에 따라 변화가 있다 (P<0.05). 따라서 데이터를 반복적으로 측정하였을때 P 값이 0.05 보다 작게 나오면 통계적으로 유의한 것으로 볼 수 있는 것이다. 교호작용을 확인하기 위해서는 아래 칸에 있는 Greenhouse-Geisser과 Huynh-Feidt 의 P 값을 확인하며 가설은 다음과 같다. 귀무가설(H0) : 교호 작용이 없다 (P≥0.05). 대립가설(H1) : 교호 작용이 있다 (P<0.05). 교호작용이 나타나게 되면 해석을 신중하게 해야 한다. "개체 내 대비 검정" 항목은 반복측정한 데이터가 어떠한 형태를 가지고 있는지 파악할 수 있다. 종류는 3가지로서 아래에서 확인할 수 있다. 선형, 2차모형, 3차모형에 각각 P 값이 제시되는데, 만약 위의 예시처럼 2차, 3차 모형은 유의하지 않고, 선형모형만 유의하게 나온다면 그 모형은 선형모형을 의미한다. 그런데 모두다 유의하지 않게 나온다면 그 모형은 랜점하게 변화하는 것으로 시간의 흐름과 무관하며 결국엔 안 좋은 모형이 된다. 모형의 형태는 위와 같다. 선형 모형은 시간의 흐름에 따라 비례적으로 증가하는 것이고, 2차 모형은 시간의 흐름에 따라 갑자기 증가 또는 감소 하는 형태로 나타난다. 3차모형은 증가와 감소를 반복하는 형태로 잘 나타나지 않는다. 드디어 반복측정 분산분석에 대한 이론 설명이 끝이나고 실제 예제를 가지고 따라해볼 차롈이다. 위의 이론을 토대로 비교하면서 해석하면 이해하는데 더 쉬울것이다. 두통을 위한 진통제에는 여러가지가 있다. 그 중에서 3 종류의 진통제 효능을 비교하기 위해 그룹 3 집단을 선정하여 각각 진통제를 복용하도록 하였다. 복용 후 혈중 약물 농도를 4회 측정하여 진통제의 효능을 비교자고자 하였다. 이때 혈중 농도가 높을수록 진통제의 효능이 높은 것으로 간주한다. 전체 196개의 케이스와 5개 필드로 구성되어 있다. 그룹은 세 그룹으로서 1 그룹에게는 진통제 A, 2 그룹에게는 진통제 B, 3 그룹에게는 진통제 C를 복용하도록 했고, 복용 직후, 복용 후 1시간, 복용 후 2시간, 복용 후 3시간 후에 약물 농도를 반복적으로측정하였다. 귀무가설 (H0) : 세 종류의 진통제 효능은 모두 같을 것이다. 대립가설 (H1) : 세 종류의 진통제 효능은 서로 차이가 있을 것이다(적어도 두 그룹에서 차이가 있을 것이다). 분석 과정은 정규성 검정을 시행한 후 반복측정 분산분석을 시행한다. 첨부된 RM ANOVA.sav 파일을 다운로드하여 SPSS에서 Open 한다. Open 후 첫 화면으로 "데이터 보기(D)" 화면이 보인다. "변수 보기(V)" 를 클릭하여 세부적인 변수 설정을 한다. 참고로 "Group" 변수의 레이블은 위와 같이 설정하였다. 정규성 검정을 위해 "분석(A)" ==> “기술통계(E)” ==> “탐색(E)” 을 차례로 클릭한다.
탐색 화면이 나타났다.
범주형 변수인 “진통제 종류”를 “요인 목록(F):” 으로 보내고 나머지 연속형 변수는 모두 “종속 목록(D):” 항목으로 이동한다.
그리고 오른쪽의 “도표(T)…” 버튼을 클릭한다.
도표 대화상자에서 “검정과 함께 정규성 도표(O)” 항목에 체크한다.
안타깝게도 Kolmogorov-Smirnov 검정과 Shapiro-Wilk 검정 모두 정규성을 만족하진 않았다.
하지만 반복측정된 데이터를 찾기가 너무 힘들어서 이 예제를 그대로 사용하니, 실제 연구에서는 Friedman test를 고려해봐야 한다.
반복측정 분산분석을 위해 “분석(A) ==> “일반 선형 모형(G)” ==> “반복 측도(R)…” 를 차례로 클릭한다.
“반복 측도 요인 정의” 대화 상자가 나타난다.
요인1을 본인이 알아보기 쉽게 이름을 변경한다. 그대로 둬도 상관없다.
예제에는 “시간” 이라고 변경하였다.
그리고 4번 반복측정 했으므로 “수준 수(L):” 항목에 4 를 입력하고 “추가(A)” 를 클릭한다.
“시간(4)” 가 입력되어 있다.
“정의(F)” 를 클릭한다.
“수준 수(L):” 항목에 4 를 입력했기 때문에 위와 같이 “개체-내 변수(W):” 항목에 4개의 카테고리가 생성되었다.
먼저 범주형 변수인 “진통제 종류[Group]” 를 “오브젝트 간 요인(B):” 항목으로 이동시킨다.
그리고 남아있는 연속형 변수인 “복용 직 후, 1시간, 2시간, 4시간” 변수를 순서대로 “개체-내 변수(W):” 항목으로 이동시킨다.
여기에서 주의할 점은 한꺼번에 이동시키는게 아니고 하나씩 하나씩 옮겨야 한다는 것이다.
첫번째 “복용직 후[Baseline]” 변수를 이동시켰다.
두번째, 세번째, 네번째 변수까지 모두 차례대로 이동시킨다.
“모형(M)…” 과 “대비(N)…” 는 그대로 둔다.
다음, “도표(T)…” 를 클릭한다.
“반복 측도: 프로파일 도표” 대화창이 나타났다.
여기에서 “시간” 을 “수평축 변수(H):” 항목으로, “Group” 을 “행구분 변수(S):” 항목으로 이동시킨다.
이것은 시간의 흐름에 따라 각 그룹별 그래프가 어떻게 생성되는지 보고자 함이다.
“추가(A)” 버튼을 클릭한다.
그러면 “도표(T):” 항목에 “시간*Group” 가 추가된것을 확인 할 수 있다.
“계속” 을 클릭하고 빠져 나온다.
두 그룹 이상의 분산분석이므로 사후분석 다준 비교를 위해 “사후분석(H)…” 를 클릭한다.
각각의 진통제를 복용한 세 그룹의 다중비교를 위해 “요인(F):” 항목에서 “사후 검정변수(P):” 항목으로 이동시킨다.
모든 변수들의 샘플 수가 같으므로 “Tukey 방법” 을 선택하고 “계속” 을 클릭하여 빠져나온다.
다음 “옵션(O)…” 를 클릭한다.
“옵션” 메뉴에서는 주 효과 비교와 동질성 검정을 확인한다.
먼저 “시간” 을 선택하여 “다음 평균 표시(M):” 항목으로 이동시킨다.
그렇게 하면 “주효과 비교(O)” 항목이 활성회된다.
“주효과 비교(O)”, “기술통계(D)”, “동질성 검정(H)” 항목을 체크한다.
“계속” ==> “확인” 을 클릭하면 분석이 수행된다.
처음 결과는 크게 해석이 필요한 부분은 아니지만 기술통계 표를 통해 평균과 표준편차를 한번씩 살펴본다.
분산의 동일성에 대한 검정 결과이다.
위의 설명에서 가설은 다음과 같다고 하였다.
귀무가설(H0) : 그룹 간 분산 구조는 동일하다.
대립가설(H1) : 그룹 간 분산 구조는 동일하지 않다.
따라서, 유의확률 P 값이 0.922로서 0.05보다 크기 때문에 그룹 간 분산의 구조는 동일한 것으로 볼 수 있다.
즉, 등분산성을 만족한다는 얘기이다.
다변량 검정 결과에서 4가지 검정 방법이 제시되어 있다. 보통 Pillai의 트레이스, Wilks의 람다 방법을 많이 사용하는데, “시간” 항목은 어떤 검정 방법을 사용하던지 모두 95% 신뢰수준에서 매우 유의하게 나타난다.
먼저 시간들 간의 개체 내 효과를 나타내는 “시간”의 경우 모든 4가지 검정방법 모두 95% 신뢰수준에서 유의하게 나타났다.
이는 시차에 따라서 그룹 간의 결과들이 좀 다를 수 있음을 보여주고 있다.
그러나 “시간*Group” 항목에서 결합효과(교호작용 효과)는 유의하지 않음을 알 수 있다.
** 다변량 검정은 뒤의 구형성 검정이 유의하지 않은 경우 사용할 수 있으나, 검정력이 비교적 약하다고 알려져 있다.
** 가장 좋은 것은 구형성 검정이 통과하고, 그 가정 하에 검정을 하는 것이 좋다.
위의 표는 모쉬리(Mauchly)의 단위행렬 검정 결과이다. 이전 버전에서는 “Mauchly의 구형성 검정” 이란 제목이 붙어 있었다.
Mauchly의 단위행렬(구형성) 검정 결과는 시차에 따른 분산의 동일성을 나타내는 검정으로 적합성 검정이다.
가설은 다음과 같다.
귀무가설(H0) : 구형성 가정을 만족한다 (P≥0.05).
대립가설(H1) : 구형성 가정을 만족하지 않는다 (P<0.05). 따라서, 위의 결과를 보면 유의확률 P 값은 0.085로서 0.05 보다 크므로 적합한 모형임을 알 수 있다. 엡실론에서 Greenhouse-Geisser, Huynh-Feldt 값들은 구형성 가설을 보정하는 값인데, 이 값들이 1에 가까울수록 구형성 가설이 타당하다고 하고, 1과 멀어질수록 구형성 가설이 타당하지 않다고 본다. 위의 다변량 검정과 같은 내용이며, 구형성 가정 하에 해석되는 각종 결과이다. 앞의 다변량 검정보다 좀 더 신뢰성이 높아 본 결과를 많이 활용한다. 먼저, "시간" 항목의 경우 가설이 다음과 같다. 귀무가설(H0) : 시간의 흐름에 따라 변화가 없다 (P≥0.05). 대립가설(H1) : 시간의 흐름에 따라 변화가 있다 (P<0.05). 따라서, Greenhouse-Geisser과 Huynh-Feldt 모두 0.000 으로서 매우 유의하므로, 시간의 흐름에 따라서 전체적인 변화에 차이가 있음을 알 수 있다. 개체 내 대비 검정은 반복측정한 데이터가 어떤 형태를 가지고 있는지 파악하는 것이다. 첫번째가 선형모형, 두 번째가 2차 모형, 세 번째가 3차모형에 대한 검정을 한다. 기본적인 가설은 H0 : 본 반복측정의 모형은 선형이 아니다 (P ≥ 0.05) H1 : 본 반복측정의 모형은 선형이다 (P < 0.05) ** 선형모형만 유의(P<0.05)하고, 2차모형과 3차모형이 유의하지 않다(P≥0.05)고 나오면 그 모형은 선형 모형을 의미한다. ** 만약 모두 유의하지 않으면, 시간의 흐름에 따라 변화가 거의 없거나 모양이 Random하게 변화한다는 것을 의미(안 좋은 모형)한다. 오차에 대한 분산이 일정한지를 체크하는 표인것 같은데, 특별히 해석을 요하는 표는 아닌것 같으므로 다음 표로 넘어간다. 가장 중요한 부분인 그룹 간의 차이가 있는지 개체간 효과를 검정하는 부분이다. 가설은 H0 : 3 그룹(진통제A, 진통제B, 진통제C) 간의 약물의 차이가 없다. H1 : 3 그룹(진통제A, 진통제B, 진통제C) 간의 약물의 차이가 있다. 개체 간 효과 검정 결과 0.039로, 0.05 보다 작으므로, 3개 그룹 간에는 진통제의 종류에 따라 차이가 있다는 것을 의미한다. 이는 궁극적으로 진통제에 따라서 효과 차이가 있음을 의미한다고 할 수 있다. 위의 세 표는 시간의 흐름에 따른 그룹 별 비교를 보여준다. 참고만 하고 다음 사후 검정으로 넘어간다. 3 그룹을 비교하였으므로 일원배치 분산분석처럼 사후분석이 필요한데 위에서 Tukey 방법을 선택하였으므로 그 결과를 제시해주고 있다. 위의 오브젝트 간 효과 검정에 있어서, 3 그룹 간의 비교에서 유의한 차이를 보였으므로, 이들을 사후 검정을 통해 서로 간의 우열을 파악해야 한다. 검정 결과 * 진통제 A = 진통제 B * 진통제 B = 진통제 C * 진통제 A < 진통제 C 으로 결과가 나타나서, 결과적으로 보면 진통제 A 를 투여하는 것 보다는 진통제 C 를 투여해야지만, 진통제의 효능이 가장 좋게 나타남을 파악할 수 있다. 진통제 종류와 시간(4시점)에 따라서 평균의 변화량을 도표를 통해 한눈에 시각적으로 파악할 수 있는 프로파일 도표이다. 대략 첫 시점에서는 진통제 A와 진통제 C 가 거의 차이가 없고, 진통제 B 와는 많은 차이를 보인다. 그러나 2 시점 부터는 진통제 B와 C 가 진통제 A 와 차이를 보이기 시작하는 것을 알 수 있다. 그리고 진통제 B 와 진통제 C는 그 뒤 큰 차이를 보이지 않는다. 본 도표를 통해 앞의 사후 분석의 결과와 약간 다른 형태의 결론을 내릴 수 있다. 앞의 사후분석의 경우 진통제 C 가 진통제 A 에 비해 현격하게 차이가 났지만, 시간이 지날수록 진통제 B 와 진통제 A 도 차이가 있을 수 있다는 것을 그래프를 통해 좀 더 세밀하게 파악할 수 있다.
SPSS 통계분석 #10. 분산분석(AONOVA): ③ 반복측정 분산분석(Repeated Measures ANOVA)
안녕하세요^^ 권 코치입니다.
오늘 포스팅은 분산분석의 마지막으로 반복측정 분산분석
“Repeated Measures ANOVA”에 대하여 알아보도록 하겠습니다.
◈ 반복측정 분산분석(Repeated Measures ANOVA)
◈ 시간(시점)에 따라 여러 번 해당 결과를 반복하여 측정한 자료분석
◈ 반복측정 자료는 변수 상호간에는 독립적일 수 있지만, 변수 내에서는 독립적이지 않고 상관성이 있는 특성
◈ 반복적으로 측정된 자료를 일반적인 t-test 나 ANOVA 로 수행할 경우 오류가 증가하며, 결국엔 결과의 신뢰성이 저하 되므로 주의해야 한다.
◈ 상호작용 효과검증
◈ 반복측정 분산분석의 이해
t-test 및 ANOVA 는 위의 그림과 같이 집단이 독립표본일 때 가능하다.
2 표본일 때 t -test, 3 표본일 때 ANOVA를 사용하지만,
2 표본이라고 해서 ANOVA를 사용 못하는 것은 아니다.
2 표본, 3표본 모두 F 값을 이용해서 ANOVA를 분석할 수 있다.
∨ 동일 집단 내 사전,사후(2가지 요인) 분석은 Paired t-test 사용
∨ 2가지 이상의 요인( 사전, 한달 후, 두달 후) Repeated Measures ANOVA 사용
∨일반적인 분산분석이 독립변수가 한개 일 경우 One-way ANOVA로 표기하듯이 반복측정 분산분석 역시
독립변수가 한개 일때 One-way RM ANOVA 독립변수가 2개이면 Two-way RM ANOVA
Two- way Repeated Measures AVONA 예제
◈ 웨이트 트레이닝이 중년여성 골퍼의 드라이브 수행력에 미치는 영향
∨ 연구방법: 트레이닝 전,후 드라이브 수행력 측정
∨자료처리: 대응표본 t- 검정을 통하여 사전, 사후 평균 차이분석 후
상호작용 효과검증을 위한 Two- way Repeated Measures AVONA 실시
◈ 연구가설
H0 : 웨이트 트레이닝이에 따른 골프 수행력차이는 없을 것이다.
H1 : 웨이트 트레이닝이에 따른 골프 수행력차이는 있을 것이다.
◈ SPSS 분석방법
① 데이터 입력 & 변인 설정 ▶ 정규성검증 <분석(A) ▶ 기술통계(E) ▶ 탐색(E) 유의확률 값이 P>.05 이므로 정규성 검정을 만족
② 분석(A) ▶ 일반선형모형(G) ▶ 반복측정(R)
③ 반복측정 요인 정의 창이 나타남/ 요인에 시기로 입력
수준의 수는 사전,사후2번 측정으로 2를 입력 후 추가를 클릭/ 정의 클릭
④ 범주형 변수인 집단을 개체 간 요인으로 이동
연속형 변수인 사전,사후를 개체 내 변수로 이동
⑤ 도표를 클릭/ 시기를 수평축, 집단을 선구분 변수로 이동
(시간의 흐름에 따른 집단의 그래프 생성)
⑥ 두 집단 이상의 분산분석의 경우 사후분석
요인항목의 집단을 사후검정변수로 이동, 사후분석 방법 체크
⑦ 옵션 메뉴에서 주효과 비교와 동질성 검정 체크 확인
SPSS 분석 결과 확인
기술통계 표를 통해 평균과 표준편차를 확인
분산의 동일성에 대한 검정 결과
H0 : 집단 간 분산 구조는 동일하다.
H1 : 집단 간 분산 구조는 동일하지 않다
유의확률 P 값이 0.194로서 0.05보다 크기 때문에 그룹 간 분산의 구조는 동일한 것으로 볼 수 있다
즉, 등분산성을 만족한다는 얘기이다.
반복측정 분산분석
❗️블로그 옮김: https://www.taemobang.com
❗ Prerequisite
일원배치 분산분석
❓ More to read
Tutorials on repeated measures design in R
Introduction
반복측정 분산분석(repeated measures ANOVA)은 반복측정 자료에 대한 모평균 비교를 수행하는 분석 방법입니다. 반복측정(repeated measurements)이란, 말 그대로 동일한 실험 단위(experimental unit, EU)에 대해 여러 번의 측정을 하는 경우를 말합니다. 반복측정은 주로 임상시험에서 동일한 환자가 병원을 여러 차례 반복적으로 방문 해 매 방문 때마다 반응치를 측정하는 경우에 일어납니다. 이렇게 얻어지는 반복측정 자료의 주요 목적은 실험군의 평균반응 값이 대조군에서와 동일한지 여부에 있을 것입니다. 이러한 실험 디자인의 비교에 사용되는 분석 방법이 바로 반복측정 분산분석에 해당합니다. 반복측정 분산분석은 반복측정 되는 요인이 하나 일때와 둘 이상인 경우로 나뉩니다. 여기서는 편의상 반복 요인이 1개인 경우에 대해서만 설명하겠습니다. 반복 요인이 2개인 경우는 단순한 확장으로 크게 달라지는 것은 없습니다.
1 반복측정 자료의 형태와 모형식
반복측정 자료에서 반복요인은 다양하게 존재합니다. 임상시험에서 동일한 환자가 병원을 여러 차례 반복적으로 방문할 때 마다 반응치를 측정하는 경우에는 반복측정 요인이 “시간(time)”이 되지만, 약의 농도를 증가시켜 한 개체에 대해 반응값을 여러 번 측정하는 경우에는 “약의 농도”가 하나의 반복 요인이 됩니다. 다음의 예제 자료는 반복 요인이 하나인 일반적인 자료 형태에 해당합니다.
표 1.1 고혈압 자료
해당 자료는 고혈압 환자 20명을 대상으로 10명에게는 기존의 혈압 강하제(C), 나머지 10명에게는 새로운 혈압 강하제(E)를 투여해 각각 3회에 걸쳐 혈압을 측정하여 정리한 것에 해당합니다. 즉, 첫 방문시 약을 투여 받기 전의 혈압(0주)과 4주 후, 8주 후 혈압을 측정하였습니다. 이 반복측정 자료에 대한 분석 목표는 다음과 같이 3가지로 요약할 수 있습니다.
(1) 기존약과 새로운 혈압 강하제 간 유의한 차이가 있는가?
(2) 방문 시간에 따라 혈압 차이가 있는가?
(3) 약과 방문 시간 간에 교호작용이 있는가?
(3) 항목의 반복요인과 처리요인 간의 교호작용의 경우는 분석 전, 자료를 시각화함으로써 가늠할 수 있는 항목에 해당합니다. 예를 들어, 다음은 표 1.1 고혈압 자료를 처리, 방문 시간별 혈압의 평균을 시각화한 그림으로 간략하게 설명을 해보겠습니다.
그림 1.1 고혈압 자료
그림 1.1을 보면 두 약(혈압강하제 C, E) 간의 효과 차이가 방문 시간(week)에 따라 달라지고 있습니다. 그림이 이렇게 반복 요인에 따라 교차되는 형태를 띨 때 우리는 두 요인 간 교호작용의 존재를 강하게 의심해볼 수 있습니다. 이제 다시 본론으로 돌아가서, 반복측정 자료의 분석 목표 3가지에 따라 반복측정 분산분석에 대한 일반화된 모형식을 작성해보겠습니다. 처리의 수가 $I$개이고, 각 처리에 할당된 개체들을 각각 $n_1, \cdots, n_{I}$(불균형 자료 고려)라고 하고, $i$번째 처리에서 매 $k$ 시점마다 측정한 $j$ 번째 개체의 반응측정치를 $y_{ijk}$라 하겠습니다. 즉, 첨자 $i, j, k$ 각각은 처리, 개체, 시간을 나타냅니다. 이에 따른 반복측정 분산분석의 모형식은 다음과 같이 주어집니다:
\begin{equation} y_{ijk} = \mu + \alpha_i + \beta_{ij} + \gamma_{k} + \delta_{ik} + \epsilon_{ijk} \\ (i = 1, \cdots, I; \ j = 1, \cdots, n_i; \ k = 1, \cdots, K) \end{equation}
여기서 $\mu$는 반응측정치 $y_{ijk}$의 전체평균을 나타내는 모수, $\alpha_i$는 $i$번째 처리 효과(treatment effect), $\beta_{ij}$는 $i$번째 처리 내에서의 개체 $j$의 효과(subject effect), $\gamma_k$는 시간 $k$의 효과, $\delta_{ik}$는 처리 $i$와 $k$번째 시간의 교호작용효과(interaction effect)이며 오차항 $\epsilon_{ij} = (\epsilon_{ij1}, \cdots, \epsilon_{ijK})^`$는 평균이 $0$인 독립적인 정규분포를 따른다고 가정합니다. 표 1을 식 (1)로 표현한다면, $I$는 2, $n_{1} = n_{2} = 10$, $K = 3$이 될 것입니다. 식 (1)의 일반화된 모형식을 따라 반복요인이 하나인 반복측정 자료의 형태를 나타내보면 다음과 같습니다:
표 1.2 반복요인이 하나인 반복측정 자료의 형태
2 구형성 가정
반복측정 분산분석이 다른 분산분석과 구분되는 특징적인 부분은 오차항에 대한 추가적인 가정이 이루어진다는 것입니다. 그것은 바로 오차항의 공분산 행렬에 대해 복합대칭성(compound symmetry) 또는 구형성(sphericity)을 가정하는 것입니다. 엄밀히 말하면 복합대칭성은 구형성의 특수한 경우인데, 여기서는 이 둘을 같은 것으로 보고 설명하려고 합니다. 복합대칭성 가정이 필요한 이유는 반복측정에서 개체들은 일정한 시점마다 측정되기 때문에 각 반복측정치들 간에 어느 정도 상관관계가 존재하기 때문입니다. 복합대칭성이란 이러한 반복요인의 처리간 상관관계가 모두 동일하다는 것으로, $K$개의 시점에 대한 오차항이 복합대칭성을 만족할 때 공분산 행렬의 형태는 다음 식과 같이 주어집니다:
\begin{equation} {\rm{COV}}(\epsilon)_{K \times K} = \sigma^2 \begin{bmatrix}1 & \rho & \cdots & \rho \\ \rho & 1 & \cdots & \rho \\ \vdots & & & \vdots \\ \rho & \cdots & \rho & 1 \end{bmatrix} \end{equation}
즉, 모든 측정 시간($k = 1, \cdots, K$)에서의 분산은 $\sigma^2$으로 같고 공분산도 모든 시간에 대해 $\sigma^2 \rho$로 같다고 가정합니다. 이러한 복합대칭성은 반복측정 자료를 일변량(univariate)으로 분석하기 위한 조건이 됩니다. 실제 자료에서 이러한 오차항의 복합대칭성 또는 구형성을 만족하기는 쉽지 않습니다. 특히 시간의 간격이 일정하지 않은 경우 이러한 가정이 깨지는 예가 많습니다. 그래서, 반복측정을 하는 형태의 RCT를 수행할 계획이 있는 연구자분들은 이점을 꼭 유념하셔서, 측정 시점이 중요하게 정해져 있는 실험이 아니라면 등간격으로 반복측정 계획을 세우시는 것을 권장합니다. 만약, 자료의 구형성 가정이 깨졌을 경우는 반복측정 분산분석을 통한 일변량 분석을 그대로 적용하는 것은 잘못된 결과를 유도할 수 있습니다. 이를 피할 수 있는 방법은 다변량 분산분석을 이용한 접근법인데 이는 <4 다변량 접근법>에서 서술하겠습니다.
오차항의 구형성 가정 만족 여부는 처리들을 대비(contrast) 또는 직교다항(orthogonal polynomials)을 만족하도록 변환시킨 후 대비행렬 또는 직교다항행렬의 오차항에 대한 검정을 통해 체크할 수 있습니다. 만약 구형성 조건이 만족되지 않을 경우에는 다변량 분산분석의 결과를 사용하는 것이 좋습니다. 그러나, 만약 구형성 조건이 만족되는 경우에는 반복측정 분산분석 모형을 사용하는 것이 검정력(power) 을 더 높일 수 있습니다. 구형성 조건이 만족되는 경우에는 다변량 방법을 썼을 때는 지나치게 보수적인 검정을 수행하게 된다고 알려져 있습니다. 그리고, 구형성이 깨진 경우에도 이를 보정한 후 반복측정 분산분석을 이용해 일변량 분석을 수행할 수도 있습니다. 반복측정의 분산과 공분산의 함수인 Greenhous-Geisser Epsilon($\epsilon$)이라는 보정항을 계산할 수 있는데, 이 보정은 분산분석에서의 자유도에 $\epsilon$을 곱하여 수정된(adjusted) 자유도를 제공합니다. 그 외 Huynh-Feldt Epsilon 값을 이용한 보정방법을 쓰기도 합니다. 이 값들이 모두 1근처의 값을 갖고 있으면 구형성 조건을 만족한다고 볼 수 있습니다. 그러나, 구형성 검정이 매우 유의한 경우(p-value가 매우 작은 경우)에는 일변량 분석에서 보정을 수행한다고 하여도, 다변량 분산분석에 의한 결과가 달라질 수 있고 이 때에는 다변량 접근법을 이용하는 것이 좋다고 할 수 있습니다.
3 연구 가설과 분산분석 표
표 1.1과 같이 처리의 수가 하나가 아닌 여러 개가 존재하면 처리의 효과와 함께 시간과 처리의 교호작용 효과에 대한 검정이 연구 가설에 추가됩니다. 즉, 3개의 연구가설을 세워 검정을 수행할 수 있습니다:
– $H_{01} = \alpha_1 = \alpha_2 = \cdots = \alpha_{I} = 0$ (처리 간의 반응치에 차이 없음)
– $H_{02} = \gamma_1 = \gamma_2 = \cdots = \gamma_K = 0$ (시간 간의 반응치에 차이 없음)
– $H_{03} = \delta_{11} = \delta_{12} = \cdots = \delta_{IK} = 0$ (처리와 시간 간의 교호작용 존재 하지 않음)
이 3가지 가설의 검정을 위한 변동의 분해는 다음과 같이 이루어집니다:
\begin{equation} SST = SSI + SSJ + SSK + SS_{I \times K} + SSE \end{equation}
구형성을 만족하는 경우 일변량 분석에 대한 분산분석 표는 다음과 같습니다. 여기서 $N = \sum_{i=1}^I n_i$에 해당합니다.
요인 자유도 제곱합 평균제곱합(MS) F 처리 $I-1$ $SSI$ $SSI/(I-1)$ $\rm{F}_1$ 개체(처리) $N-I$ $SSJ$ $SSJ/(N-I)$ 시간 $K-I$ $SSK$ $SSK/(K-1)$ $\rm{F}_2$ 처리 $\times$ 시간 $(I-1)(K-1)$ $SS_{I \times K}$ $SS_{I \times K}/(I-1)(K-1)$ $\rm{F}_3$ 오차 $(N-I)(K-1)$ $SSE$ $SSE/(N-I)(K-1)$ 계 $NK-1$ $SST$
다음은 제곱합의 식들을 정리한 것입니다:
– $SSI = K \sum_{i=1}^I n_i ({\bar{y}}_{i\cdot \cdot} – {\bar{y}}_{\cdot \cdot \cdot})^2$
– $SSJ = K \sum_{i=1}^I \sum_{j=1}^{n_i} ({\bar{y}}_{i j \cdot} – {\bar{y}}_{i\cdot \cdot})^2$
– $SSK = N \sum_{k=1}^{K} ({\bar{y}}_{\cdot \cdot k } – {\bar{y}}_{ \cdot \cdot \cdot})^2$
– $SS_{I \times K} = \sum_{k=1}^K \sum_{i=1}^I n_i({\bar{y}}_{i\cdot k} – {\bar{y}}_{i\cdot \cdot} – {\bar{y}}_{\cdot \cdot k} + {\bar{y}}_{\cdot \cdot \cdot})^2$
– $SSE = \sum_{k=1}^K \sum_{i=1}^I \sum_{j=1}^{n_i} (y_{ijk} – {\bar{y}}_{i j \cdot} – {\bar{y}}_{i\cdot k} + {\bar{y}}_{i\cdot \cdot})^2$
– $SST = \sum_{k=1}^K \sum_{i=1}^I \sum_{j=1}^{n_i} (y_{ijk} – {\bar{y}}_{ \cdot \cdot \cdot})^2$
여기서 주의할 것은 처리에 대한 $\rm{F}$-값은 처리에 대한 평균제곱합($\rm{MSI}$)을 처리 내 개체의 평균제곱합($\rm{MSJ}$)로 나눈다는 것이다. 따라서 처리내 개체의 효과는 하나의 오차제곱합으로 볼 수 있다. 결론적으로, 각 가설을 검정하기 위한 $\rm{F}$ 값 $\rm{F}_1$, $\rm{F}_2$, $\rm{F}_3$을 정리하면 다음과 같다.
– ${\rm{F}}_1 = \frac{SSI/(I-1)}{SSJ/(N-I)} \ \sim \ F(I-1, N-I)$
– ${\rm{F}}_2 = \frac{SSK/(K-1)}{SSE/(N-I)(K-1)} \ \sim \ F(K-1, (N-1)(K-1))$
– ${\rm{F}}_3 = \frac{SS_{I \times K}/(I-1)(K-1)}{SSE/(N-I)(K-1)} \ \sim \ F((I-1)(K-1), (N-I)(K-1))$
4 다변량 접근법
다변량 접근법이란, 말그대로 반복측정 자료를 다변량 자료로 간주하고 접근하여 다변량 분산분석(multivariate ANOVA)을 통해 분석을 진행하는 방식을 말합니다. 즉, 반복된 측정치들을 다변량 반응벡터로 취급하여 종속변수들의 상관관계를 인정한채로 분석을 진행하기 때문에, 일변량 분석보다 구형성 가정에 대해 로버스트(robust) 하다고 할 수 있습니다. 예를 들어 표 1.1 고혈압 자료의 경우, 각 집단의 다변량 반응벡터는 (0주 혈압 측정치, 4주후 혈압 측정치, 8주후 혈압 측정치)$^`$가 되는 것입니다.
다변량 분석의 결과는 반복요인에 대해 Wilk’s Lambda, Pillai’s Trace, Hotelling-Lawley, Roy’s Greatest Root의 4가지 검정통계량을 제시해주며, 각 검정통계량의 p-value가 작을수록 귀무가설을 기각시킬 수 있는 가능성이 커집니다. 그리고, 처리 요인의 경우에는 반복측정 분산분석을 통한 일변량 분석의 처리요인에 대한 검정 결과와 동일한데, 이는 다변량 분산분석이 반복요인에 대한 오차항의 구형성 조건이 만족되지 않을 때 실시하는 분석방법이기 때문에, 반복요인이 아닌 처리에 대해서는 오차항의 구형성 조건을 검정할 필요가 없고 따라서 굳이 다변량 분석을 수행하지 않아도 되기 때문입니다.
5 RCBD와의 관계
사실 반복측정 분산분석이 RCBD(randomized complete block design, 랜덤화 완전 블록 설계)와 직접적인 관계가 있는 것은 아닙니다. 그럼에도 불구하고 RCBD와의 관계를 짚고 넘어가려는 이유는, 표 1.1과 같은 시점에 따른 반복측정과 처리요인이 존재하는 자료 형태가 아닌, 간혹 존재하는 측정 시점 자체 하나만을 요인으로 간주하는 반복측정 자료와 그에 따른 모형식이 RCBD의 자료 형태 및 모형식과 상당히 유사하기 때문입니다. 예를 들어, 측정 시점만을 하나의 요인으로 간주하는 반복측정 자료의 예는 다음과 같습니다:
표 3.1 측정 시점을 요인으로 하는 반복측정 자료
해당 자료는 한 운동 프로그램의 체중 감량 효과를 측정하기 위해 개인의 체중을 3개의 시점(0주, 4주, 8주)에서 측정한 결과입니다. 0주는 운동 시작 전 몸무게, 4주, 8주는 각각 운동프로그램을 주 5회 수행하기 시작한 뒤의 4주 후, 8주 후 몸무게에 해당합니다. 이 반복측정 자료의 분석 목표는 “몸무게 측정 시점에 따라 몸무게 차이가 있는 가?”입니다. 즉, 운동 프로그램의 체중 감량 효과를 보는 것이죠. 이러한 디자인은 관심요인과 블록요인이 각각 하나인 RCBD와 상당히 유사합니다. 관심요인은 체중, 블록요인은 개체(사람)으로 볼 수 있겠죠. 모형식을 써봐도 상당히 유사합니다. 먼저, 식 (1)의 형태로 따라 써보면 다음과 같습니다:
\begin{equation} y_{ij} = \mu + \beta_j + \gamma_{k} + \epsilon_{ij} \\ j = 1, \cdots, 10; \ k = 1, 2, 3 \end{equation}
표 3.1을 RCBD라고 생각하고 모형식을 써보면 다음과 같습니다:
\begin{equation} y_{ij} = \mu + \beta_i + \tau_j + \epsilon_{ij} \\ i = 1, \cdots, 10; \ j = 1, 2, 10 \end{equation}
여기서 $\beta$는 $i$번째 블록효과, $\tau$는 $j$번째 수준의 처리효과에 해당합니다. 식 (3)과 (4)는 표현 문자만 다를 뿐, 모형식 자체는 정확하게 일치합니다. 예를 들어, 표 3.1 자료가 R을 이용하여 반복측정 분산분석과 RCBD를 수행하면, 둘의 분산분석표는 정확하게 같을겁니다. 그러나, 둘 간의 가장 큰 차이점은 진행되는 분석에서 내포되어 있는 가정에서 발생합니다. 반복측정 분산분석의 경우 반복측정된 자료의 특성을 반영하여 처리 그룹간에 어느정도의 상관(correlation)이 존재하는 것을 반영하여 오차항에 구형성 가정을 하며, 반대로 RCBD의 경우 처리 그룹간 독립을 가정하여 오차항을 평균이 0이고 분산이 $I \sigma^2$인 정규분포를 따른다고 가정합니다. 사실 실제 표 3.1과 같은 자료를 다루는 상황에서, 분석자가 반복측정 분산분석을 사용할 지, RCBD를 사용할 지 고민하는 일은 없을 거라 생각됩니다. 측정 시점 그 자체가 하나의 요인이라면 반복측정 자료임은 자명하기 때문이죠. 그저 혼자 공부를 하며 반복측정 자료의 여러 형태들을 들여다보다가, 표 3.1과 같은 형태는 그 형태가 반복측정이라는 것을 제외하면 RCBD의 자료 구조와 상당히 유사하여 그 근본적인 차이를 알아보기 위해 여기까지 오게 됐습니다.😂 이 글을 읽으시는 분들은 그러한 조금의 혼동도 없길 바라는 마음입니다.😃
Summary
이번 글에서는 반복측정 분산분석을 주제로 하여, 반복측정 자료에 대한 전반적인 분석 방법에 대해 알아보았습니다. 마지막으로 반복측정 자료에 대한 분석 과정을 간략하게 요약하고 글을 마치겠습니다.
i) 결측치 사전 제거 및 반응치(반응변수)에 대한 정규성 가정 검토
ii) 구형성 가정 검토
iii) 분석 수행
– 구형성 가정 만족: 반복측정 분산분석을 이용한 일변량 분석 수행
– 구형성 가정이 크게 벗어나지 않음: Greenhouse-Geisser 등의 방법을 이용한 수정된 일변량 분석 수행
– 구형성 가정 만족X: 다변량 분산분석 수행
iiii)
– 구형성 가정이 만족될 경우, 단변량 분석을 수행하면 처리 효과의 차이를 감지해내는 능력인 검정력이 떨어짐
– 다변량 분석은 공분산 행렬에 아무런 가정없이 가능하지만, 개체의 수가 적은 경우 검정력이 매우 떨어짐. 따라서, 구형성 가정이 만족이 안되더라도 아주 크게 벗어나지 않는다면 어느정도의 수정을 거쳐 일변량 분석을 수행하는 것이 좋은 방안임(Greenhouse-Geisser, Huynh-Feldt 방법 등)
📝 참고 문헌
[1] 이재원, 박미라, 유한나. (2006). 생명과학연구를 위한 통계적 방법. 자유아카데미 [2] 나종화. (2017). R 응용 다변량분석. 자유아카데미 [3] statistics.laerd.com/statistical-guides/repeated-measures-anova-statistical-guide.php
반복측정 분산분석 (repeated measures ANOVA)
📌 반복측정 분산분석 (repeated measures ANOVA)
동일한 대상에 대해 여러 번 반복측정하여 반복측정 집단 간에 차이가 존재하는지 검정
일반적 형태의 분산분석은 다른 집단에 속한 대상들 간의 집단 간 차이를 검정하는 반면에 반복측정 분산분석은 동일한 대상에 대한 검정이다.
CO2
식물이 저온 성장환경에서 견디는 정도 Quebec 지역 나무와 Mississippi 지역 나무 간의 이산화탄소 흡수율에 따라 차이가 있는지 검정
7개의 서로 다른 이산화탄소 농도에 따라 흡수율에 차이가 있는지 검정
나무 출신 지역과 이산화탄소 읍수율의 관계가 농도에 따라 달라지는지 검정
uptake (종속변수) : 이산화탄소 흡수율
Type (독립변수), conc (독립변수) : 나무의 출신 지역, 이산화탄소 농도
Type (집단 간 요인)
conc (집단 내 요인) => 반복적으로 측정된 값
Treatment : 저온처리 여부
Plant : 나무의 고유 식별
> str ( CO2 ) Classes ‘nfnGroupedData’ , ‘nfGroupedData’ , ‘groupedData’ and ‘data.frame’ : 84 obs . of 5 variables : $ Plant : Ord . factor w / 12 levels “Qn1” < "Qn2" < "Qn3" < . . : 1 1 1 1 1 1 1 2 2 2 . . . $ Type : Factor w / 2 levels "Quebec" , "Mississippi" : 1 1 1 1 1 1 1 1 1 1 . . . $ Treatment : Factor w / 2 levels "nonchilled" , "chilled" : 1 1 1 1 1 1 1 1 1 1 . . . $ conc : num 95 175 250 350 500 675 1000 95 175 250 . . . $ uptake : num 16 30.4 34.8 37.2 35.3 39.2 39.7 13.6 27.3 37.1 . . . - attr ( * , "formula" ) = Class 'formula' language uptake ~ conc | Plant . . . . - attr ( * , ".Environment" ) = < environment : R_EmptyEnv > – attr ( * , “outer” ) = Class ‘formula’ language ~ Treatment * Type . . . . – attr ( * , “.Environment” ) = < environment : R_EmptyEnv > – attr ( * , “labels” ) = List of 2 . . $ x : chr “Ambient carbon dioxide concentration” . . $ y : chr “CO2 uptake rate” – attr ( * , “units” ) = List of 2 . . $ x : chr “(uL/L)” . . $ y : chr “(umol/m^2 s)”
> CO2sub < - subset ( CO2 , Treatment == "chilled" ) > CO2sub$conc < - factor ( CO2sub$conc ) > str ( CO2sub ) Classes ‘nfnGroupedData’ , ‘nfGroupedData’ , ‘groupedData’ and ‘data.frame’ : 42 obs . of 5 variables : $ Plant : Ord . factor w / 12 levels “Qn1” < "Qn2" < "Qn3" < . . : 4 4 4 4 4 4 4 6 6 6 . . . $ Type : Factor w / 2 levels "Quebec" , "Mississippi" : 1 1 1 1 1 1 1 1 1 1 . . . $ Treatment : Factor w / 2 levels "nonchilled" , "chilled" : 2 2 2 2 2 2 2 2 2 2 . . . $ conc : Factor w / 7 levels "95" , "175" , "250" , . . : 1 2 3 4 5 6 7 1 2 3 . . . $ uptake : num 14.2 24.1 30.3 34.6 32.5 35.4 38.7 9.3 27.3 35 . . > CO2sub Plant Type Treatment conc uptake 22 Qc1 Quebec chilled 95 14.2 23 Qc1 Quebec chilled 175 24.1 24 Qc1 Quebec chilled 250 30.3 25 Qc1 Quebec chilled 350 34.6 26 Qc1 Quebec chilled 500 32.5 27 Qc1 Quebec chilled 675 35.4 28 Qc1 Quebec chilled 1000 38.7 29 Qc2 Quebec chilled 95 9.3 30 Qc2 Quebec chilled 175 27.3 31 Qc2 Quebec chilled 250 35.0 32 Qc2 Quebec chilled 350 38.8 33 Qc2 Quebec chilled 500 38.6 34 Qc2 Quebec chilled 675 37.5 35 Qc2 Quebec chilled 1000 42.4 36 Qc3 Quebec chilled 95 15.1 37 Qc3 Quebec chilled 175 21.0 38 Qc3 Quebec chilled 250 38.1 39 Qc3 Quebec chilled 350 34.0 40 Qc3 Quebec chilled 500 38.9 41 Qc3 Quebec chilled 675 39.6 42 Qc3 Quebec chilled 1000 41.4 64 Mc1 Mississippi chilled 95 10.5 65 Mc1 Mississippi chilled 175 14.9 66 Mc1 Mississippi chilled 250 18.1 67 Mc1 Mississippi chilled 350 18.9 68 Mc1 Mississippi chilled 500 19.5 69 Mc1 Mississippi chilled 675 22.2 70 Mc1 Mississippi chilled 1000 21.9 71 Mc2 Mississippi chilled 95 7.7 72 Mc2 Mississippi chilled 175 11.4 73 Mc2 Mississippi chilled 250 12.3 74 Mc2 Mississippi chilled 350 13.0 75 Mc2 Mississippi chilled 500 12.5 76 Mc2 Mississippi chilled 675 13.7 77 Mc2 Mississippi chilled 1000 14.4 78 Mc3 Mississippi chilled 95 10.6 79 Mc3 Mississippi chilled 175 18.0 80 Mc3 Mississippi chilled 250 17.9 81 Mc3 Mississippi chilled 350 17.9 82 Mc3 Mississippi chilled 500 17.9 83 Mc3 Mississippi chilled 675 18.9 84 Mc3 Mississippi chilled 1000 19.9
📌 반복측정 분산분석
반복측정 일원분산분석 : y ~ W + Error(Subject/W)
반복측정 이원분산분석 : y ~ B * W + Error(Subject/W)
B는 집단 간 요인, W는 집단 내 요인을 의미하고,
Subject는 각 층정 대상에 대한 식별자 변수를 의미한다.
> CO2sub . aov < - aov ( uptake ~ Type * conc + Error ( Plant / conc ) , data = CO2sub ) > summary ( CO2sub . aov ) Error : Plant Df Sum Sq Mean Sq F value Pr ( > F ) Type 1 2667.2 2667.2 60.41 0.00148 ** Residuals 4 176.6 44.1 – – – Signif . codes : 0 ‘ ** * ’ 0.001 ‘ ** ’ 0.01 ‘ * ’ 0.05 ‘ . ’ 0.1 ‘ ’ 1 Error : Plant : conc Df Sum Sq Mean Sq F value Pr ( > F ) conc 6 1472.4 245.40 52.52 1.26e-12 ** * Type : conc 6 428.8 71.47 15.30 3.75e-07 ** * Residuals 24 112.1 4.67 – – – Signif . codes : 0 ‘ ** * ’ 0.001 ‘ ** ’ 0.01 ‘ * ’ 0.05 ‘ . ’ 0.1 ‘ ’ 1
Type 변수의 p-value가 유의하다. 귀무가설을 기각한다.
나무의 출신지역에 따라 이산화탄소의 흡수율이 다르다.
conc 변수의 p-value가 유의하다. 귀무가설을 기각한다.
이산화탄소 농소에 따라 이산화탄소의 흡수율이 다르다.
상호작용효과 Type:conc의 p-value가 유의하다. 귀무가설을 기각한다.나무 출신 지역과 이산화탄소 농도의 상호작용 효과가 존재한다.
> windows ( width = 12 , height = 8 ) > boxplot ( uptake ~ Type * conc , data = CO2sub , + col = c ( “deepskyblue” , “violet” ) )
Quebec 나무에 대해서만 축이 나타나고 Mississippi에 대해서는 나타나지 않았다. 그래프를 좀 더 보기 좋게 다듬어 보자.
> boxplot ( uptake ~ Type * conc , data = CO2sub , + col = c ( “deepskyblue” , “violet” ) , + las = 2 , cex . axis = 0.7 , + xlab = “” , ylab = “Carbon dioxide wptake rate” , + main = “Effects of Plant Type and CO2 on Carbon Dioxide uptake” ) > legend ( “topleft” , inset = 0.02 , + legend = c ( “Quebec” , “Mississippi” ) , + fill = c ( “deepskyblue” , “violet” )
Quebec 나무가 Mississippi 나무보다 이산화탄소 흡수율이 높다.
이산화탄소 농도가 증가함에 따라 이산화탄소 흡수율도 증가한다.
> library ( HH ) > interaction2wt ( uptake ~ Type * conc , data = CO2sub )
대각선 주효과
비대각선 상호작용효과
보다 신뢰할 만한 분석 결과를 얻기 위해서는 비록 동일한 대상에 대해 시점을 달리하여 반복적으로 측정된 데이터이긴 하지만, 모든 반복 차수 간의 관련성의 정도는 일정해야 한다.
키워드에 대한 정보 반복 측정 분산 분석
다음은 Bing에서 반복 측정 분산 분석 주제에 대한 검색 결과입니다. 필요한 경우 더 읽을 수 있습니다.
이 기사는 인터넷의 다양한 출처에서 편집되었습니다. 이 기사가 유용했기를 바랍니다. 이 기사가 유용하다고 생각되면 공유하십시오. 매우 감사합니다!
사람들이 주제에 대해 자주 검색하는 키워드 7-1 Repeated Measure ANOVA (반복 측정 분산분석)이란?
- 통계
- 통알못
- 기초통계학
- 분산분석
- 반복측정 분산분석
- ANOVA
- Repeated Measure ANOVA
- 논문
- 논문통계
- 실험논문
- p값
- 통계튜브
7-1 #Repeated #Measure #ANOVA #(반복 #측정 #분산분석)이란?
YouTube에서 반복 측정 분산 분석 주제의 다른 동영상 보기
주제에 대한 기사를 시청해 주셔서 감사합니다 7-1 Repeated Measure ANOVA (반복 측정 분산분석)이란? | 반복 측정 분산 분석, 이 기사가 유용하다고 생각되면 공유하십시오, 매우 감사합니다.