표준 편차 표준 오차 | 표준오차가 뭔가요? 표준편차랑 다른건가요? 상위 185개 답변

당신은 주제를 찾고 있습니까 “표준 편차 표준 오차 – 표준오차가 뭔가요? 표준편차랑 다른건가요?“? 다음 카테고리의 웹사이트 https://you.charoenmotorcycles.com 에서 귀하의 모든 질문에 답변해 드립니다: https://you.charoenmotorcycles.com/blog/. 바로 아래에서 답을 찾을 수 있습니다. 작성자 통계의 본질 EOStatistics 이(가) 작성한 기사에는 조회수 18,217회 및 좋아요 341개 개의 좋아요가 있습니다.

표준 편차 표준 오차 주제에 대한 동영상 보기

여기에서 이 주제에 대한 비디오를 시청하십시오. 주의 깊게 살펴보고 읽고 있는 내용에 대한 피드백을 제공하세요!

d여기에서 표준오차가 뭔가요? 표준편차랑 다른건가요? – 표준 편차 표준 오차 주제에 대한 세부정보를 참조하세요

내용 설명
https://hsm-edu.tistory.com/794
표본평균의 평균이 모평균인 이유
(https://www.youtube.com/watch?v=Je62uPML0L0)
표본평균의 분산이 모분산/n인 이유 (https://www.youtube.com/watch?v=WfiRjHATlrg)
#통계강의 #통계

표준 편차 표준 오차 주제에 대한 자세한 내용은 여기를 참조하세요.

표준오차가 뭔가요? 표준편차랑 다른건가요?

표준오차는 ‘추정값인 표본평균들과 참값인 모평균과의 표준적인 차이’ 정도로 이해할 수 있습니다. 수식에서 n이 커지면 표준오차가 줄어듭니다. 실제로 …

+ 더 읽기

Source: hsm-edu.tistory.com

Date Published: 3/10/2021

View: 7777

표준 편차와 표준 오차의 차이점 – 네이버 블로그

표준오차는 여러개 뽑히는 표본평균들의 편차를 뜻합니다. 표본집단만 놓고 본다면 표준편차는 ‘특정한 표본집단 내의 편차’이고.

+ 여기에 보기

Source: blog.naver.com

Date Published: 12/20/2021

View: 7282

#8 표준편차와 표준오차 – SLOG

표준편차(standard deviation)와 표준오차(standard error)에 대해 확실하게 … 표본분산과 표본표준편차의 식은 다음과 같이 정의할 수 있습니다:.

+ 여기에 더 보기

Source: be-favorite.tistory.com

Date Published: 10/7/2021

View: 8117

표준 오차 개념과 공식, 그리고 계산 방법 – ilovemyage

표준 오차 SEM(Standard Error of Mean)은 측정값의 정확도 범위를 표현하기 위해 사용됩니다. 표준 오차는 표본 평균에 대한 표준 편차로서 일반적 …

+ 여기에 보기

Source: ballpen.blog

Date Published: 2/17/2021

View: 8263

표준 오차 | 과학문화포털 사이언스올

표준 오차는, 표본 크기 n의 제곱근의 반비례(1/√n)하며, 모집단의 표준 편차 σ보다 √n분의 1배수로 작아진다. 단, 모집단 표준편차 σ를 모를 때에는, …

+ 여기를 클릭

Source: www.scienceall.com

Date Published: 10/19/2022

View: 5555

표준오차 Standard Error – datadata.link

오차(error)는 관측한 값과 기대값(예를 들면 표본일 경우 모집단의 값)과의 편차입니다. 그래서 양수와 음수를 모두 가집니다.

+ 여기에 자세히 보기

Source: www.datadata.link

Date Published: 4/27/2021

View: 401

표준 편차와 표준 오차 – Elliot

표준오차 (SE, Standard Error) · 1. 표준오차는 표본평균의 표준편차다. (그러므로 기준이 되는 모 표준편차를 알고 있어야한다.) · 2. 표준오차는 모집단 …

+ 여기에 보기

Source: puzzle-puzzle.tistory.com

Date Published: 6/1/2021

View: 4206

표준 편차와 표준 오차의 차이 – Gadget-Info.com

표준 편차는 표준 곡선을 기준으로 한 관측치의 분포입니다. 이와 반대로, 표준 오차는 정규 곡선을 기준으로 한 추정치의 분포입니다. 표준 편차는 분산의 제곱근으로 …

+ 여기에 표시

Source: ko.gadget-info.com

Date Published: 4/19/2022

View: 4516

표준편차 – 나무위키:대문

표준 편차(standard deviation)는 분산을 제곱근한 것이다. … 표준편차의 경우 후술될 표준오차(stand error)와 함께 통계학 공부에서 제일 먼저 …

+ 여기에 더 보기

Source: namu.wiki

Date Published: 10/6/2022

View: 446

주제와 관련된 이미지 표준 편차 표준 오차

주제와 관련된 더 많은 사진을 참조하십시오 표준오차가 뭔가요? 표준편차랑 다른건가요?. 댓글에서 더 많은 관련 이미지를 보거나 필요한 경우 더 많은 관련 기사를 볼 수 있습니다.

표준오차가 뭔가요? 표준편차랑 다른건가요?
표준오차가 뭔가요? 표준편차랑 다른건가요?

주제에 대한 기사 평가 표준 편차 표준 오차

  • Author: 통계의 본질 EOStatistics
  • Views: 조회수 18,217회
  • Likes: 좋아요 341개
  • Date Published: 2019. 10. 29.
  • Video Url link: https://www.youtube.com/watch?v=TrIXkIHSqq4

표준오차가 뭔가요? 표준편차랑 다른건가요?

반응형

모집단이 있습니다. 모집단의 평균을 $\mu$(뮤), 표준편차를 $\sigma$ (시그마)라고 합시다.

모집단의 평균이 궁금한데 모집단이 너무 커서 구할 수가 없었습니다. 모집단의 평균을 추정하기 위해 모집단에서 크기가 n인 표본을 추출했습니다. 이 표본을 표본1이라고 합시다. 표본 1의 평균을 구했고 $\bar{X}_{1}$ 이라고 놓겠습니다.

이렇게 표본을 계속 뽑았습니다. 표본 평균들이 많이 구해지겠죠.

이 표본평균에는 아래와 같은 성질이 성립합니다.

$E\left [ \bar{X} \right ]$

$V\left [ \bar{X} \right ]=\frac{\sigma^2}{n}$

표본 평균의 평균이 모평균과 같다는 것과, 표본 평균의 분산이 모분산을 n으로 나눈 것과 같다는 성질입니다. 이유가 궁금하신 분들은 아래 링크에 유도과정이 있습니다.

표본평균의 평균이 모평균과 같은 이유 → https://hsm-edu.tistory.com/14

표본평균의 분산이 모분산과 같은 이유 → https://hsm-edu.tistory.com/16

이때 표본평균의 표준편차를 ‘표준오차’라고 합니다.

$\sigma \left [ \bar{X} \right ]=standard \ error=\frac{\sigma}{\sqrt{n}}$

왜 표준오차라는 말이 붙었을까요. 수식의 의미를 이해하면 왜 표준오차인지를 알 수 있습니다.

표본평균의 표준편차 아래와 같이 구합니다.

$\sigma \left [ \bar{X} \right ]=\sqrt{E\left [ \left ( \bar{X}-\mu \right )^2 \right ]}$

표준편차는 편차의 제곱의 평균에 루트를 씌운 값입니다. 편차는 변량에서 평균을 뺀 값입니다.

편차 = 변량-평균

표준편차는 변량들이 평균에서 얼마나 떨어져 있는지를 나타내주는 값입니다. 표본평균의 표준편차를 구하는 상황에서 변량은 표본평균입니다. 표본평균은 모평균에 대한 추정값입니다. 이때 모평균을 참값이라고 부릅니다. 따라서 (변량-평균)이, (추정값-참값)을 의미하게 됩니다. (추정값-참값)은 ‘오차’입니다.

편차(변량-평균)의 제곱의 평균에 루트를 씌운 값이 ‘표준편차’ 인 것처럼

오차(추정값-참값)의 제곱의 평균에 루트를 씌운 것이 ‘표준오차’ 가 된 것입니다.

표준오차는 ‘추정값인 표본평균들과 참값인 모평균과의 표준적인 차이’ 정도로 이해할 수 있습니다.

수식에서 n이 커지면 표준오차가 줄어듭니다. 실제로 표본을 뽑는 상황을 생각해봅시다. 모집단에서 크기가 큰 표본을 뽑을 수록 모집단과 가까워지겠죠? 따라서 오차는 줄어들 것입니다. 직관적으로도 성립합니다.

반응형

표준 편차와 표준 오차의 차이점

통계학을 공부하다 보면

가끔 헷갈리는 개념들을 접하게 됩니다.

뒤에 ‘분석’이 붙는 상관분석, 분산분석, 회귀분석 등등

‘분포’가 붙는 T분포, Z분포, 카이제곱 분포 등등….

또, 같은 단어가 들어가지 않더라도 괜히 헷갈리는 ‘변동계수’나 ‘신뢰구간’같은 개념들.

한 번 쭈욱 훑어보아도 접할 때마다 새롭죠.

제가 통계학에 관련된 포스팅을 하기 시작한 이유이기도 하고요.

학부 시절에 통계학을 공부하면서 헷갈렸던 개념들, 그리고 개인적으로 정리해두고 싶은 개념들

이 모두를 그때그때 생각날 때 쓰기도 했고, 따로 메모해뒀다가 순서대로 쓰기도 해왔습니다.

최근에는 통계학을 공부하거나 좀 깊이있게 활용할 일이 없어서 관련 포스팅을 잠시 미뤘었는데

얼마전에 기사에서 ‘표준 오차’라는 단어를 오랜만에 접하게 되었습니다.

사실 공부할 때도 ‘오차’와 ‘편차’가 대체 뭐가 다른지 한 번도 생각해보지 않았었는데요.

오랜만에 포스팅도 할 겸 개인적으로 다시 한 번 되짚어 보기로 했습니다.

보통 여론 조사 결과를 발표하는 기사에서 이런 문장을 접하게 됩니다.

“이번 조사의 표준오차는 +/ – 3.9% 포인트다.”

대부분 기사의 마지막에 등장하는 문장인데요.

자세히는 모르겠지만 오차니까 저 범위가 적으면 적을수록 좋다는 건 알겠네요.

통계학을 공부하게 되면, 일반적으로 표준편차라는 개념을 더 많이 접하기 때문에

표준오차라는 단어를 보면 자기도모르게 표준편차로 해석하기도 합니다.

두 개념은 서로 연관되어 있지만, 당연히 다른 개념입니다.

먼저 표준편차에 대한 설명에서부터 출발하겠습니다.

표준편차라는 것은, 모집단의 경우를 예로 들면,

모집단에 속한 다른 숫자들이 모평균과 차이나는 평균적인 정도를 말합니다.

즉, 한 집단의 숫자들이 평균을 중심으로 퍼진 정도입니다.

모집단을 대상으로 한다면 ‘모 표준편차’이고 표본집단을 대상으로 한다면 ‘표본 표준편차’인 것이죠.

자, 이렇게 모집단과 표본집단이 있습니다.

표본집단을 추출하는 이유는 모집단의 속성을 알기 힘들 경우, 즉 모집단의 크기가 매우 클 경우에

그 안에서 랜덤하게 여러번 뽑힌 표본집단들로 하여금 그 모집단을 추정하기 위함이죠.

그렇다면 뽑힌 표본집단들이 모집단을 추정하기에 적절한지는 어떻게 알 수 있을까요?

여기서 바로 표준오차를 통해 판단할 수 있습니다.

모집단의 중요한 모수인 모평균을 추정하기 위해서 표본을 추출하여 표본의 평균값을 계산하죠?

그러나 모집단의 크기에 비해 추출된 표본의 크기는 상대적으로 작습니다.

당연히 표본의 평균값은 모집단의 모평균값과 정확하게 일치하지는 않을 것입니다.

게다가 어떤 표본을 뽑느냐에 따라 표본평균값이 달라지기도 하겠죠?

이 때, 매번 뽑히는 여러 표본평균들이 얼마만큼의 변동, 즉 편차를 가지겠는가에 대한 답을 주는 것이

바로 표준오차입니다.

즉, 표본평균들의 표준편차인 셈이죠.

표본평균들의 평균, 그러니까 표본평균들의 기댓값은 모평균이죠?

따라서 표준오차가 작다는 말은 뽑힌 표본평균들 간의 편차가 작다는 뜻이고

이는 표본평균들이 모평균과 큰 차이가 나지 않는다는 뜻으로 받아들일 수 있다는 것입니다.

그래서 표준오차가 작다면 표본평균들로 모평균을 추정한다는 사실을 의심할 필요가 적어지겠죠.

그러나, 일반적으로 표본추출은 단 한번 시행합니다.

따라서 표본평균도 하나가 나올 것이고, 표준오차를 계산할 수도 없겠죠.

표본평균이 여러개가 있어야 그들의 편차를 계산할 테니까요.

하지만 그럼에도 불구하고 이론적으로는 표준오차를 계산할 수가 있습니다.

그 공식은 다음과 같이 매우 간단합니다.

표본 표준편차를 원소 개수의 제곱근으로 나누어준 값이죠.

이처럼 단 하나의 표본 표준편차 값만 있더라고 표준 오차를 ‘이론적으로는’ 계산할 수 있습니다.

정리하자면, 표준편차는 모집단이건 표본집단이건 그 안의 숫자들의 편차를 뜻하고

표준오차는 여러개 뽑히는 표본평균들의 편차를 뜻합니다.

표본집단만 놓고 본다면 표준편차는 ‘특정한 표본집단 내의 편차’이고

표준오차는 ‘표본집단들 (평균)간의 편차’라고 할 수 있겠네요.

여론조사에서 A당 지지율이 30%고, B당 지지율이 70%인데

“표준오차는 +/-1%p이다.”라고 한다면

이 여론조사 결과는 매우 신뢰성이 높다고 할 수 있겠죠?

사실 중요한 정보입니다.

여론조사 내용이 뭐든 간에 그걸 신뢰할 수 없다면 아무 소용이 없으니까요.

왜 항상 기사의 마지막에 표준오차 값이 등장하는지 이제야 알겠네요.

#8 표준편차와 표준오차

❗️블로그 옮김: https://www.taemobang.com

표준편차(standard deviation)와 표준오차(standard error)에 대해 확실하게 정리합시다. 먼저 우리가 자료를 얻었을 때 주로 관심있는 것은 자료의 중심과 퍼짐성을 요약할 수 있는 특성값들로, 일반적으로 자료의 중심은 평균(mean), 자료의 퍼짐성을 잴 때는 분산 또는 표준편차를 사용합니다. 따라서 모집단에는 모평균 $\mu$, 모분산 $\sigma^2$, 모표준편차 $\sigma$가 중요한 특성값이며, 이들의 추정에 사용할 수 있는 좋은 통계량(statistic)이 각각 표본평균 $\bar{X}$, 표본분산 $s^2$, 표본표준편차 $s$에 해당합니다.

표준편차

표준편차란, 원시 자료(raw data)의 퍼짐성을 재는 측도라고 할 수 있습니다. 원시 자료의 퍼짐성은 모분산으로 측정할 수 있으나, 실제 문제에서 모분산에 대한 정보가 있는 경우는 드물다고할 수 있습니다. 그래서, 이 모분산의 좋은 추정값으로 우리는 표본분산 $s^2$을 이용합니다. 표본분산은 표본표준편차 $s$의 제곱 형태로 주어지는데, 통계분석시 분산이 직접적으로 사용되는 경우가 드뭅니다. 즉, 통계추론의 목적으로는 대부분의 경우 분산보다는 표준편차가 이용됩니다. 그 이유는 표준편차가 자료의 원 단위와 일치하기 때문입니다($\because$ 편차제곱항들의 평균에 루트를 씌운 형태이므로). 표본분산과 표본표준편차의 식은 다음과 같이 정의할 수 있습니다:

표본분산 $s^2 = \frac{1}{n-1}\sum_i^n (Y_i – \bar{Y})^2$

표본표준편차 $s = \sqrt{s^2} = \sqrt{\frac{1}{n-1}\sum_i^n (Y_i – \bar{Y})^2} $

표본 수 $n$이 아닌 $n-1$로 나눠주는 이유는, $n-1$로 나눈 형태가 불편성(unbiasedness)을 만족하는 추정량이기 때문입니다.

표준오차

표준오차는 근본적으로 통계량에 관한 특성값입니다. 즉, “모평균의 표준오차”라는 말은 존재하지 않습니다. 우리가 자료로부터 통계량의 표준편차를 추정하게 될 때, 우리는 이를 (통계량의) 표준오차라고 부릅니다. 설명의 편의를 위해 통계량을 표본평균이라고 해보겠습니다. 표본평균은 수집된 자료(관측자료, 원시자료)의 중심을 나타내는 값이라 할 수 있습니다. 그러나, 통계 분석에서는 자료의 중심위치를 나타내는 평균뿐만이 아닌, 자료의 변동(variability)에 관한 정보를 제공하는 것도 매우 중요합니다. 통계 추론에 점 추정뿐만이 아닌 구간 추정이 존재하는 이유도 이러한 이유에서 입니다. 그래서, 우리는 이 표본평균 $\bar{X}$의 퍼진 정도를 나타낼 수 있는 측도가 필요하며, 표준오차가 바로 그 측도에 해당합니다. 정확하게 말하면 표본평균의 표준오차에 해당하겠죠. 조금 더 다르게 말해보면, 표본평균의 표준편차를 추정하게 될 때 사용하는 값이 표본평균의 표준오차라고 할 수 있겠습니다. 표준오차는 S.E(stantard error)로 나타내며, 표본평균의 표준오차는 다음과 같이 계산할 수 있습니다. 표본평균의 표준오차에 대한 추정값은 곧 표본평균의 표준편차라고 했습니다:

S.E($\bar{X}$) $= \sqrt{\textrm{Var}(\bar{X})} = \sqrt{\textrm{Var}(\frac{1}{n}\sum X_i)} = \sqrt{\frac{1}{n^2}\textrm{Var}(\sum X_i)} = \sqrt{\frac{1}{n^2} ns^2} = \frac{s}{\sqrt{n}}$

즉, 표본평균의 표준오차를 $\frac{s}{\sqrt{n}}$으로 정의함은 당연한 것입니다. 그리고, 대부분의 검정통계량, 신뢰구간 추정의 계산은 표본평균에 기반한 값들로 이루어지기 때문에, 보통 “표본평균의” 표준오차가 아닌 “표준오차”라고만 칭합니다. 앞서 서술한 말들을 잘 이해하셨다면, 이제는 표준오차가 $\frac{s}{\sqrt{n}}$으로 주어지는 것에 대한 이해의 찝찝함이 충분히 풀어지셨을거라 생각합니다. 아울러, 위 말들을 잘 곱씹어보면 표준오차의 식이 $\frac{s}{\sqrt{n}}$인 것은 따로 외우려고 노력하지 않아도, 머릿 속에 들어오실겁니다.

표본평균의 퍼짐성? 변동?

마지막으로 표본평균의 퍼짐성, 변동을 측정한다는 말이 이해가 안되는 분들, 또는 그 필요성이 이해가 안되는 분들을 위해 한 가지 예를 들어 부연 설명을 해보겠습니다. 한 사람에게 A 고등학교의 남학생 평균 키를 100명을 대상으로 계산을 시켰다고 합시다. 이때 평균이 170이 나왔고, 이를 다른 사람에게 똑같이 시켰더니 172.5가 나왔습니다. 즉, 상식적으로 임의의 모집단에 대해 여러번의 샘플링을 했을 때 매번 같은 표본 평균이 나올 수는 없으며, 퍼짐이 존재하는 것은 당합니다. 그리고, 퍼짐이 존재함은 일정한 분포(distribution) 형태를 가질 수 있음을 말합니다. 아울러, 우리가 이론적 관점에서 바라보아도 표본평균은 분포를 가짐이 당연합니다. 그 이유는 $\bar{X} = \frac{1}{n}\sum X_i = \frac{1}{n}(X_1 + \cdots + X_n)$으로 즉 $\bar{X}$는 확률변수들의 선형결합의 형태이므로 통계량에 해당하기 때문이죠 . 통계학을 접근할 때 기본적으로 알아두어야 가장 중요한 개념 중 하나는 확률변수는 분포를 가진다는 점입니다. 즉, 통계량도 분포를 가지므로 표본평균이 분포를 가지고 퍼짐이 존재하는 것은 당연하며, 그에 따라 분포의 중심뿐만이 아닌 퍼짐에 대한 추정을 수행하는 것 또한 꼭 필요로 된다고 할 수 있습니다.

📝참고문헌

[1] 성내경 (2012). 실험설계와 분석 2판. 자유아카데미

[2] <슬기로운 통계생활> on Youtube

표준 오차 개념과 공식, 그리고 계산 방법

Last Updated on 2021-10-31 by BallPen

표준 오차를 도입하는 배경, 개념이 궁금합니다. 또한 표준 오차의 계산은 어떻게 할 수 있을까요?

표준 오차 개념을 이해하는 것은 측정값의 정확도를 올바르게 표기하는데 있어 아주 중요합니다. 계산은 비록 어렵지 않으나 그 개념을 이해하기는 쉽지 않습니다.

함께 표준 오차의 배경과 개념, 그리고 계산 방법을 알아보겠습니다. 목차는 다음과 같습니다.

1. 정확도와 정밀도의 계산과 표기 방법에 대한 복습

이전 포스트에서 측정 결과의 정확도와 정밀도에 대한 개념, 계산, 표기 방법에 대해 설명드린 바 있습니다. 간단히 복습을 하는 것이 표준 오차에 대한 이해도를 높일 수 있어요.

각각의 구체적인 계산법은 이전 포스트를 참고하세요.

1-1. 정확도

정확도는 측정값들이 한쪽으로 몰리는 일이 적은 정도를 나타내며, 표기하는 방법은 아래의 세가지 방법 중 하나를 적용하면 됩니다.

– 평균값과 참값의 백분율로 구하는 방법

측정값들의 평균값을 \(\mu\), 참값을 \(X\)라 할때 정확도는 다음과 같습니다.

$$

\tag{1} 정확도(\%) = {{\mu}\over{X}} \times 100

$$

– 절대오차

측정값을 \(x\), 참값을 \(X\)라 할 때 절대오차 \(\epsilon\)은 다음과 같습니다.

$$

\tag{2} \epsilon = x-X

$$

– 상대오차

상대오차 또는 백분율오차는 다음과 같습니다.

$$

\tag{3} 상대오차(\%) = {{|\epsilon|}\over{X}} \times 100

$$

1-2 정밀도

정밀도는 측정값들의 퍼짐이 좁은 정도를 나타내며, 표기하는 방법은 아래의 네가지 방법 중 하나를 적용하면 됩니다.

– 상대표준편차

측정값의 표준편차를 \(\sigma\), 평균값을 \(\mu\)라 했을 때 상대표준편차 \(\% \mathrm{RSD}\)는 다음과 같습니다.

$$

\tag{4} \% \mathrm{RSD} = {{\sigma}\over{\mu}} \times 100

$$

– 측정값의 범위를 이용한 정밀도 계산과 표기

측정값의 최대값인 \(x\)(max)과 최소값인 \(x\)(min)으로 range를 구한 후 ‘평균값\(\pm\)range’로 표기합니다.

$$

\tag{5} Range = x(\mathrm{max})-x(\mathrm{min})

$$

– 평균편차를 이용한 정밀도 계산과 표기

측정값을 \(x\), 측정값의 평균을 \(\mu\)라 했을 때, 평균편차 \(\bar d\)를 계산한 후 ‘평균값\(\pm\)\(\bar d\)’로 표기합니다.

$$

\tag{6} \bar d = {{\Sigma |x-\mu|}\over{n}}

$$

– 표준편차를 이용한 정밀도 계산과 표기

모집단 표준편차 \(\sigma\) 또는 표본 표준편차 \(s\) 를 계산한 후 ‘평균값\(\pm\)표준편차’로 표기합니다.

$$

\begin{align}

\tag{7}

\sigma = \sqrt{{\Sigma (x-\mu)^2}\over{n}}= \sqrt{Var[x]} ~ (모집단 표준편차) \\

\end{align}

$$

$$

\tag{8} s = \sqrt{{\Sigma (x-\mu)^2}\over{n-1}} ~ (표본 표준편차)

$$

(7)식에서 주어진 \(Var[x]\)는 모집단의 \(x\)에 대한 분산을 뜻합니다.

2. 표준 오차 도입 배경

앞의 내용으로 이미 이해하셨겠지만 정확도는 오차로 평가되고, 정밀도는 편차로 평가됩니다.

또한 정밀도는 측정값들의 평균값과 결합하여 ‘평균값\(\pm\)정밀도’의 형식으로 표기되어 사람들에게 정밀한 정도에 대한 정보를 제공합니다. 물론 정밀도를 무엇으로 구했는지는 별도 표기를 해주어야 합니다.

그런데 여기서 한가지 궁금한 사항이 있습니다. 정확도에서 오차를 구하기 위해서는 참값이 필요한데 참값을 모르는 경우가 많습니다.

예를 들어 어느 물체가 있다고 하겠습니다. 그 물체의 질량을 알고 싶어 저울을 이용해 측정했습니다. 총 6번을 측정했어요.

12.0, 12.3, 11.8, 11.9, 12.4, 12.1 kg

위 측정 결과로부터 정밀도를 계산할 수 있을 것입니다. 또 평균값 \(\mu\)도 계산할 수 있어요.

그런데 오차의 범위는 어떻게 구할 수 있을까요? 참값을 우리가 알고 있다면 오차를 명확하게 구할 수 있을텐데요. 보통은 참값을 모르는 경우가 많습니다.

결국 우리가 어느 측정값을 표기하기 위해서는 정밀도 뿐만 아니라 오차의 범위도 제시할 필요가 있습니다. 왜냐하면 정확한 참값을 모르기 때문입니다. 이러한 배경에서 출발한 것이 표준오차가 되겠습니다.

3. 표준 오차 개념

어느 물체의 질량을 측정하기 위해 저울을 이용합니다. 이때 하나의 저울을 이용해 어느 사람이 측정한 값들의 세트인 \(X_1\)이 아래에 주어져 있습니다.

\(X_1\) = {12.0, 12.3, 11.8, 11.9, 12.4, 12.1 kg}

이 값의 평균은 12.1 kg 입니다. 이 값이 참값일까요? 아닙니다. 바로 이 값들에는 계통오차가 들어가 있기 때문에 참값이라고 할 수 없습니다. 그렇다면 계통오차를 제거하여 참값을 도출하는 방법은 무엇일까요? 바로 아래에서 설명할 표본 평균의 평균이라는 값을 이용합니다.

그렇다면 표본 평균의 평균을 참값으로 간주한다면 위에서 측정한 측정값들의 표준편차를 구할 수 있을 것입니다. 이것이 표준 오차(Standard Error of Mean, SEM, 평균오차로 불리기도 함)입니다.

우선 단계적으로 표본 평균의 평균을 구하는 방법을 설명드리고 표준오차를 정의하는 방법을 구체적으로 설명드립니다.

3-1. 표본 평균의 평균

(1단계) \(n\)명의 사람들이 자신의 저울을 이용하여 각각 물체의 질량을 \(n\)번 측정한다고 생각하세요. 그러면 \(n\)개의 표본이 생기는 것입니다. 그러면 \(X_1\), \(X_2\), \(X_3\), \(\ldots\), \(X_n\)의 측정값 세트가 존재하겠죠.

(2단계) 각 측정값 세트의 평균을 내세요. 그러면 \(\bar{X}_1\), \(\bar{X}_2\), \(\bar{X}_3\), \(\ldots\), \(\bar{X}_n\)들이 구해질 것입니다. 이것이 표본 평균입니다.

(3단계) 2단계에서 구한 표본 평균들의 평균을 구하세요. 그 값을 \(k\)라고 하고, 이 값이 표본 평균의 평균값입니다.

표본 평균의 평균 \(k\)는 \(n\)개의 표본으로부터 구한 평균값이기 때문에 각 표본이 갖는 계통오차들이 서로 상쇄되어 제거된 것으로 볼 수 있습니다.

즉 어느 표본에서 양의 계통오차가 발생했다면 다른 표본에서는 같은 크기의 음의 계통오차가 발생되어 서로 상쇄되어 제거되고 결국 참값만 남게 되는 원리이죠. 물론 많은 표본을 운영할 수록 참값에 가까워집니다.

그러므로 표본 평균의 평균 \(k\)를 개념적으로 참값으로 간주합니다.

표준 오차 SEM은 표본 평균에 대한 표준편차를 뚯합니다. 각 표본의 측정세트로부터 표본 평균을 구하여 분포표가 만들어집니다. 이 표분 평균 분포표의 평균값이 참값 \(k\)로 간주됩니다. 결국 표준 오차는 \(k\)로부터 표본 평균들이 어느정도 흩어져 있는가의 척도입니다.

3-2. 표준 오차 정의

표준 오차 SEM은 표본 평균에 대한 표준편차로 정의됩니다.

그러므로 (7)식의 모집단 표준편차 공식을 그대로 사용하는데요. 다만 변수 \(x\) 대신에 표본 평균 \(\bar{X}_1\), \(\bar{X}_2\), \(\bar{X}_3\), \(\ldots\), \(\bar{X}_n\)가 적용되고, 평균값 \(\mu\) 대신에 표본 평균의 평균 \(k\)가 적용됩니다.

이를 식으로 표현하면 다음과 같습니다.

$$

\begin{align}

\tag{9} SEM &= \sqrt{{\Sigma (\bar{X} – k)^2}\over{n}} \\

&=\sqrt{Var{\bar{\big[ X \big]}}}

\end{align}

$$

(9)식에서 \(Var\big[ \bar{X} \big]\)를 분산이라고 합니다. 결국 표준 오차는 반복실험으로 구해진 표본 평균들이 \(k\)로부터 어느 정도 흩어져 있는가의 척도인 것입니다.

4. 표준 오차 공식과 모집단 표준 편차 추청

(9)식을 이용하면 표준 오차 SEM을 구할 수 있습니다. 물론 많은 반복 실험 세트를 통해 \(k\)를 구하고 각 실험세트당의 표본 평균 \(\bar{X}\)를 구한 후 (9)식에 적용하면 됩니다.

그렇다면 단지 하나의 실험세트만 있을 때에는 어떻게 표준 오차를 구할 수 있을까요? 이러한 경우가 실험 현장에서 사실 많습니다.

이럴 때는 바로 측정값으로부터 모집단의 표준 오차 \(\sigma\)를 추정하는 방법으로 구합니다. 구체적인 내용은 아래에 설명드립니다.

4-1. 표준 오차 공식의 일반화

일단 통계학적인 수식 처리과정을 거쳐 보겠습니다. 흐름은 위에서 개념 설명할 때와 같습니다.

\(n\)개의 표본에서 각각 \(n\)개의 측정이 이루어집니다. 그러면 \(i\)번째 표본에서 도출된 측정세트는 \(X_i\)이고 이러한 것들이 \(n\)개가 있는 것입니다.

한 표본에서의 평균인 \(\bar{X}\)는 아래와 같이 구해집니다.

$$

\tag{10} \bar{X}={{1} \over {n}} \sum_{i=1}^{n} X_i

$$

표준 오차의 정의 식인 (9)식에서 근호안에 있는 분산을 우선 표현하면 다음과 같습니다.

$$

\begin{align}

\tag{11} Var \big[ \bar{X} \big] &= Var \Big[ {{1}\over{n}} \sum_{i=1}^n X_i \Big]\\

&= Var \Big[ {{1}\over{n}} (X_1 + \ldots + X_n) \Big] \\

&= {{1}\over{n^2}} Var[X_1 + \ldots + X_n] \\

&= {{1}\over{n^2}} \times \big( n \times Var[X] \big) \\

&= {{1}\over{n}} Var[X]

\end{align}

$$

(11)식 전개 과정에서 다음의 성질이 이용되었습니다.

$$

\tag{12} Var[aX+b] = a^2 Var[X]

$$

$$

\begin{align}

\tag{13} Var[X_1 + \ldots + X_n ] &= Var[X_1] + \ldots + Var[X_n] \\

&= n \times Var[X]

\end{align}

$$

이때 (13)식에서 \(Var[X]\)는 모집단의 분산을 뜻합니다. 이것은 \(n\)이 크다면 모집단으로부터 추출되는 각 표본에서의 분산은 모집단의 분산과 같다는 통계학적 의미가 반영된 것입니다.

(7)식과 (11)식을 이용하여 (9)식의 표준 오차 SEM을 정리하면 아래와 같습니다.

$$

\begin{align}

SEM &= \sqrt{Var[\bar{X}]} = \sqrt{{{1}\over{n}} Var[{X}]} \\

&= \sqrt{{\Sigma({x} – \mu)^2}\over{n\times n}} \\

&= {{\sigma}\over{\sqrt{n}}}

\end{align}

$$

결국 표준 오차 SEM은 모집단의 표준편차 \(\sigma\)를 \(\sqrt{n}\)으로 나누면 간단히 구해집니다.

그런데 문제는 모집단의 표준편차 \(\sigma\)를 어떻게 구하느냐인데요.

보통은 모집단의 표준편차를 구하지 못하니 표본 측정값들의 표준편차 \(s\)를 구하고 이것을 모집단의 표준편차 \(\sigma\)의 추정치로 활용하게 됩니다.

결국 실험세트가 단지 하나인 경우에 SEM은 아래와 같이 구합니다.

$$

\tag{14} SEM = {{s}\over{\sqrt{n}}}

$$

4-2. 표준 오차 SEM을 이용한 측정값의 표기

그렇다면 측정값을 표기할 때 (9) 또는 (14)식으로 구한 표준오차 SEM을 어떻게 활용할까요?

정밀도를 표현할 때와는 약간 다릅니다. 즉 “평균값\(\pm\)(Z-score \(\times\) SEM)”를 활용하는데요.

$$

\tag{15} \bar{X} \pm Z{{s}\over{\sqrt{n}}}

$$

이 식에서 Z는 90% 신뢰수준의 경우 1.65, 95% 신뢰수준의 경우 1.96, 99% 신뢰수준의 경우 2.58을 적용합니다. 연구에서는 보통 95% 신뢰수준을 적용합니다.

정규분포표의 Z값을 적용하는 것은 실험세트의 측정값이 100개 이상인 경우에 보통 적용합니다. 만일 측정값이 100개 미만인 경우에는 (15)식에서 Z대신에 \(t\)분포값이 들어갑니다.

예를 들어 95% 신뢰수준에서 측정값이 5개 뿐인 경우에는 아래 (16)식과 같이 표기합니다. \(t\)분포표 보는 방법은 여기를 클릭하세요.

$$

\tag{16} \bar{X} \pm 2.776 {{s}\over{\sqrt{n}}}

$$

아울러 사람들이 평균값 \(\bar{X}\) 뒤에 쓰여진 것이 정밀도인지 아니면 표준오차인지를 헷갈릴 수 있으므로 반드시 표기해주어야 합니다.

5. 표준 오차 계산 방법 예제

6. 표준 오차 개념, 공식, 계산 방법의 정리

표준 오차 (또는 평균 표준 오차)란 표본 평균에 대한 표준편차이다.

오차 용어를 사용하는 이유는 표준 오차 공식에서, 표본 평균의 평균값 \(k\)를 참값으로 간주하고 표본 평균과의 차이인 오차 개념이 적용되기 때문이다.

표준오차는 측정값의 표준편차를 구한 후 그 값을 \(\sqrt{n}\)으로 나누면 간단히 구할 수 있다.

반복실험에 의해 측정값이 100회 이상인 경우에는 정규분포의 신뢰수준에 따른 측정값 표기방식을 따르고 100회 미만인 경우에는 t-분포표에 따른 표기방식을 따른다.

만일 측정값이 단지 5개 미만이라면 무리해서 표준 오차를 구하는 것보다는 평균치와 표준편차를 그대로 보여주는 것이 좋다.

과학문화포털 사이언스올

[요약] 통계량의 표준 편차를 나타내는 용어

통계량은 분포를 가지고 있고 표본 평균의 표준 편차를 일반적으로 표준 오차라고 부른다. 즉 어떤 통계의 표집 분포에서 표준편차는 평균치의 표준오차라고 볼 수 있다.

모집단은 표본의 기준이라고 할 수 있다. 모집단(알고자 하는 집단)의 분포를 표현하는 값(모수, 매개변수, Parameter)은 모평균과 모표준편차이다. 만일 모집단이 정규분포를 가지고 매개변수를 안다면 모집단의 분포를 그릴 수 있다. 표준오차는 표본평균과 모집단의 평균과의 차이를 구하고 표준화한 것이다.

표본에 속하지 않은 기준(모집단의 평균)을 사용한 것이고 절대적인 기준과의 차이라는 의미에서 편차(deviation)가 아닌 오차(error)로 표현한다. 표본평균과 모평균의 차이를 모표준편차(표본의 크기(n)의 제곱근 나눈 값)로 나누면 그 표본의 표준오차가 된다. 표준이라는 표현을 사용한 것은 모표준편차를 표본크기의 제곱근으로 나눈 값으로 나누는 과정이 표준화하는 과정이기 때문이다. 따라서 표본평균의 표준오차(Standard Error of the Mean, SEM)는 표본평균들 분포의 표준편차를 가리키며, 표본평균들의 평균은 중심극한정리에 의하여 모평균과 같게 된다.

표준 오차 (Standard Error,SE)의 특징

1. 표본크기

표본 크기가 커질수록, 표준 오차는 작아지게 되며, 모 평균 주위로 표본 평균들이 모이게 된다. 이때의 표본 분포는, 모 분포 보다 더욱 좁아진 종모양으로 나타난다.

2. 비례성

표준 오차는, 표본 크기 n의 제곱근의 반비례(1/√n)하며, 모집단의 표준 편차 σ보다 √n분의 1배수로 작아진다. 단, 모집단 표준편차 σ를 모를 때에는, 표본의 표준편차를 사용한다.

3. 정확성

표준 오차가 작아질수록, 표본통계량과 모수 간의 편차가 작아지게 된다. 즉, 표본평균에 의한 모수 추정이 더욱 정확해 진다.

표준 편차와 표준 오차

반응형

표준 편차와 표준 오차에 대해서 알아보겠습니다. 제가 이 둘을 헷갈려해서 따로 정리하여보았어요~

그런데 저 뿐만아니라 많은 분들도 헷갈려 하시더라구요.

표준편차 (SD, Standard Deviation)

– 점수집합 내에서 점수들 간의 상이한 정도를 나타내는 산포도 측정 도구

– 표준편차가 클수록 평균값에서 이탈한 것

– 표준편차가 작을수록 평균값에 근접한 것

– 변수값이 평균값에서 어느 정도 떨어져 있는지를 알 수 있음

모표준편차

표본표준편차

왜 분모가 n-1인지는 다른 글에 써놓았습니다.

표준오차 (SE, Standard Error)

– 표본추출의 과정에서 발생하는 오차와 연관된 것으로 추정량의 정도를 나타내는 측정 도구

– 표본이 모집단으로부터 얼마나 떨어져 있는지를 나타내는 것(모집단이라는거에 주목!)

– 각 표본들의 평균과 전체 평균 간의 간격

– 표준오차가 작을수록 표본의 대표성이 높다.

– 표본평균의 표준편차

– σ = 모표준편차

– σ^2 = 모분산

1. 표준오차는 표본평균의 표준편차다. (그러므로 기준이 되는 모 표준편차를 알고 있어야한다.)

2. 표준오차는 모집단에 대해서는 딱히 어떤 정보도 주지 않는다.

3. 표준오차는 아무 말이 없어도 표본에 대해서만 논한다. 즉, ‘모표준오차’와 같은 개념은 생각하지 않는다.

4. 표준오차는 주로 가설검정, 신뢰구간이나 예측구간을 구할 때 필요한 것이다. 즉, 맥락 상 구간 이야기가 있을 때만 신경쓰면 된다.

출처: https://canshot.tistory.com/32 [통계를 공부하자]

반응형

표준 편차와 표준 오차의 차이

는 시리즈 분산의 절대 척도로 정의됩니다. 그것은 평균의 양측에서 표준 편차를 명확히합니다. 표준 편차와 표본 크기를 기반으로하기 때문에 종종 표준 오류와 함께 잘못 해석됩니다.

표준 오차 는 추정치의 통계 정확도를 측정하는 데 사용됩니다. 이것은 가설을 테스트하고 간격을 추정하는 과정에서 주로 사용됩니다.

이것들은 통계학의 두 가지 중요한 개념으로, 연구 분야에서 널리 사용됩니다. 표준 편차와 표준 오차의 차이는 데이터 설명과 그 추론의 차이에 근거합니다.

비교 차트

비교의 근거 표준 편차 표준 에러 의미 표준 편차는 평균으로부터의 값 집합의 분산 측정을 의미합니다. 표준 오류는 추정치의 통계적 정확성을 나타냅니다. 통계량 기술 추론 조치 얼마나 많은 관찰이 서로 다른가. 실제 표본이 얼마나 정확한지를 의미합니다. 분포 정상 곡선에 관한 관찰 분포. 정상 곡선에 관한 추정치의 분포. 공식 제곱근의 분산 표준 편차를 표본 크기의 제곱근으로 나눈 값입니다. 표본 크기 증가 보다 구체적인 표준 편차 측정 값을 제공합니다. 표준 오류를 줄입니다.

표준 편차의 정의

표준 편차 (Standard Deviation)는 계열의 확산 또는 표준으로부터의 거리의 척도입니다. 1893 년 칼 피어슨 (Karl Pearson)은 연구 조사에서 의심 할 여지없이 가장 많이 사용되는 표준 편차 개념을 만들었습니다.

평균과의 편차의 제곱 평균의 제곱근입니다. 즉 주어진 데이터 세트에서 표준 편차는 산술 평균으로부터 제곱 평균 제곱 편차입니다. 전체 인구의 경우 그리스 문자 ‘sigma (σ)’로 표시되고 샘플의 경우 라틴 문자 ‘s’로 표시됩니다.

표준 편차는 관측 세트의 분산 정도를 수치화하는 척도입니다. 데이터가 평균값에서 멀어 질수록 데이터 세트 내의 편차가 더 커지므로 데이터 포인트가 더 넓은 범위의 값에 분산되거나 반대의 경우도 마찬가지입니다.

분류되지 않은 데이터의 경우 :

그룹화 된 빈도 분포의 경우 :

표준 오류 정의

동일한 인구 집단에서 추출한 동일한 크기의 서로 다른 표본이 고려중인 통계의 다양한 값, 즉 표본 평균을 제공한다는 사실을 관찰했을 것입니다. 표준 오차 (Standard Error, SE)는 표본 평균의 다른 값에서 표준 편차를 제공합니다. 모집단 전체의 표본 평균을 비교하는 데 사용됩니다.

즉, 통계의 표준 오차는 샘플링 분포의 표준 편차에 불과합니다. 통계적 가설과 간격 추정의 테스트를 수행하는 데 큰 역할을합니다. 견적의 정확성과 신뢰성에 대한 아이디어를 제공합니다. 표준 오차가 작을수록 이론 분포의 균일 성이 크고 그 반대도 마찬가지입니다.

수식 : 표본 평균에 대한 표준 오차 = σ / √n

여기서 σ는 모집단 표준 편차

표준 편차와 표준 오차의 주요 차이점

표준 편차의 차이에 관한 한 아래에 언급 된 점은 상당합니다.

표준 편차는 관측 세트의 변동량을 평가하는 척도입니다. 표준 오차는 추정치의 정확성을 측정합니다. 즉 통계량의 이론적 분포의 변동성을 나타내는 척도입니다. 표준 편차는 설명적인 통계이지만 표준 오류는 추세적인 통계입니다. 표준 편차는 개별 값이 평균값으로부터 얼마나 떨어져 있는지를 측정합니다. 반대로, 표본 평균은 모집단 평균에 얼마나 가깝습니까? 표준 편차는 표준 곡선을 기준으로 한 관측치의 분포입니다. 이와 반대로, 표준 오차는 정규 곡선을 기준으로 한 추정치의 분포입니다. 표준 편차는 분산의 제곱근으로 정의됩니다. 반대로 표준 오차는 표본 크기의 제곱근으로 나눈 표준 편차로 설명됩니다. 표본 크기를 올리면보다 구체적인 표준 편차를 제공합니다. 표본 크기를 늘리면 표준 오류와 달리 표준 오류가 감소하는 경향이 있습니다.

결론

전반적으로 표준 편차는 분산의 가장 좋은 척도 중 하나로 간주되며 중앙 값에서 분산을 측정합니다. 반면 표준 오차는 주로 추정의 신뢰성과 정확성을 검사하는 데 사용되므로 오차가 작을수록 신뢰도와 정확도가 높습니다.

키워드에 대한 정보 표준 편차 표준 오차

다음은 Bing에서 표준 편차 표준 오차 주제에 대한 검색 결과입니다. 필요한 경우 더 읽을 수 있습니다.

이 기사는 인터넷의 다양한 출처에서 편집되었습니다. 이 기사가 유용했기를 바랍니다. 이 기사가 유용하다고 생각되면 공유하십시오. 매우 감사합니다!

사람들이 주제에 대해 자주 검색하는 키워드 표준오차가 뭔가요? 표준편차랑 다른건가요?

  • 표준오차
  • 표준편차

표준오차가 #뭔가요? #표준편차랑 #다른건가요?


YouTube에서 표준 편차 표준 오차 주제의 다른 동영상 보기

주제에 대한 기사를 시청해 주셔서 감사합니다 표준오차가 뭔가요? 표준편차랑 다른건가요? | 표준 편차 표준 오차, 이 기사가 유용하다고 생각되면 공유하십시오, 매우 감사합니다.

See also  연예인 스폰 리스트 | 전직 아이돌에게 듣는 연예인 스폰의 세계 2부 빠른 답변

Leave a Comment