기본 콘텐츠로 건너뛰기

[R] Two sample t - test (making sense)

https://www.isixsigma.com/tools-templates/hypothesis-testing/making-sense-two-sample-t-test/

SE의 존재는 왜 필요한가?


내가 구한 sample 의 mean or proportion 이! standardize 되는 과정을 거치는 것이다.
모집단과 비교가 가능한 '형태' 가 되도록 하는 것이다.

1. 왜냐하면 일단 모집단의 평균! 내가 샘플한 그룹의 모집단의 진짜 평균과 SD는 구할 수
없다.
2. 그래서 우리는 SE mean. 평균들간의 분포차이를 구해야 한다.

이 값은 샘플의 SD 분산값을 n값으로 나눈 값이라고 할 수 있다. 즉,
우리가 샘플링한 값이 존나 커지면, 샘플 평균으로부터 모평균의 차이가 거의 없어지는 것이다.

SE: 평균들 간의 분포차이를 내가 가진 샘플 사이즈 수준(20개 채취?) 같은 걸로 어떻게 예측 가능한가?
- 샘플 숫자에 반비례
- 실제 data의 SD에 비례

이 두 값으로, 샘플 평규들간의 분포를 말할 수 있는데, 그게 SE 이다. 내가 채취한 샘플사이즈로 모집단의 평균들간의 차이를 예측할 수 있는 방법인 것이다. 이 평균들간의 분포차이로! 평균값의 차이를 나눠주면, 그것이 t test의 statistic이 되는데 어떻게 그렇게 되나?

즉, t - test에서
평균간의 차이가 크면 당연히 t test 커지면서= 차이가 있다! 라고 말 할 수 있다.
그런데 ? 실제로 분포가 존나 다양하면, 그 차이는 크게 의미가 없어지는 것이라고 할 수 있다. 내가 구한 샘플이 존나 많은 것 중에 하나이며, 그것은 그렇게 정확한 값이 아니고, noise가 존나 함유된 놈이라고 할 수 있는 어쩌면 구석탱이의 놈이라 할 수 있는 것이다.

반면! 샘플들의 분포가 존나 narrow한 상태! 아주 noise가 없는 존나 적확한 상태(from large large sample size로부터 온 것이거나, 실제로 data가 별 차이가 없는) 에서는!
이 값은 줄어들며 = 내가 가진 샘플의 평균과 모평균과의 차이가 믿을만한 값이 된다는 것이다. 즉, 이 값이 작아질 수록 t test가 커지면서! 이 값이 정확도가 높은 값이다.
noise가 적은 값이라고 결론 내릴 수 있다.

즉,
SE는 내가 가진 모집단의 분포도와, 내가 구한 샘플의 사이즈에 따라 결정되며.
그것이 내가 구한 샘플의 평균값의 정확도를 예측하는 척도가 된다.
SE가 작아지면 더 정확한 샘플 평균값으로, 우리가 믿고 t test를 돌려서 reject 할 수 있다는 것이고
SE가 커지면, noise가 큰, 아주 졸라 부정확한 값으로 내가 t test reject할 확률이 적어진다는 얘기다. 이것은 결론적으로 data의 SD와 sample size에 직접적으로 영향을 받는다!! 오키???

댓글

이 블로그의 인기 게시물

[CK] STEMI_EKG learning.

892 × 548 저작권 보호를 받는 이미지일 수 있습니다.    자세히 알아보기 ECG - Common STEMI Mimics | Grays Integrative Physiology Grays Integrative Physiology Mimics will not produce reciprocal changes. If RCs in related leads, should consider it a STEMI. 방문 추가 컬렉션 공유

[CK] LVAD parameter review. [ ] tree !!

Vital(BP): hypo, hyper. PEx(JVP): volume status -------------------------------- 1st. PI(3-7)= contractility and volume status(high volume only cause high PI) overload = high PI. low volume = low PI. (=low volume = low preload = RV failure, arrhythmia same thing) HTN = low PI low BP = low PI. (only overload cause high PI = with high preload, but otherwise, BP, volume => cause low PI) 2nd. Flow(4-6) overload, 3rd. Power(surge = only thrombus, 4-6) hypotension route (BP) => high VADFL = vasodilator, sepsis = R/O => low VADFL(most common)  with high JVP => RV failure, PE/tamponade, pneumothorax                                                                               , then adjust LVAD(higher)                ...

EGD, endoscopy, Colonoscopy prep.

EGD:  8hr = clear liquid diet(technically up to 2 hour, but preferred 4 hours prior to procedure)  4hr = medication with water  2hr = strict npo(nothing) Colonoscopy  8hr = no food at all but water is ok.  2hr = no liquid neither   Patients typically take no food by mouth for four to eight hours prior to the procedure (sometimes longer if there is known or suspected delayed gastric emptying) and no liquids (other than sips with medications) for two hours   Enteroscopy   Patients should fast after midnight the evening prior to the examination to allow time for food residue to clear the small bowel. In addition, patients undergoing retrograde examinations should receive a bowel preparation to cleanse the colon. cf) ASA- sedation protocol(procedure)     The American Society for Anesthesiology (ASA) guidelines state that prior to a procedure, patients should fast a minimum of two hours following clear liquid ingestion or six ...