기금넷 공식사이트 - 복권 조회 - 코프대강당의 속박, 민공과' P 가치' 를 평생 연구하는 것부터 시작한다 (1)
코프대강당의 속박, 민공과' P 가치' 를 평생 연구하는 것부터 시작한다 (1)
관심이 있으시다면 저를 따라오세요.
나는 줄곧 하룻밤 사이에 벼락부자가 되는 꿈을 꾸었다. 심사숙고한 끝에 나는 복권을 사기로 결정했다. 확률 선생님은 나에게 "불가능하다" 고 말했다. 그런데, 이것은 어떻게 정의될 수 없을까요?
엄밀한 사고에 근거하여, 나는 과학 실험을 하기로 결정했다. 내가 복권을 사서 하룻밤 사이에 벼락부자가 될 수 있다고 가정하면, 이런 상황이 발생할 확률 (P 값) 은 얼마입니까? 이색구를 예로 들다. 일등상 (6+ 1) 의 당첨 확률은 레드볼 33 회 블루 볼 16 선1=1//Kloc 입니다 확률 선생님은 어떤 일이 일어날 확률이 매우 낮다면, 우리는 그것이 일어날 수 없다고 생각한다.
이 흔한 작은 일에서, 우리는 다음과 같은 생각과 한 가지를 어떻게 예측할 수 있는지를 빗어 낼 수 있다. 먼저 0 가정을 한 다음, 이 사건의 확률 P 값을 계산하고, 예를 들어 0.05, P, P, P, P, P, P, P, P, P, P, P, P
우리는 우리가 하는 모든 판단이 기존의 객관적인 사실에 근거한다는 것을 안다. 과학 연구 분야에서는 자연이 한 무더기의 데이터이고, 어떻게 이 데이터로부터 판단을 내리는지, 자연은 법칙을 찾는 것이다. (알버트 아인슈타인, 과학명언) 어떻게 패턴을 찾을 수 있을까요? 데이터 분포는 우리에게 방향을 제시했다. 카방 검사, T 검사 등 일련의 분석 방법은 카방 분포와 정규 분포에서 나온 것이다. 요약하면, 데이터 획득에서 최종 판단까지 다음과 같은 과정을 거쳐야 한다.
이 과정을 좀 더 생생하게 설명하기 위해서, 나는 저자 장자다의 T-test 의 예를 인용한다.
예
이 과정을 좀 더 생생하게 설명하기 위해서, 나는 저자 장자다의 T-test 의 예를 인용한다.
평균 10 인 샘플 데이터 배치가 정규 분포에 부합한다고 가정합니다. 우리는 10 개의 샘플을 가져와서 이 10 개의 샘플이 이 샘플 데이터를 대표할 수 있는지 시험해 보았다. 다음은 우리의 분석 과정입니다.
첫 번째 단계는 평균 샘플 양이 10 이고 샘플 양이10 인 실험 데이터를 얻는 것입니다.
두 번째 단계는 샘플 분포가 정규 분포인지 확인하고, 샘플이 전체 샘플을 나타낼 수 있다고 가정하고,
세 번째 단계에서는 전체 샘플 평균이 알려져 있기 때문에 총 분산을 알 수 없으며 T 테스트 방법을 사용하여 총 분산을 샘플 분산으로 대체합니다. 샘플링 자유도는 9 이며 t 테스트의 통계가 먼저 계산됩니다.
이 T 값과 자유도에 따라 다음 그림과 같이 P 값을 계산할 수 있습니다.
P = 2× 0.07417 = 0.14834
네 번째 단계는 p 를 사용하여 결론을 도출하는 것입니다.
여기 보시다시피 독자들은 저만큼 클 수도 있습니다. 다행히도 P 값의 계산은 탐지 방법 및 분석 소프트웨어에 통합되었습니다. 실제 분석에서, 이것들은 우리 스스로 계산할 필요가 없다. 우리는 단지 적절한 검사 방법, 심지어 적절한 분석 소프트웨어까지 선택하기만 하면 된다. P 값의 과정을 좀 더 생생하게 설명하고 싶어서 이 간단한 예를 찾았습니다.
나는 이미 P 값의 경위를 대충 알아냈는데, 왜 P 값을 수정해야 하는가?
우리가 흔히 볼 수 있는 차별적으로 유전자를 표현하는 것을 예로 들어 보겠습니다. 우리가 유전자 중 하나를 분석할 때, p
- 관련 기사