기금넷 공식사이트 - 복권 조회 - 코프대강당의 속박, 민공과' P 가치' 를 평생 연구하는 것부터 시작한다 (1)

코프대강당의 속박, 민공과' P 가치' 를 평생 연구하는 것부터 시작한다 (1)

과학 연구에서 벽돌공으로 P 값은 익숙한 명사이다. 차이 유전자를 찾으려면 P 값을 보고, 부집합 분석을 하려면 P 값, 다른 샘플 처리 (예: 약 전후 효과 분석, P 값 필요) 를 봐야 한다. P 가치 응용이 이렇게 광범위해서, 나는 벽돌을 옮기는 모든 사람, 나를 포함해서, 반드시 한 번 이상 이 문제를 생각해 본 적이 있을 것이며, P 값의 경위를 알아내려고 노력할 것이라고 믿는다. (윌리엄 셰익스피어, 윈스턴, 자신감명언) P 값은 어떻게 나왔으며, 우리가 흔히 말하는 각종 테스트와 무슨 관계가 있습니까? P 값이 정확하지 않고 수정해야 하는 관점이 있는 이유는 무엇입니까?

관심이 있으시다면 저를 따라오세요.

나는 줄곧 하룻밤 사이에 벼락부자가 되는 꿈을 꾸었다. 심사숙고한 끝에 나는 복권을 사기로 결정했다. 확률 선생님은 나에게 "불가능하다" 고 말했다. 그런데, 이것은 어떻게 정의될 수 없을까요?

엄밀한 사고에 근거하여, 나는 과학 실험을 하기로 결정했다. 내가 복권을 사서 하룻밤 사이에 벼락부자가 될 수 있다고 가정하면, 이런 상황이 발생할 확률 (P 값) 은 얼마입니까? 이색구를 예로 들다. 일등상 (6+ 1) 의 당첨 확률은 레드볼 33 회 블루 볼 16 선1=1//Kloc 입니다 확률 선생님은 어떤 일이 일어날 확률이 매우 낮다면, 우리는 그것이 일어날 수 없다고 생각한다.

이 흔한 작은 일에서, 우리는 다음과 같은 생각과 한 가지를 어떻게 예측할 수 있는지를 빗어 낼 수 있다. 먼저 0 가정을 한 다음, 이 사건의 확률 P 값을 계산하고, 예를 들어 0.05, P, P, P, P, P, P, P, P, P, P, P, P

우리는 우리가 하는 모든 판단이 기존의 객관적인 사실에 근거한다는 것을 안다. 과학 연구 분야에서는 자연이 한 무더기의 데이터이고, 어떻게 이 데이터로부터 판단을 내리는지, 자연은 법칙을 찾는 것이다. (알버트 아인슈타인, 과학명언) 어떻게 패턴을 찾을 수 있을까요? 데이터 분포는 우리에게 방향을 제시했다. 카방 검사, T 검사 등 일련의 분석 방법은 카방 분포와 정규 분포에서 나온 것이다. 요약하면, 데이터 획득에서 최종 판단까지 다음과 같은 과정을 거쳐야 한다.

이 과정을 좀 더 생생하게 설명하기 위해서, 나는 저자 장자다의 T-test 의 예를 인용한다.

이 과정을 좀 더 생생하게 설명하기 위해서, 나는 저자 장자다의 T-test 의 예를 인용한다.

평균 10 인 샘플 데이터 배치가 정규 분포에 부합한다고 가정합니다. 우리는 10 개의 샘플을 가져와서 이 10 개의 샘플이 이 샘플 데이터를 대표할 수 있는지 시험해 보았다. 다음은 우리의 분석 과정입니다.

첫 번째 단계는 평균 샘플 양이 10 이고 샘플 양이10 인 실험 데이터를 얻는 것입니다.

두 번째 단계는 샘플 분포가 정규 분포인지 확인하고, 샘플이 전체 샘플을 나타낼 수 있다고 가정하고,

세 번째 단계에서는 전체 샘플 평균이 알려져 있기 때문에 총 분산을 알 수 없으며 T 테스트 방법을 사용하여 총 분산을 샘플 분산으로 대체합니다. 샘플링 자유도는 9 이며 t 테스트의 통계가 먼저 계산됩니다.

이 T 값과 자유도에 따라 다음 그림과 같이 P 값을 계산할 수 있습니다.

P = 2× 0.07417 = 0.14834

네 번째 단계는 p 를 사용하여 결론을 도출하는 것입니다.

여기 보시다시피 독자들은 저만큼 클 수도 있습니다. 다행히도 P 값의 계산은 탐지 방법 및 분석 소프트웨어에 통합되었습니다. 실제 분석에서, 이것들은 우리 스스로 계산할 필요가 없다. 우리는 단지 적절한 검사 방법, 심지어 적절한 분석 소프트웨어까지 선택하기만 하면 된다. P 값의 과정을 좀 더 생생하게 설명하고 싶어서 이 간단한 예를 찾았습니다.

나는 이미 P 값의 경위를 대충 알아냈는데, 왜 P 값을 수정해야 하는가?

우리가 흔히 볼 수 있는 차별적으로 유전자를 표현하는 것을 예로 들어 보겠습니다. 우리가 유전자 중 하나를 분석할 때, p