기금넷 공식사이트 - 복권 조회 - 숫자는 신뢰할 수 있나요?

숫자는 신뢰할 수 있나요?

사람들이 자신의 결론을 뒷받침하기 위해 다음과 같은 말을 사용하는 것을 자주 들을 수 있습니다. "나는 그것을 증명할 통계를 가지고 있습니다."

우리는 전쟁의 피해를 늘리거나 줄이기 위해 통계를 사용합니다. , 발생률의 변화를 대중에게 알리고, 신제품의 판매량을 추정하고, 특정 주식의 수익성을 판단하고, 여러 대학의 졸업률을 측정하고, 다양한 연령대의 사람들의 성생활을 기록합니다. 다른 많은 질문에 대한 데이터를 제공하기 위한 빈도입니다.

통계는 숫자로 표현된 증거입니다. 그러한 증거는 숫자로 인해 증거가 매우 과학적이고 정확하며 "사실"을 나타내는 것처럼 보이기 때문에 매우 인상적으로 보일 수 있습니다.

그러나 예일대 게리 스미스(Gary Smith) 박사는 『간단한 통계-심각한 넌센스를 쉽게 알아보는 방법』에서 다음과 같이 지적했다. 거짓말이며 증명하려는 모든 것을 반드시 증명하지는 않습니다.

게리 스미스(Gary Smith)는 예일대학교에서 박사 과정을 밟고 있으며 7년 동안 강의를 했으며 그 동안 그의 가장 인기 있는 통계 강좌에서 "간단한 통계"라는 책을 출간했습니다. .

이 책에서 게리는 간단한 통계 원리를 이용해 생활 속의 다양한 데이터 사기를 밝히고, 데이터 트릭을 식별하는 방법과 진정한 과학적인 방법을 사용하여 데이터를 분석하는 방법을 알려준다.

책에서 게리는 심슨의 역설, 생존자 편향, 자기 선택 편향, 교란 요인, 평균 회귀, 플러스 마이너스 등 12개 이상의 왜곡된 결론을 나열합니다.

하지만 이는 크게 두 가지 측면으로 요약됩니다. 한편으로는 데이터 자체에 오류가 있고, 다른 한편으로는 데이터를 해석하는 사람이 다르기 때문에 결과가 달라집니다.

미국 노스캐롤라이나주립대 지리학과가 졸업생들의 소득을 알아보기 위해 통계를 낸 적이 있는데, 지리학과 졸업생들의 평균 초봉이 더 높을 뿐만 아니라. 다른 전공보다 높지만 지리학과도 모두 높습니다. 그래서 저는 높은 연봉을 받고 싶다면 노스캐롤라이나 지리학과에 가야 한다는 결론에 이르렀습니다.

참 이상하네요, 지리학을 공부한 사람이 어떻게 그렇게 많은 돈을 벌 수 있을까요? 쉽게 말하면 그해 노스캐롤라이나주립대 지리학과를 졸업한 학생이 마이클 조던이라는 사람이었는데, 그 사람이 당시 NBA 농구의 신이었는데, 그 사람 혼자서 지리학과 전체의 평균 연봉을 올렸기 때문이다.

통계자료의 실제 상황을 이해하지 못할 때 우리는 비현실적인 데이터에 쉽게 속아 잘못된 결론을 믿는 경우가 많습니다.

하지만 데이터가 실제인 경우도 있을 것이고, 사람마다 해석하는 바가 다르면 결과도 달라지겠죠.

복권을 예로 들어보세요. 사실 각 호에 나오는 숫자는 무작위이며 따라야 할 규칙이 없습니다. 그러나 어떤 사람들은 항상 무질서에서 질서를 찾을 수 있습니다. 연속된 숫자에 배팅하지 마세요. 오랫동안 나오지 않았던 숫자가 이번에는 나타날 가능성이 더 높으며, 심지어 남자가 이길 확률이 더 높다고 생각하는 사람도 있습니다. 실제로 그런 패턴이 있다면 이미 복권을 사서 먹을 것, 입을 것 걱정 없이 생활하는 사람들도 있을 것이다.

데이터의 허위를 폭로하는 가장 좋은 방법은 통계적 지식을 배우는 것입니다. 물론 이것은 많은 일반 사람들에게 다소 어려운 일입니다. 게리는 이 책에서 두 가지 방법을 제안합니다.

(1) 상식적 판단

정보를 보면 다음과 같은 3가지 질문을 스스로에게 물어볼 수 있습니다.

누가 알려줬나요?

그는 어떻게 알았나요?

그 사람은 나에게 무엇을 팔려고 하는 걸까?

이 세 가지 질문은 주로 귀하가 보고 있는 데이터가 직접적인 정보인지, 데이터 해석이 신뢰할 수 있는지 여부를 확인하기 위한 것입니다. 데이터가 중고이거나 3차인 경우 데이터 자체에 오류가 있을 수 있어, 자신이 도출한 결론에 대해 좀 더 신중하게 생각해 보아야 할 것입니다.

앞서도 말했듯이, 데이터에 대한 사람의 해석이 다르기 때문에 누가 우리에게 알려줬는지, 통계학자인지 일반인인지도 알아야 합니다.

(2) 새로운 데이터를 사용하여 기존 결론 테스트

기존 데이터에서 결론을 도출하면 결론의 정확성을 확인할 수 없습니다. 그래서 Gary는 오래된 이론을 테스트하기 위해 새로운 데이터를 사용하는 것을 강조했습니다.

친한 친구가 친족의 병을 고칠 수 있는 민간요법이 있다고 하면 “그가 이렇게 고쳐줬다”고 한다. 한번 시도해 보시겠습니까? 알면서도 치료법이 가짜일 수 있다.

혹은 흡연이 건강에 해롭다고 진지하게 이야기하면, "누구누구는 매일 담배를 피우는데 지금은 90대까지 살고 있고, 아직 건강해요." 이에 대한 예는 셀 수 없이 많습니다. 사람들은 항상 자신의 과거 경험을 지나치게 신뢰하고 누구누구는 할 수 있다고 생각하는데 나는 왜 할 수 없습니까?

한 심리학 실험에서는 사람들이 어떤 유형의 사물에 대한 개념을 형성하기 위해, 즉 특정 유형의 사물에 대한 전형적인 인상을 확립하기 위해 '프로토타입' 메커니즘에 의존하고, 그런 다음 새로운 것을 접할 때 각 개념 프로토타입은 그것이 어떤 개념과 관련되어 있는지 결정하는 데 사용됩니다.

이 메커니즘은 뇌의 에너지를 많이 절약하지만 많은 문제를 안고 있으며 가장 심각한 문제는 작은 표본 크기로 인해 발생합니다.

통계의 많은 법칙은 점근적이며, 이 법칙은 표본 크기가 무한할 때만 참입니다. 무한한 표본이 없는데, 표본이 많아 합리적인 추정을 할 수 있을까요?

이것은 실제로 많은 경우에 해당되지만 불행히도 사람들이 가장 좋아하는 것은 특별한 경우에 대한 사고입니다. 샘플을 프로토타입으로 사용할 수 있다는 것입니다! 우리의 직관은 통계적 법칙을 수정하는 것을 종종 잊어버리는 전형적인 메커니즘에 의해 오염되었습니다.

그러나 통계에 대한 지식이 있다고 가정하면 데이터 사기에 빠질 수도 있습니다. 그러나 이 프로토타입 메커니즘이 활성화되면 통계적 사고를 사용하여 혼란에 빠지지 않을 수 있습니다.

초보자라면 이 책 『간단통계』부터 시작해 보는 것도 좋을 것 같습니다. 게리는 풍부한 사례를 활용해 통계학의 이론을 알려 독자들의 이해를 돕습니다.