기금넷 공식사이트 - 재경 문답 - 통계 거짓말 - 독서 노트

통계 거짓말 - 독서 노트

우리는 매일 온갖 종류의 데이터를 접하지만, 데이터의 진정성과 신뢰성을 위해서는 눈을 뜨고 있어야 합니다.

데이터에는 옳고 그름이 없습니다. 이 책을 통해 우리는 일상생활에서 어떤 데이터가 문제인지 더 잘 파악할 수 있습니다.

일상생활에서 우리는 점점 더 많은 통계 데이터와 정보를 접하게 될 것입니다. 그 중에는 데이터를 위조하는 사람들도 많습니다.

사실은 보고 듣는 것 이상인 경우가 많습니다.

데이터의 출처가 되는 샘플은 편향되어 있으며, 편향된 샘플을 기반으로 도출된 데이터 결론도 부정확합니다.

샘플 데이터와 전체 데이터의 차이

샘플링 기반의 보고서가 가치 있으려면 다양한 종류의 오류를 배제한 대표 샘플을 사용해야 합니다

가장 기본적인 표본은 무작위 표본으로, 이는 무작위성의 원칙을 완전히 따라 모집단에서 표본을 선택하는 것을 말합니다. 무작위 표본의 검정 기준은 모집단의 모든 이름이나 사물이 표본으로 선택될 확률이 동일한지 여부입니다.

평균과 관련된 일부 오류는 일반적으로 평균 알고리즘과 관련이 있습니다.

일반적인 의미의 평균은 산술 평균을 의미합니다

평균은 때때로 전체 상황을 나타내지 않습니다

주로 표본 크기가 부족하고 작은 경우를 나타냅니다. 표본 크기 또한 데이터가 전체를 나타낼 수 없습니다.

가능한 오류, 표준 오류

데이터 뒤에 있을 수 있는 오류를 무시할 수 없습니다.

차트로 인해 발생하는 오해의 소지가 있는 결론.

시작점 수정, 좌표축 숨기기 등 차트의 좌표축을 수정하면 사람들이 착각을 일으키고 잘못된 결론을 내릴 수 있습니다.

유사한 기술에는 다음이 포함됩니다. 그래픽을 사용하면 차트가 더 좋아지겠지만 더 혼란스러울 것입니다

많은 결론과 데이터가 일치하지 않는데 이는 양의 머리에 개고기를 파는 것과 비슷합니다. 오류, 맹렬함 처음 들으면 믿기 쉽지만 잘 생각해보면 문제점이 발견된다.

사망률을 예로 들면, 정말 군대에 가는 것이 더 안전한가요?

확실히 그렇지 않습니다. 이 데이터로는 아무것도 설명할 수 없으며 비교도 가치가 없습니다. 군대에 가는 사람들은 모두 젊은이들이고, 도시에 머무르는 사람들은 모두 노인과 아이들이다.