기금넷 공식사이트 - 복권 조회 - 본 포드 법률 과정 공유 3 2022-04- 16

본 포드 법률 과정 공유 3 2022-04- 16

벤 포드의 법칙? 강좌 공유 3

-응? 이것은 일반 선택과목인' 경제연구의 계산법' 2 강의 한 사례다.

-응? 벤포드의 법칙은 비전형적인 통계 법칙으로 역사가 유구하다. 비록 넓은 의미에서 증명되지는 않았지만, 그것은 중요한 응용이 있다. 가장 직접적인 역할은 각 분야의' 데이터 위조' 를 탐지하는 데 도움이 된다는 것이다.

(1) 벤포드의 법칙

-응? 벤포드의 법칙은 제 1 수의 법칙이라고도 불린다. 그것은 숫자 통계의 내재적 법칙이며, 모든 자연 무작위 변수를 가리킨다. 샘플 공간이 충분히 큰 한 각 샘플의 첫 번째 숫자의 확률은 1 9 가 일정 범위 내에서 안정적입니다 (그림 참조). 즉 1 으로 시작하는 샘플은 샘플 공간의 0.3 을 차지하고, 2 로 시작하는 샘플은 샘플 공간의 0. 17-0. 19 를 차지하며, 9 또는 8 로 시작하는 샘플은 항상 약 0.05 를 차지합니다.

-응? 전 세계 수만 개의 데이터 시작 숫자는 1 에서 9 까지의 숫자이며, 각 숫자의 시작 확률은 비슷해야 합니다. 하지만 충분한 데이터를 집계하면 1 으로 시작하는 데이터가 가장 많다는 것을 알게 될 것입니다. -응?

-응? 1935 년, 프랭크라는 미국인? 프랭크 벤포드 (1883–1948) 의 엔지니어들은 대수표의 처음 몇 페이지가 다음 몇 페이지보다 더 더럽다는 것을 발견했는데, 이는 평소 처음 몇 페이지를 보는 사람이 더 많다는 것을 보여준다. 추가 연구에 따르면 데이터에 충분한 샘플이 있는 한 1 으로 시작하는 숫자가 데이터에 나타나는 빈도는 1/9 가 아니라 30. 1% 입니다. 2 를 비롯한 숫자가 나타나는 빈도는 17.6% 로, 이후 순차적으로 감소했고, 9 발생 빈도는 4.6% 에 불과했다. -응?

-응? 벤 포드는 다른 수치를 조사하기 시작했고, 완전히 다른 데이터들이 모두 이 법칙을 가지고 있다는 것을 발견했다. 예를 들어 집 번호의 약 3 분의 1 은 1 을 첫 번째 번호로 사용합니다. 공통점이 거의 없는 많은 분야에서는 다우존스 지수의 역사 데이터, 개인용 컴퓨터에 저장된 파일의 크기와 순서, 세계 주요 하천의 길이, 신문 1 면의 숫자 등 많은 것들이 일치한다.

-응? 196 1 에서 한 미국 과학자는 이 포드 법칙이 실제로 수의 누적으로 인한 현상이라고 제안했다. 단위 수가 없더라도. 예를 들어, 주식시장의 지수가 1000 시부터 10% 의 연율로 상승한다면, 지수가 1000 에서 2000 시로 상승하는 데는 7 년 이상이 걸린다. 2,000 에서 3,000 까지 4 년 이상 걸립니다. 그러나 지수가 10000 시에서 20,000 시로 올라가려면 7 년 이상이 걸린다. 따라서 1 으로 시작하는 인덱스 데이터가 다른 숫자로 시작하는 인덱스 데이터보다 훨씬 높다는 것을 알 수 있습니다.

벤 포드 (축구 선수)

-응? 벤 포드는 원래 미국 전기 엔지니어이자 물리학자였다. 그는 은퇴할 때까지 제너럴 일렉트릭 연구소에서 여러 해 동안 일했다. 이 엔지니어가 50 대였을 때, 그는 숫자와 관련된 학과를 사랑하게 되었다. 이 프로젝트의 결론은 우리가 지금' 벤포드의 법칙' 이라고 부르는 것이다.

-응? 사실 벤포드의 법칙을 처음 발견한 것은 벤포드가 아니라 미국 천문학자 사이먼이었나요? 뉴콘 (사이먼 뉴콘,1835.3.10-1909.7.1 1877 년, 뉴콘은 미국 항해천문력국장이 되어 동료를 조직하여 모든 주요 천문 상수를 다시 계산했다. 복잡한 천문 계산에는 대수표가 자주 사용되지만, 그때는 인터넷도 아리운도 없었고, 대수가 책으로 인쇄되어 도서관에 보관되어 있었다. 세심한 뉴콤은 이상한 현상을 발견했다. 로그 테이블에 1 으로 시작하는 숫자가 포함된 페이지가 다른 페이지보다 훨씬 나쁘다는 것은 계산에서 첫 번째 숫자의 확률이 더 높다는 것을 보여 주기 때문에 그는 188 1 에서 문장 언급을 발표하고 분석했다

-응? 이상하게도, 과학 법칙의 발견은 때때로 벤 포드의 발견과 같은 보잘것없는 극히 작은 현상에서 비롯된다. 1 시작 숫자가 많다는 것이 규칙인가? 그는 이 현상이 대수표뿐만 아니라 다른 종류의 데이터에도 존재한다는 것을 발견하여 이를 확인하기 위해 대량의 데이터를 찾아보았다.

-응? 벤 포드는 이 문제에 대한 관찰이 뉴콤보다 더 깊다. 그는 다른 수치를 조사하기 시작했고,' 제 1 수의 법칙' 현상이 인구, 사망률, 물리 화학 상수, 야구 통계, 반감기 방사성 동위원소, 물리서의 답, 소수수, 피보나치 수 등 완전히 다른 데이터에 나타났다는 것을 발견했다. 즉, 측정 단위제에서 얻은 데이터만 이 법칙에 부합한다는 것이다. 반면에, 임의로 획득하고 제한하는 데이터는 일반적으로 이 포드의 법칙에 부합되지 않는다. 예를 들어, 복권 번호, 전화번호, 휘발유 가격, 날짜, 사람들의 체중 또는 키 데이터는 비교적 무작위적이거나 임의로 지정되며 측정 시스템에서 얻은 것이 아닙니다.

-응? 뉴콘은 벤포드보다 50 여 년 앞서 이 법칙을 발견했지만, 후자가 더 친절한 사람이라는 것은 분명하다. 그렇지 않으면, 그것은 뉴콤의 법칙이라고 불릴 것이다.

(3) 벤 포드의 법칙은 믿을 만합니까?

-응? 첫 번째 법칙은 f (d) = log [1+(1/d)] (d 는 자연수임) 로 자연수1~ 9 의 사용 빈도를 설명합니다 분석 결과, 측정 단위계에서 얻은 자연 누적 데이터는 첫 번째 법칙에 부합하는 반면, 임의로 획득 및 제한된 데이터는 일반적으로 일치하지 않는 것으로 나타났습니다. 그런데 사람의 키와 몸무게 데이터가 맞지 않는데 어떻게 설명할까요? 법이 여러 방면에서 적용되었지만 사람들은 이런 현상에 대해 여전히 의아해하고 있다.

-응? 그런 다음 이 법칙을 수학적으로 증명하는 방법이었는데, 지금까지는 만족스러운 결과가 없었다. (윌리엄 셰익스피어, 햄릿, 과학명언) 이것이 가장 큰 문제이자 제 1 수율로 불리는 벤포드의 법칙이 지금까지 수학이나 통계학 교재에 들어가지 못한 이유이기도 하다.

-응? 이 법칙의 증명은 하나 이상이지만, 모두 엄격하지는 않다. 아래 것은 엄격하지만 분명히 조건이 첨부되어 있다.

-응? 증명은 다음과 같습니다: 무작위 변수 X 가 있는 큰 샘플 공간이 있다고 가정해 봅시다. , x? , ..., x_{n}, 여기서 n 은 충분히 큽니다. X? , x? X {n} 의 진화 법칙은 지수 방정식으로 시뮬레이션 할 수 있습니다.

-응? 지수 법칙의 솔루션 양쪽에서 10 을 기준으로 로그를 취하면 LG x(t) 가 시간 T 에 비례하는 결론을 얻게 됩니다.

-응? 변수 x 가 80 에서 90 사이의 확률을 묻는다면 x(t=80) 에서 t 의 솔루션 t 만 구하면 됩니다. 그리고 x(t=90) t 에서 t 의 솔루션? 그럼 총 시간 t 의 비율 (t? -t? ) /T 는 x 가 80 에서 90 사이일 확률입니다.

-응? 만약 우리가 첫 번째 숫자가 8 이라는 확률을 묻는다면 어떨까요? Duanx 와 zhuww 의 아이디어 덕분에 LG x 의 소수 부분이 LG 8 과 LG 9 사이의 길이에만 관심을 가지면 됩니다.

-응? 로그 LG x 약 10 의 정수 부분에 따라 x 가 몇 자리인지 결정되기 때문입니다 (정수 부분은 1 이며 두 자리임을 나타냄). 정수 부분은 2 로 3 자리 숫자를 나타냅니다. Lg x 의 소수 부분에 따라 X 의 각 숫자가 결정됩니다.

-응? Lg x 의 시간 T 의 소수 부분에 대한 이미지를 그리면 실제로 LG x 의 이미지를 [lg 0, LG 10] 의 간격으로 축소하는 것과 같습니다. 이렇게 하면 시간 T 가 얼마나 큰지 신경 쓸 필요가 없습니다. 타임라인도 접히기 때문입니다. 그런 다음 첫 번째 숫자가 d 일 확률은 [LG (d+1)-LG (d)]/(LG10-LG1) 입니다

-응? 참고: 위의 지수 방정식은 아래의 미분 방정식의 해법이다. 이 방정식의 물리적 의미는 단위 시간 내 x(t) 의 변화가 시간 t 시 x(t) 의 값에 비례하고 축척 계수가 상수 k 라는 것입니다.

-응? 현실 세계에서는 많은 진화 과정이 위의 방정식으로 근사화될 수 있다. 특히 실제 진화의 초기 단계가 아직 포화에 이르지 않았을 때 더욱 그렇다. 위키피디아에서는 지수 감쇄, 지수 성장, 화학 중률 방정식의 퇴화 부분과 같은 많은 예를 찾을 수 있습니다.

(4) 벤포드의 법칙의 적용

-응? 어쨌든 벤더포드의 법칙을 해석하는 것은 모두 객관적이고 유용하다. 대부분의 재무 데이터는 Bendford 의 법칙을 충족하므로 이를 사용하여 재무 데이터에 사기가 있는지 확인할 수 있습니다.

-응? 당시 가장 큰 투자 사기 사건은 미국 워싱턴주에서 수사된 것으로 6543 억 8000 만 달러에 달했다. 이 사기 사건의 주모자인 케빈 로렌스 (Kevin Lawrence) 와 그의 동료들은 하이테크 체인 헬스클럽을 설립한다는 이름으로 5000 여 명의 투자자들로부터 대량의 자금을 모았다. 그런 다음 공금을 유용해서 자신을 위해 저택, 호차, 보석 등을 샀다. 그들은 자신의 위법 행위를 감추기 위해 해외 회사와 은행 간에 자금을 자주 이체하고, 인위적으로 가짜 장부를 만들어 투자자들에게 장사가 번창하는 허상을 빚고 있다. 다행히도, 회계 (대럴 도렐) 는 그때 뭔가 잘못되었다고 느꼈다. 그는 7 만여 부의 수표와 송금과 관련된 데이터를 수집하고 이 데이터의 첫 번째 숫자의 발생 빈도를 벤더포드 법칙과 비교한 결과 이 수치가 첫 번째 디지털 법칙의 검증을 통과하지 못한 것으로 드러났다. 마침내 3 년간의 사법조사를 거쳐 이 투자 사기는 마침내 폭로되었다. 2002 년에 로렌스는 20 년 형을 선고받았다.

-응? 200 1 년, 미국 최대 에너지 거래상인 엔론이 파산을 선언했고, 고위 경영진이 가짜 장부를 한 혐의를 받고 있다는 소문이 돌고 있다. 엔론 임원이 재무 데이터를 변경했다고 해서 그들이 발표한 주당 수익 데이터 200 1-2002 는 이 포드의 법칙에 맞지 않는다고 한다. 200 1, 1 년 2 월, 전 세계 500 대 기업 중 7 번째 회사가 미국 증권거래위원회에 회계위조를 인정했다. 엔론 사건은 회계 데이터 조작에 대한 대중의 관심을 불러일으켰고, 2002 년 8 월 사반스 오크슬리 법안의 탄생으로 이어졌다.

-응? 미국 세무국도 본포드 규칙을 사용하여 세금 신고서를 점검하고 탈세 행위를 찾아냈다. 이 규칙을 이용해 미국 전 대통령 빌 클린턴 10 의 세금 신고 데이터를 조사해 본 적이 있지만 허점은 발견되지 않았다고 한다.

-응? 게다가, 벤포드의 법칙은 주식 시장 분석과 선거 투표에서 사기 행위를 테스트하는 데도 사용된다.

-응? 분명히, 벤포드의 법칙은 데이터 조작과 싸우는 큰 살인자이다. 물론, 우리는 그 적용 조건에 주의해야 합니다.

1. 데이터는 정기적으로 정렬할 수 없습니다.

수동으로 데이터를 설정할 수 없습니다.

3. 데이터의 양은 충분히 커야 합니다. 어떤 사람들은 3,000 개가 넘는다고 하는데, 근거가 있는지 없는지 모르겠다.

항상 옳은 것은 아닙니다. 이것은 현재 해결되지 않은 수수께끼입니다.

5. 정확성도 표준문제이기도 합니다. 몬테카를로 알고리즘에 더 가깝기 때문입니다.