기금넷 공식사이트 - 복권 조회 - 파이썬에서 개별 데이터를 수량화하는 방법

파이썬에서 개별 데이터를 수량화하는 방법

Python의 이산형 데이터 정량화 방법은 가변 변환 방법을 사용하여 해결할 수 있습니다. 범주형 데이터와 연속형 데이터는 모델 계산에 참여해야 하며 일반적으로 수치 데이터로 변환됩니다.

물론 일부 알고리즘에서는 분류 알고리즘의 의사결정 트리 및 연관 규칙과 같이 이러한 데이터가 계산에 직접 참여할 수 있도록 허용합니다. 숫자가 아닌 데이터를 숫자 데이터로 변환하는 가장 좋은 방법은 모든 범주형 또는 순서형 변수의 범위를 다중 값 형식의 한 열에서 참 값만 포함하는 여러 열로 변환하는 것입니다. True 값은 True, False 또는 0, 1로 전달될 수 있습니다. 이 부호 변환 방법을 때로 진리 변환이라고 합니다.

구체적인 코드는 다음과 같습니다.

import pandas as pddata = , (5, 10], (10, 15], (15, 20], 각 상자의 이름은 1, 2, 3, 4 등으로 설정하세요.

동일 너비 방법의 단점은 비닝 결과가 최대값에 영향을 받고 상자 수를 수동으로 지정해야 한다는 점입니다. 이는 비닝 결과에 직접적인 영향을 미칩니다.

2. 동일 빈도 방법: 동일 빈도 방법은 데이터 세트를 n개 부분으로 분해한 후의 레코드 수를 의미합니다. 각 부분은 동일합니다. 메소드는 일반적으로 pandas 라이브러리의 qcut() 함수를 사용하여 처리됩니다.