카테고리 없음
[파이썬] Scikit Learn K-Means로 Blaze
필살기쓰세요
2021. 2. 3. 12:41
적합하기 전에 pandas 데이터 프레임을 numpy 배열로 변환해야한다고 생각합니다.
from blaze import *
import numpy
from sklearn.cluster import KMeans
data_numeric = numpy.array(data('data.csv'))
data_cluster = KMeans(n_clusters=5)
data_cluster.fit(data_numeric)
-------------------sklearn.cluster.KMeans
blaze.interactive._Data
코드에서 data_numeric 유형 인 입력 데이터를 지원하지 마십시오 .
에서 지원하는 data_cluster.fit(data_numeric.peek())
유형으로 전송 된 data_numeric을 맞추는 데 사용할 수 있습니다 .DataFrame
sklearn.cluster.KMeans
데이터 세트에있는 훈련 예제의 수보다 훨씬 적은 클러스터 수 (K)를 선택하는 것이 좋습니다. 원하는 클러스터 수가 훈련 예제 수보다 크거나 같을 때 K- 평균 알고리즘을 실행하는 것은 옳지 않습니다. 원하지 않는 모양의 blaze 객체를 KMeans 함수에 전달하려고하면 오류가 발생합니다. 확인하십시오 : https://blaze.readthedocs.io/en/latest/csv.html
-------------------예, 적합하기 전에 pandas 데이터 프레임을 numpy 배열로 변환해야합니다. 이제 제대로 작동합니다 ... @ aberger가 이미 대답했다고 생각합니다.
감사합니다!
출처
https://stackoverflow.com/questions/39920176