[파이썬] Scikit Learn K-Means로 Blaze

카테고리 없음

[파이썬] Scikit Learn K-Means로 Blaze

필살기쓰세요 2021. 2. 3. 12:41

적합하기 전에 pandas 데이터 프레임을 numpy 배열로 변환해야한다고 생각합니다.

from blaze import *
import numpy

from sklearn.cluster import KMeans
data_numeric = numpy.array(data('data.csv'))
data_cluster = KMeans(n_clusters=5)
data_cluster.fit(data_numeric)

-------------------

sklearn.cluster.KMeansblaze.interactive._Data코드에서 data_numeric 유형 인 입력 데이터를 지원하지 마십시오 .

에서 지원하는 data_cluster.fit(data_numeric.peek())유형으로 전송 된 data_numeric을 맞추는 데 사용할 수 있습니다 .DataFramesklearn.cluster.KMeans

-------------------

데이터 세트에있는 훈련 예제의 수보다 훨씬 적은 클러스터 수 (K)를 선택하는 것이 좋습니다. 원하는 클러스터 수가 훈련 예제 수보다 크거나 같을 때 K- 평균 알고리즘을 실행하는 것은 옳지 않습니다. 원하지 않는 모양의 blaze 객체를 KMeans 함수에 전달하려고하면 오류가 발생합니다. 확인하십시오 : https://blaze.readthedocs.io/en/latest/csv.html

-------------------

예, 적합하기 전에 pandas 데이터 프레임을 numpy 배열로 변환해야합니다. 이제 제대로 작동합니다 ... @ aberger가 이미 대답했다고 생각합니다.

감사합니다!

출처
https://stackoverflow.com/questions/39920176