[问题] kmeans 大数据 版本

楼主: f496328mm (为什么会流泪)   2016-08-15 15:57:04
跑kmeans出现以下讯息
Warning message:
Quick-TRANSfer stage steps exceeded maximum (= 1318974700)
看起来是 已达最大值
我的data 有2.6千万笔
想问问看有没有
大数据的kmeans版本
或是解决方法 或是说这是warning所以不用理他???
谢谢
作者: qhair (卡早睡卡有眠)   2016-08-15 20:34:00
如果会用Spark的话可以用SparkR的kmeans
作者: celestialgod (天)   2016-08-15 22:36:00
你没有多台机器跑spark效益就不大了
作者: Wush978 (拒看低质媒体)   2016-08-15 23:56:00
Sampling?
作者: cywhale (cywhale)   2016-08-16 14:31:00
我知道biganalytics有bigkmeans这个function不过我没用过
作者: clickhere (It's time to go home.)   2016-08-16 22:22:00
pmclust::pkmeans 要多大有多大, 只要机器够多就行.

Links booklink

Contact Us: admin [ a t ] ucptt.com