研究方法-资料探勘问题

楼主: jimkukky (kukky)   2016-02-01 16:08:11
假设我有1000笔资料,品项为10种
我是以人工方式根据品项的次数高低去分组,
分为A、B、C、D四个资料组,
suppport为0.1,
把四组分别下去跑关联规则,
类似多重支持度的概念。
而目前问题是想利用自动化方式去跑关联规则,
重点是不需要以人去根据次数高低去分组,
不知道有何方法?可以自动化跑多重支持度的方式或者是以次数频率分析的方法之类的?
麻烦大大谢谢!
作者: hsnuyi (羊咩咩~)   2016-02-02 01:03:00
看不太懂你想做啥 是要把1000笔资料自动分成四组?然后这四组分别要有高度相关性是吗?
作者: mosenay   2016-02-03 23:29:00
单纯分组的话可以参考一下cluster analysis不过不清楚你说的每组具有相关是指组内还是组间
作者: hsnuyi (羊咩咩~)   2016-02-05 01:07:00
clustering有很多种方法啊 你try过哪些了呢?google clustering algorithm, wiki里就一大堆python也有ML的package可以用 应该几行code就可实作了

Links booklink

Contact Us: admin [ a t ] ucptt.com