楼主:
a3236852 (serena)
2018-03-06 11:40:12[问题类型]:
程式咨询(我想用R 做某件事情,但是我不知道要怎么用R 写出来)
[软件熟悉度]:
入门(写过其他程式,只是对语法不熟悉)
[问题叙述]:
我要用R做关联式规则,
使用arules套件,分析出来不知道为什么会有空集合?(不知道怎么描述XD)
我想可能是我最小信赖度(min confidence)调太低?
想知道为什么调太低会出现空集合?
还有想知道要怎么提高分析出来的结果数量,
本来以为是增加资料,但因为原始样本就只有这些,
所以用随机的方式增加原本的样本,
结果不知道是不是因为关联式规则算法是
在全部东西里占几分之几,还有在a东西里b也存在的几分之几,
所以整体就跟着增加,并没有比较多的分析结果
后来把资料删减到50笔反而比较多
有没有什么方法可以将结果增加呢?除了得到更多原始资料,
谢谢~
[程式范例]:
张贴能够重现错误的程式码,可以帮助版友更快的帮你解决问题
建立重现错误的方法可以参考:
install.packages("readxl")
library(readxl)
path <- "random.csv"
data <- read.csv(path, header=T, sep=",")
data1=as.matrix(data)
require(arules)
rule <- apriori(data1,parameter=list( supp=0.1, conf=0.1))
inspect(rule)
https://imgur.com/kH9IvlP
资料大概是长这样 有49个项目A1~A49
原始资料笔数是大约是五百笔,
结果是这样
https://imgur.com/PCEz9We
[环境叙述]:
R version 3.4.1
[关键字]:
关联式规则
作者: sw52099 (sw52099) 2018-03-06 21:49:00
Supp太高 我的经验是6000笔资料都会把supp调到0.003之类的才会有结果你的supp是0.1,资料是500笔,代表同一个规则要出现500*0.1=50次(就是结果里的count)才会算进来。而500笔资料要出现相同的规则50次,感觉上是有点困难啦,有错请各位指正。呃...不好意思,图没跑出来,看来我回答错了,请忽略上面一大段(潜水)
基本上关联规则是你筛选出给定support, confidence 的结果,只是根据条件可以用apriori 算法加速筛选,而资料中的每种组合都有一组supp, con,算法只是选出来给你看,所以如果妳想增加规则的结果,你可以考虑先列出所有的规则组合,再看看你要多少结果,反著切sup跟con。如果有新资料,再用妳上一个切的结果做样本参数,然后就看你想怎样做了。