[问题] 使用R进行购物篮分析

楼主: zhiying (paipai)   2018-03-12 15:25:51
[问题类型]:
程式咨询(我想用R 做某件事情,但是我不知道要怎么用R 写出来)
[软件熟悉度]:
新手(没写过程式,R 是我的第一次)
[问题叙述]:
我想用apriori做十三种药物的关联性分析
[程式范例]:
我是参考这篇
http://www.cc.ntu.edu.tw/chinese/epaper/0036/20160321_3606.html
我的资料是二元档,共13个变项,
beer=read.xlsx("d:\\stella\\R\\beer.xls",header=T,sheetIndex=1)
beer=as.matrix(beer)
进行到这里之后,要计算关联性
rule=apriori(beer,parameter=list(supp=0.2,conf=0.8))
可是计算的结果,我的lhs字段都是空白的,只有rhs有我的13个变项,
想请问是这什么原因?谢谢!
[环境叙述]:
R 3.4.3
作者: clansoda (小笨)   2018-03-12 19:01:00
感觉跟前几篇文章有87%像
楼主: zhiying (paipai)   2018-03-12 22:42:00
我有先搜寻"购物篮",版上的文章,但没看到跟我一样的问题,但也可能是我是新手看不出来lol我的档案各个变量已经是0和1,不过我跑了转换矩阵那行程式后,虽然档案描述有变成矩阵,可是打开档案呈现的样子还是跟转换前的一样, 这是正确的吗?还麻烦各位高手帮忙解惑了!
作者: Luluemiko (露露)   2018-03-13 00:22:00
关键字可以找关联性分析
作者: f496328mm (为什么会流泪)   2018-03-13 10:22:00
你范例能跑成功吗?如果可以,看看data的差异,或者是参数的问题
作者: clansoda (小笨)   2018-03-13 10:55:00
建议你调低你的supp跟conf,你这两个都很高,可以看一下document这两项分别代表什么,conf 0.8几乎筛不出任何值是很正常的
楼主: zhiying (paipai)   2018-03-13 12:24:00
谢谢大家的回复!不好意思没有讲清楚,我的样本数有13000,supp跟conf我都调到小数点下好几位,但结果都还是跑不出来,这样是代表我的资料之间没有关联性吗?我跑范例beer那个就跑的出来,观察了资料,都是0,1的二元档,差在我的变量和资料比数多很多。
作者: clansoda (小笨)   2018-03-13 12:45:00
很难说,但我的经验是调低以后,那种空白的现象还是会有但是如果一笔有效资料都没有的话,可能你还是要检视自己的资料,究竟有没有你想要的关系
作者: f496328mm (为什么会流泪)   2018-03-13 13:04:00
有办法公开 DATA 吗? 这样会比较清楚问题
楼主: zhiying (paipai)   2018-03-13 18:10:00
https://i.imgur.com/PiDsqzW.jpg后来又检查了资料发现是我在合并资料的时候犯错,难怪都跑不出来。谢谢大家的提醒!然后我想再请问,有办法设定lift的下限吗?还有这个网络图,有办法加入各个品项的出现频率大小吗?谢谢!然后我发现在加上minlen=2这个条件设定就可以避免掉lhs是空白的结果,不知道这样对不对。
作者: Luluemiko (露露)   2018-03-13 18:36:00
lift不能设下限,只能事后从结果筛出子集合

Links booklink

Contact Us: admin [ a t ] ucptt.com