[问题] 以性别比预测或观察点餐内容

楼主: ms0344303 (我不玩了)   2017-05-30 18:34:08
[问题类型]:程式咨询
意见调查(我对R 有个很棒的想法,想问问大家的意见)
程式咨询(我想用R 做某件事情,但是我不知道要怎么用R 写出来)
效能咨询(我想让R 跑更快)
经验咨询(我想用R 连接某些数据库,请问大家的经验)
[软件熟悉度]:入门
请把以下不需要的部份删除
新手(没写过程式,R 是我的第一次)
入门(写过其他程式,只是对语法不熟悉)
使用者(已经有用R 做过不少作品)
开发者(有撰写R 的套件经验)
[问题叙述]:

如这张照片所圈示 这是一份KTV点餐纪录
本来有些餐点价格是开箱低消0元优惠的删除了
一份单子会有很多不同食物 这资料是以食物种类建档 每种食物就是一笔
不同的人去消费原则上是以BILLCODE去做区分
我本来是想分析性别比(男生/总人数)的差异对于点餐组成有没有影响
后来发现性别比居然也有290几种数值
不能以简单长条图或圆饼图了
想问大家有没有好用的套件或一些做法可以达到我的目的
请简略描述你所要做的事情,或是这个程式的目的
[程式范例]:
library(dplyr)
library(tidyr)
library(ggplot2)
library(data.table)
#读党 建立性别比
ticketdata1 <- fread( "customerBehavior3.csv", stringsAsFactors = FALSE,
header = TRUE, sep = ",",encoding="UTF-8" )
ticketdata1$Genderratio <- ticketdata1$MaleNumber / ticketdata1$CustomerNumber
#删除优惠0元点单(子集合)
MealSpending.sub <- subset(ticketdata1,MealSpending > 0, select =
StoreCode:Genderratio )
unique(MealSpending.sub$Genderratio)
grouped <- group_by(MealSpending.sub, Genderratio , MealType)
#啤酒类出现最多次
table(grouped$MealType)
目前是这样而已 因为下一步不确定怎么分析比较有效率
张贴能够重现错误的程式码,可以帮助版友更快的帮你解决问题
建立重现错误的方法可以参考:
程式码可贴于以下网站:
http://ideone.com/
http://codepad.org
http://pastie.org/
http://nopaste.info/
http://pastebin.com/
http://paste.plurk.com
http://gist.github.com/
http://nopaste.csie.org/
[环境叙述]:
请提供 sessionInfo() 的输出结果,
里面含有所有你使用的作业系统、R 的版本和套件版本资讯,
让版友更容易找出错误
[关键字]:
选择性,也许未来有用
作者: hohiyan (海洋)   2017-05-30 22:09:00
你可能需要先把你的研究/分析问题弄清楚一点软件只是工具,你丢什么进去它就吐什么给你如‘对于点餐组成有没有影响’是指什么样的影响?数量上的影响?种类上的影响?点餐时段上的影响?
楼主: ms0344303 (我不玩了)   2017-05-30 22:33:00
这边组成是指种类上的影响
作者: cd12631 (<(◥█◤△◥█◤)>)   2017-05-30 22:38:00
你可以尝试先把性别比>0.5的抓出来因为性别比>0.5 等于该组客人中男性占多数然后把性别比>0.5的资料全部置换成同一种输入去看看在男性多的时候 每种食物出现的笔数就可以去作一个长条图显示在男性为多的客人中 食物销量反之要看女生为多就抓<0.5更进阶一点可以去做一些连结分析的模型

Links booklink

Contact Us: admin [ a t ] ucptt.com