[问题类型]:程式咨询
意见调查(我对R 有个很棒的想法,想问问大家的意见)
程式咨询(我想用R 做某件事情,但是我不知道要怎么用R 写出来)
效能咨询(我想让R 跑更快)
经验咨询(我想用R 连接某些数据库,请问大家的经验)
[软件熟悉度]:入门
请把以下不需要的部份删除
新手(没写过程式,R 是我的第一次)
入门(写过其他程式,只是对语法不熟悉)
使用者(已经有用R 做过不少作品)
开发者(有撰写R 的套件经验)
[问题叙述]:
如这张照片所圈示 这是一份KTV点餐纪录
本来有些餐点价格是开箱低消0元优惠的删除了
一份单子会有很多不同食物 这资料是以食物种类建档 每种食物就是一笔
不同的人去消费原则上是以BILLCODE去做区分
我本来是想分析性别比(男生/总人数)的差异对于点餐组成有没有影响
后来发现性别比居然也有290几种数值
不能以简单长条图或圆饼图了
想问大家有没有好用的套件或一些做法可以达到我的目的
请简略描述你所要做的事情,或是这个程式的目的
[程式范例]:
library(dplyr)
library(tidyr)
library(ggplot2)
library(data.table)
#读党 建立性别比
ticketdata1 <- fread( "customerBehavior3.csv", stringsAsFactors = FALSE,
header = TRUE, sep = ",",encoding="UTF-8" )
ticketdata1$Genderratio <- ticketdata1$MaleNumber / ticketdata1$CustomerNumber
#删除优惠0元点单(子集合)
MealSpending.sub <- subset(ticketdata1,MealSpending > 0, select =
StoreCode:Genderratio )
unique(MealSpending.sub$Genderratio)
grouped <- group_by(MealSpending.sub, Genderratio , MealType)
#啤酒类出现最多次
table(grouped$MealType)
目前是这样而已 因为下一步不确定怎么分析比较有效率
张贴能够重现错误的程式码,可以帮助版友更快的帮你解决问题
建立重现错误的方法可以参考:
程式码可贴于以下网站:
http://ideone.com/
http://codepad.org
http://pastie.org/
http://nopaste.info/
http://pastebin.com/
http://paste.plurk.com
http://gist.github.com/
http://nopaste.csie.org/
[环境叙述]:
请提供 sessionInfo() 的输出结果,
里面含有所有你使用的作业系统、R 的版本和套件版本资讯,
让版友更容易找出错误
[关键字]:
选择性,也许未来有用