[问题] 从评论提取特征并做成分类器

楼主: nchunerdy120 (batman)   2020-05-08 23:01:48
小弟目前是学生,有个专案是要从几万笔的评论中提取出几个重要的特征,并且将这些特
征拿来制造筛选器。
例如从餐厅的评论中得出“食物种类”、“食物价钱”、“食物口味”非常重要,就用这
三个当作分类器的attribute。然后在给定这些attribute值的时候,就能够导向对应的餐
厅。
自己思考一下作法后,归类出两个问题:
首先是该如何提取特征?我目前的想法是使用tf-idf向量化,找出tf-idf最高的前几个字
当作晒选器的attribute(X)。请问还有其他更适合的方式吗?
第二个问题是该如何把餐厅(Y)跟选定的attribute(X)做连结?毕竟无法连结的话就
无法训练分类器,所以该怎么把这些attribute(X)跟餐厅(Y)是个大问题... 目前怎
么解决这件事情小弟完全没有头绪,不知道有没有大神可以解答Orz [编辑]:选定att
ribute之后该怎么将评论中对应attribute的文字量化,例如评论中提到“食物很好吃”
,那该如何将“好吃”量化放入食物口味的attribute中
麻烦各位乡民们替小弟解惑,如果有上述方法以外的作法也麻烦各位不吝提出,感谢!
作者: TuCH (谬客)   2020-05-08 23:40:00
第二个问题是?? 评论就能产生X吧
作者: jigfopsda (jigfopsda)   2020-05-08 23:51:00
给Y一个具体的定义,然后看一下 supervised learning看看?
楼主: nchunerdy120 (batman)   2020-05-09 00:12:00
y就是餐厅唷,例如“争鲜”“必胜客”
作者: s860134 (s860134)   2020-05-09 00:16:00
你想要的应该是推荐系统,把评论关键字转换成加权分数根据加权分数算出排名推荐出来吧?关键字 -> 分数 想是没什么客观标准拉...
作者: ddavid (谎言接线生)   2020-05-09 00:53:00
讲推荐系统很笼统,同样是推荐系统,其外表的目的性跟内部的实际方法都可能天差地远你在用的导航系统也是推荐系统(推荐你路线),Google广告也是推荐系统(尝试推荐你更可能有兴趣的广告),Facebook推荐你可能认识的好友也是推荐系统,推荐系统其实是一个太大的类别,只讲推荐系统其实没有解答到到实作方向的答案
作者: silverair (木栅福山雅治)   2020-05-09 01:35:00
RNN语意分类?tensorflow官方教学有输入IMDB评论,然后判断这个评论是属于正面或负面
作者: ouryouth (ouryouth)   2020-05-13 19:32:00
大部分的评论都有这三种attributes吗 没有的话感觉data很难处理
作者: ddavid (谎言接线生)   2020-05-21 15:21:00
楼上,当然不一定有啊,没有的你就是要给个missing值之类的来标记

Links booklink

Contact Us: admin [ a t ] ucptt.com