[资源] 求救爬虫高手

楼主: mirasol0524 (solet)   2016-07-19 15:51:15
Hi,
我是个华语老师, 对语料库一窍不通,但最近接触后,我觉得可以将其融入语言教学。
最近异想天开的想利用大数据的概念,制作一个词网,可以帮助学生以主题式的学习。
(一般的教科书都只能提供有限的词表,我想利用大数据技术可以制作出真实、且量大的
词网)
所以自己就开始在网络上自学了一些爬虫的软件(import.io, kimono弄了半天才发现已关
闭)和语言(scrapy)。
四处撞墙了半天,才鼻青脸肿的来向各位请益。(不经一事,不长一智><)
目前希望从餐饮开始,所以自己研究了一下,可以从譬如说:
从爱评网上,将各类餐厅的菜单抓下来 (一定要将餐厅分类哦~)
爱评上很优秀的是它有menu这个网址,我想只要是爬虫高手应该不难爬吧~(I guess…
..)
http://www.ipeen.com.tw/shop/607566/menu
请有兴趣帮忙的高手email给我,
Email:[email protected]/*
作者: cocobox (钱盒子)   2016-07-20 15:08:00
你可以到R_Language那边问看看.
楼主: mirasol0524 (solet)   2016-07-21 14:42:00
感谢~
继续阅读

Links booklink

Contact Us: admin [ a t ] ucptt.com