楼主:
tonglie (世界真奇妙)
2015-11-02 13:22:16小妹(想用关键字减少被批的情形XD)完全是与coding无关的财会背景
因缘际会之下听闻了python可以下载网页的数据库
最近因为兴趣想要做个副业来兼差
想要加速进货速度(进货来源目前是日本的雅虎拍卖)
朋友说python可以存取数据库
原本想要花钱请人写个程式
然后又听另外的朋友建议有可能我买了一个程式
可能日本雅虎端那边更改设定变成我程式只能用一次
才突发奇想想自己学写看看(主要也是想省点钱囧)
后来上了cousera的课,但发现莱斯的课比较像教写游戏
因为毫无基础,也很难从游戏举一反三变成数据库存取
原本想报名台大的python课,想说有老师的话还可以顺便偷问几招额外的
但朋友一直用我根本不知道要学几年才能学会爬虫打压我的信心QQ
叫我还是赶快找个专业人士合作比较实在(但我这idea这么low怎么吸引专业人士XD)
想问一下如果要自学的话,要达成上述目标我能做什么呢?
实在没有相熟的朋友是资工背景且娴熟爬虫的提供我协助
所以才想上版来请教大家
我有看一些书单,但也爬了很多文有说应该要再懂OOXX才可以XXOO
不晓得是否有热心的版友让我请教请教
谢谢大家
作者:
walelile (wakaka)
2015-11-02 14:42:00你的需求不用全部自己写,有爬虫套件scrapy
楼主:
tonglie (世界真奇妙)
2015-11-02 15:15:00谢谢楼上再度指引!! 我真的太无知了什么都不懂我再研究研究该套件内容QQQQQQ 感谢感谢
作者:
Neisseria (Neisseria)
2015-11-02 15:40:00楼主:
tonglie (世界真奇妙)
2015-11-02 19:34:00谢谢N大:D!
跟你想的不太依样 不是存取数据库 只是抓资料下来另外就是 拍卖的东西 他设定的关键字很不一定所以跟你想的东西到最后会有误差是一定的
作者:
bigpigbigpig (To littlepig with love)
2015-11-02 21:27:00我是用 lxml 模组啦,还蛮方便的,Google 一下吧 :)
楼主:
tonglie (世界真奇妙)
2015-11-02 22:56:00喔喔 原来是这样 我再研究研究 有误差没关系 因为一页页点真的好漫长囧> 才想说要怎么提高效率谢谢b大M大的建议!
coursera有另一堂programming for everyone(Python)系列教的非常好
举例来讲 你去露天查"洛克人"就好了然后注意一样商品 在去看同样商品 其他卖家的描述你就会知道困难点在哪边了...最终还是要回归到人来辨识如果你是要固定同一个卖家 那就当我没说
楼主:
tonglie (世界真奇妙)
2015-11-03 11:00:00谢谢g大建议 来去看看该堂课 我这两天也有看到python有门新课程 看起来似乎比较贴近我想做的事谢谢m大 其实我当初就是想说先下载下来再人工辨识每一样商品 因为日本雅虎的商品量是台湾的好几百倍了 鼠标都点到要起火了XD 我会再试试看的 谢谢QQ (虽然那步可能还很远 我现在连爬都不会爬 现在还很难想像障碍赛的未来
可不可以简易叙述一下需求呢?说不定有适合度很高的套件可以用
作者:
Neisseria (Neisseria)
2015-11-03 20:59:00作者:
mirage7714 (C'est mon soeur.)
2015-11-03 22:26:00推programming for everyone的python课程 基础教很多
作者:
jokebbs (bbs://)
2015-11-06 23:39:00推密西根大学的那个秃头教授+1 讲得很好
作者: Tr3e 2015-11-17 17:33:00
udacity的intro to CS就是用写爬虫来入门,你可以试试