[问题] 如何判断网页是否有更新?

楼主: james732 (好人超)   2015-06-05 01:14:07
我目前在写个app
用jsoup从店家网页把商品、价格抓下来
http://www.landtop.com.tw/products.php?types=1
抓资料与分析已经完成了,接下来我想做的是:
侦测这次抓到的网页,与上次抓到的网页是否有分别 (店家是否有更新网页)
1.如果有分别,就抓出哪些手机是新上架、降价、涨价等
2.如果没有分别,那就什么都不做
不过问题就是,上次抓到的资料,我应该要怎么储存下来、存成什么型式
才能跟这次抓到的资料做比较、分析呢?
我最困扰的是,不知道要怎么判断“店家是否有更新网页”
这样就会变成
1.第一次开app,抓到某手机价格为20000,判断为“新上架”
(店家更新网页)
2.第二次开app,抓到同手机价格变为19000,判断为“降价”
3.立刻第三次开app,抓到同手机价格变为19000,判断为“不变”
但事实上第二次与第三次开启时,店家并没有更新网页
所以第三次开app时,应直接取得第二次开启的判断结果,得到“降价”才对
请问这种需求,应该要怎么做比较好呢?谢谢
作者: A4P8T6X9 (残废的名侦探)   2015-06-05 09:43:00
想办法存时间,商品名称,日期
作者: blackZ2   2015-06-05 10:31:00
没有分别之后,再判断资料取得日期,超过多久,就判断不变另外我觉得不应该以开启app作为更新判断的时间点一秒前开启app为“新上架” 下秒开启app为“不变”个人认为应该为周间为判断点*以
作者: ckvir (ckvir)   2015-06-05 10:44:00
我建议是额外架设一台server 去抓, 然后存 db, app 再去你db 抓资料,或是 server gcm 推送app, 不然你用 app 定时抓会很耗电
作者: LaPass (LaPass)   2015-06-05 12:57:00
商品有没有绝对的id? 最好用id作判断
作者: Fnd (红尘自有千千愁)   2015-06-07 00:18:00
推上面用server抓,抓完写个function比对,有变动就push,然后写支api,当resume或start的时候去call api更新app资料?开启就检查就存成两个档案去比对?
作者: wuliou (wuliou)   2015-06-07 11:09:00
另外用server抓简单多啦 何必用手机做这种事

Links booklink

Contact Us: admin [ a t ] ucptt.com