Re: [问题] Java爬延迟加载的网页

楼主: neil7758 (Neil-lin)   2015-05-05 20:10:51
※ 引述《bobyang79 (葱哥)》之铭言:
: 目前主要是想爬YouTube上的聊天室内容
: 目前看网页原始码感觉应该是可以爬的
: Youtube设计上内容一开始是"加载中..."
: 要过一段时间才会变成聊天室内容
: 但目前用Java或Jsoup去爬好像都会抓到网页一开始资料
: "加载中..."
: 不知道有没有办法做延迟读取之类的
: 有尝试过先connect后sleep(10000)再get
: 不过似乎还是不行
YouTube 留言是JavaScript 动态的,存网页下来是看不到动态资料你可以用selenium 套
件试试, 在用jsoup拆解html

Links booklink

Contact Us: admin [ a t ] ucptt.com