我说的是期刊的网站
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4072244/
http://imgur.com/a/NvevH
虽然网站有提供PDF,但可以的话,我是喜欢HTML阅读的人,可以根据视窗大小
自动换行,配合firefox的searchWP还可多重关键字标定。
早期我是直接原始码去抓,一来很累,二来我发现有些css没一起下来格式就会跑掉,
甚至文字变乱读不了。请问如果我今天只想抓中间的本文,保留格式,
然后两旁的内容不要,请问可以办到吗?