[问题] 请教如何parsing网页

楼主: liptonbin (我还存在耶)   2022-08-11 14:50:39
请问一下
我有底下网页的表格 想要用c#做parsing
例如想要抓出表格的第一栏和第二栏 (抓 <CENTER> 0 </CENTER> 中间的值)
0=36s
0=54s
....
第一栏总数相加 0+0+...+0+...=0
https://ibb.co/rQvBpxf
下面比较麻烦,格式比较不固定, (抓 30</a> </center> 前面的值)如最后一张图
0=1s
4=9s
...
...
第一栏总数相加 0+4+0+...+9+30+...+3+...+15+...+1+...+23...=85
https://ibb.co/Dw3rW7T
档案路径: https://filebin.net/8nwar5cyuh2ioi46
请问c#上该怎么做
非常感谢
作者: ga009900 (Lienfa)   2022-08-12 11:16:00
可以试试看用 regular expression
作者: liaommx (Orz)   2022-08-12 21:36:00
以爬虫的方式去抓抓看,剩下都是程式逻辑过滤资料关键字 HtmlNodeCollection
作者: wezmag (wezmag)   2022-08-13 13:54:00
Html Agility Pack 可以试试

Links booklink

Contact Us: admin [ a t ] ucptt.com