小弟我想要抓取一个具有固定class的div里面所有的东西
而因为网页不同,这个div标签里头也有数量不一的其他的div标签
为了避免截断在错误的结尾标签,我的想法是将里面的div标签都配对
也就是每碰到一个<div>就配给一个</div>,直到碰到对的那个
再经过各种乱凑(?)实验之后
最成功的是下面这个
/<div class="c_1"[\s\S]+?>(?:(?:<div[\s\S]+?>[\s\S]+?<\/div>)*[\s\S]+?)+?<\/div>/
虽然实验成功了,不过还是想请问一下
这样的写法会有什么不好的bug吗?
有什么需要改进的地方呢?
或是有更简洁的方式达到我的需求呢?