Re: [问题] 留下比对正确的部分

楼主: godspeedlee (妳,我可以)   2011-05-17 14:08:07
※ 引述《no1kk (心中在下雨)》之铭言:
: 我要作的是把html档案之中
: 图片的tag留下来,其他全部删除
: 从精华区看到
: 要比对img的tag的方法是
: <img[^>]*>
: 但是我要怎么把其他的部分全部清除呢?
: 我补充一下,因为我是用Notepad++这种文字编辑器的搜寻/取代功能
: 搜寻可以输入正规表示法
: 但是无法先把比对正确的部分存下来后再吐出来
: 这是比较麻烦的
: 似乎只能搜寻所有不是<img[^>]*>的部分,并且清除
有大量档案,何不考虑grep甚至是perl?
如果在您的问题中“把图片的tag留下来,其他全部删除”
等于“只取出图片的tag”
用后者的角度思考事情会比较容易,你也已经有答案了
如果是前者就麻烦了,下面这个 regex pattern 可删除除了<img>
之外的所有 tag
<(?!img\b)[^>]+>
但是除了 tag 之外,还有本文,还有 javascript, css...把这些通通用
regex 删除可累人了

Links booklink

Contact Us: admin [ a t ] ucptt.com