[问题] 文字内容取资料 regex

楼主: skitty (aki)   2016-12-12 08:55:00
满常要去打网页取资料
通常读回来的内容长的会是下面这样
A=xxx,B=ooo,C=yyy,…
A="aaa" B="bbb"……
中间分隔的可能是逗号分号或空白
等号右边的值可能有放引号或没引号
我太菜只会用Split去做分割
想请问有比较好的处理方式吗?
A=xxx,B=ooo…算一笔资料
一次处理的量大概都几千笔
作者: IKAFIRE (没有)   2016-12-12 09:18:00
regex
作者: GoalBased (Artificail Intelligence)   2016-12-12 12:43:00
你用spilit有遇到什么问题吗 才两种状况很好处理吧
作者: vi000246 (Vi)   2016-12-12 12:59:00
\w="?\w+"?
作者: Litfal (Litfal)   2016-12-12 14:44:00
用regex比较好,用split要考虑双引号里面有分隔符号的状况
作者: Peruheru (还在想)   2016-12-12 17:12:00
如果有单引号,前面变量有超过一个字 \w+=["']?\w+["']?不过如果引号不对称也会符合就是了,像是 ab="89'用 (\w+)=["']?(\w+)["']? 的话,群组1和群组2就是要的剩下就是看会不会有其他符号(小数点之类)等要加入模式内有专版RegExp唷

Links booklink

Contact Us: admin [ a t ] ucptt.com