楼主:
darkk6 (Mr. Pan)
2019-08-31 10:13:09※ 引述《NeedSomeone (not NeedAnyone)》之铭言:
: 原始的档案大概如下
: Source IP01: 1.1.1.1
: Source IP02: 2.2.2.2 Source IP03: 3.3.3.3
: 这个档案有点不太整齐 但是都是Source IPxx: 不定数空格 ip
: 今天想抓出某个ip(如ip01后的ip 1.1.1.1)
假设:
1. IP## 的 ## 不会重复
2. 原始档案有可能会换行
3. Source IP## 后面一定会有空白,只是不确定数量
IPv4 的 Regular expression :
(?:(?:25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9][0-9]|[0-9])\.){3}(?:25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9][0-9]|[0-9])
1. 我这边直接拿你的 expression 来用没特别确认 (因为这篇重点不在 IPv4 本身)
2. 我把所有用来 group 的括号加上 ?: 做 non capture grouping
如果之后还有其他用途的话比较方便计算 group
定义:
IP## 表示你要找的目标,请自行替换,例如 : IP03
[:IPv4:] 底下代表上面的那个 IPv4 expression,因为太长了,
所以我底下用[:IPv4:] 表示。记得替换成上面的那段。
Expression :
(?<=Source IP##:)\s+([:IPv4:])
解释:
利用 positive lookbehind , 限定要找特定 pattern 后的目标
但由于 lookbehind 内不能使用不定长度,所以 \s+ 放在外面,
另外透过 capture 抓出 IP
利用 find 或 match 之类的方法取出 group 1 即可拿到 IP
NOTE :group 0 是整个 match 的部分,会包含空格
如果 IP##: 后面不一定有空白,就把 + 改成 *
假设要找 的是 IP03 的,完整 expression
(?<=Source
IP03:)\s+((?:(?:25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9][0-9]|[0-9])\.){3}
(?:25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9][0-9]|[0-9]))
我把范例放在 regex101 上 : https://regex101.com/r/sG1qP1/498
注意:
不是所有工具、语言都支援 lookbehind , 例如 JavaScript 要 ES2018 才开始支援
作者:
cutekid (可爱小孩子)
2019-08-31 14:20:00推(Y),详细!
作者: goldie (阿良) 2019-08-31 21:20:00
讲解的好仔细,用心 推
真的很感谢 不过google apps script不支援lookbehind但是您的启发 让我可以用lookahead反向过来处理再一次感谢 谢谢
不用look behind 吧,直接在patten 写前面那堆,然后IP 部份用capture group 取就好
(?<=Source IP..:)\s+\d\.\d\.\d\.\d ,这样是不是比较短
作者:
cutekid (可爱小孩子)
2019-09-14 03:41:00To 楼上: 你这样只会匹配一个数字喔,例: 1.2.3.4
那只是范例阿,改一下就好(?<=Source IP01:)\s+\d{1,}\.\d{1,}\.\d{1,}\.\d{1,}
作者: monkeytiger (JOSE) 2019-09-22 18:01:00
(Source IP\d\d\:)\s+(那串IP的regex)
作者:
cutekid (可爱小孩子)
2019-09-29 03:51:00To 楼楼上: IP 的数字是 0~255而已喔!