Re: [问题] [年月日...] 的 regular expression

楼主: s25g5d4 (function(){})()   2016-08-01 20:15:37
※ 引述《ggirls》之铭言:
: 有时可以没有年,有时可以没有日,但若是“年-日”
: 就应拆分成两个日期。
也就是
年月日
年月
月日



对吧
先分析一下 月 出现最多次
所以以月为主 pattern 而没有月的当例外处理
可以写成 (?:\s*\d+\s*年)?(?:\s*\d+\s*月(?:\s*\d+\s*日)?)
例外的两个规则分别是 年 与 日
所以写成 \s*\d+\s*[年日]
最后用 | 连起来
(?:\s*\d+\s*年)?(?:\s*\d+\s*月(?:\s*\d+\s*日)?)|\s*\d+\s*[年日]
我的执行结果:
> '1月 1日 2年 2月 2 日 3年3月 4年 5年5月 6年 7日'
.match(/(?:[0-9 ]+年)?(?:[0-9 ]+月(?:[0-9 ]+日)?)|[0-9 ]+[年日]/g)
[ '1月 1日', ' 2年 2月 2 日', ' 3年3月', ' 4年', ' 5年5月', ' 6年', ' 7日' ]
语言为 JavaScript (Node.js v6.2.1)
作者: mars90226 (火星人)   2016-08-01 22:49:00
这个感觉不错,不过如果要抓年月日的资料呢?好像只能用程式判断最后拿到的资料是年还是日
作者: ggirls (哥)   2016-08-02 09:38:00
真的很高兴有人可以教我如何思考。试着改写中。目前卡在我把三个"?:"拿掉,会得到错误结果。我的观念里,non-capturing group对结果不会引响,只是显性或隐性分组的分别吗?好像我的观念是错的。我用Python3.4。拿掉non-capturing我这边的结果是:[('', '1月 1日', ' 1日'), (' 2年', ' 2月 2 日', ' 2日'), (' 3年', '3月', ''), ('', '', ''), (' 5年', '5月', ''), ('', '', ''), ('', '', '')]
作者: eggimage (目前没有名片)   2016-12-10 18:52:00
我之前也发生过很多次 yahoo本来就很烂 还外加奇摩
作者: madeinchina (中国制造™)   2016-12-10 18:53:00
之前即时通死都不让我登入 后来我就改用MSN了...
作者: eggimage (目前没有名片)   2016-12-10 18:53:00
发现MSN也不给你登....
作者: madeinchina (中国制造™)   2016-12-10 18:55:00
就改登PTT了
作者: eggimage (目前没有名片)   2016-12-10 18:57:00
最近ptt也一直断....
作者: freely10469 (  ̄ (工)  ̄ )   2016-12-10 19:57:00
只好掀桌出去裸奔了...

Links booklink

Contact Us: admin [ a t ] ucptt.com