使用语言:Python 3
使用环境:Windows 10
我想制作一个小工具,检查公司所需的文章,其格式是否存在一致性
其中一个格式是,阿拉伯数字必须要加千分位,
例如:123,000元(正确)、123000元(错误)
我知道在这条件下,正确的数字格式应该是:r'\d{1,3}(,\d{3})*(\.\d)?'
可是我现在想要做的是反过来,
就是检查时,遇到不符合的数字就要标记起来,再以人眼确认
以免误修到原本就不是用来表示数值的阿拉伯数字,如西元年份
我想到的条件很简单,
就是只要连续四个以上的阿拉伯数字但中间没逗号就是有嫌疑,所以写r'\d{4,}'
我想请教的是,有没有办法用一条表达式,
在不根据数字后面的文字是年份或货币判断下,
把至少1900~2099年间的西元年份给排除掉
因为每篇文章要检查的条件可能高达千种以上,每种都要用一条表达式检查
数字的千分位格式只是其中一个规定,
所以我希望,不到最后一刻别用if条件判断式去排除西元年份,以免可读性变差
才想说看能否整合成一个表达式