Re: [问题] 正规表达式 有好方法表达 非数字的字母吗

楼主: JackBaska (Baska)   2016-03-08 08:54:03
※ 引述《opengood5566 ( )》之铭言:
: 正规表达式
: \w代表着字母和数字和_
: \d代表数字
: 但如果要表达非数字的字母 可以[a-zA-Z] 但总觉得不简洁
: 请问有比较好的表达 非数字的字母吗?
: 感谢
单纯分享我的一个做法 , 不过先声明我是在R把这段完成了
python我对函数方法使用熟练度还在练 , 所以还没写
我在R的做法是写一个parse给 reg exp , 做这件事情 函数
大概长这样:
f(codi = "A,B" , switch = T)
大概会做的事情是把 , A B 两个字串条件转译成 regular Exp
要吃的 or 形式 , switch 是决定是要有这些条件或是没有这些
条件的内容
以这个概念我在function下面建立了一个parser,会将字串重组
并加入reg 需要的指令符号然后重新返回reg里面 , 以这个概念
为例原po的问题可以写好后在里面做一个parser跟关键字判断
如收到'*/aEn'跟 '*/AEn'还有 '*/AaEn' 或 '*/aAEn'分别
parse成大写/小写/大小写 英文的reg形式 [a-z] [A-Z] [a-zA-Z]
(大小写条件这里没差用aA 跟Aa只是预期自己后续编程一定会
偷懒乱打)
所以以后使用reg变成 , reg(parser(codition string)),这不
是真实语法只是概念
感觉这么好像没有省到,但省的是后续,因为我的case是大量,可能
要在几十万比甚至更多的资料里面捞一些关键字还有段落,需要导
入各种条件字串还有包不包括的讯息,所以我会觉得建立这样一个
parser是有他的效益在的,但若是单纯coding缩减这么做其实没啥
效益我承认
希望对原po有帮助
顺便问一下,有没有人知道python有没有办法处理模糊查询跟同意
同音的功能 ? 或是有没有人在github上看过有人分享的 ? 还是要
自己刻 ?
作者: ResolaQQ (ResolaQQ)   2016-03-08 11:21:00
不知道你要的模糊查询是啥,我用过Levenshtein是算两个字串的distance,你也可以上PyPI找找看重新想想,比对和查询好像不太一样,忽略掉我说的好了XD
楼主: JackBaska (Baska)   2016-03-08 17:30:00
我之后有一些字词会有模糊逻辑问题,如果有套件能帮我回传是否 '意思相近' 那我可以把他的结果导进我写的func帮我做reg 比对
作者: MOONY135 (谈无欲)   2016-03-08 18:51:00
感觉有像汉明距离又不像

Links booklink

Contact Us: admin [ a t ] ucptt.com