Re: [问题] 正规表达式 有好方法表达 非数字的字母吗

楼主: Neisseria (Neisseria)   2016-03-08 20:54:18
※ 引述《JackBaska (Baska)》之铭言:
: 顺便问一下,有没有人知道python有没有办法处理模糊查询跟同意
: 同音的功能 ? 或是有没有人在github上看过有人分享的 ? 还是要
: 自己刻 ?
如果是要找意义相关的,可以看 semantic similarity
基本的想法是,用已知的字汇库,找出两个字之间的关连性,求距离
常见的字汇库有 WordNet 或 Cyc 等等
如果想看更多内容,可上维基百科,或是看以下这篇
Description and Evaluation of Semantic Similarity Measures Approaches
http://arxiv.org/pdf/1310.8059.pdf (免费 PDF)
要做 semantic similarity,通常不建议自已土炮字汇库
因为你还要证实你的字汇库有公信力
这个和一些测量字串距离的方法不太一样
一些测字串距离的方法是算 A 字串经过数个代换步骤后成 B 字串
然后借由一些加权的方式,计算出 A 和 B 的距离
看原 po 想用那一种查询
作者: JackBaska (Baska)   2016-03-08 23:22:00
感谢你的分享 ^^我手上有些资料是可以土炮的拉,但有些不行所以我先放著另外还有一些比较麻烦的像是地址连结的我还没想好怎解像是有市没有县 有县没有乡 然后接地址或,各种组合目前是知道R可以干脆把这问题送给google反正ggmap那么好用,当作那些都看不到直接抓经纬度,但还在想还有什么解法可以解这问题

Links booklink

Contact Us: admin [ a t ] ucptt.com