[问题] 容错字串搜索

楼主: yoco (眠月)   2016-11-16 18:08:37
有问题想要请教资料结构算法们的大大 <(_ _)>
最近无聊,想要作个 personal project:search engine
我知道怎么在字串里面作快速的精准搜索,比方说 KMP、BM、 suffix tree 之类
但我不知道怎么作快速的模糊搜索 @@
想请各位前辈给一些资料、方向、关键字,感谢万分。
ps. 如果能顺便有如何在硬盘上有效率的保存 index 的相关资料那就更好了 XD
作者: FRAXIS (喔喔)   2016-11-16 22:08:00
你要先定义什么叫做模糊k-mismatch 容许k个字符错k-difference: edit distance 小于 k
作者: pttworld (批踢踢世界)   2016-11-16 23:53:00
多年前修课使用foxpro,也没发挥真正的威力。
作者: DJWS (...)   2016-11-17 05:12:00
bloom filter硬盘保存就 B-tree 吧 刚刚谷歌一下还有啥 CPS-tree
楼主: yoco (眠月)   2016-11-18 02:57:00
感谢各位 XD
作者: tonytonyjan (南洋大兜虫)   2016-11-20 02:25:00
限英文的话可用 soundex,pg、mysql 都有支援
作者: DJWS (...)   2016-11-20 06:30:00
声纹比对的话 实务上比较常见到 hidden markov model^^^^^^^^发音比对 更正一下
楼主: yoco (眠月)   2016-11-28 02:14:00
声音比对现在主流不是 LSTM-RNN 了吗 XD
作者: DJWS (...)   2016-11-28 09:05:00
LTSM-RNN 实验室才刚做出来没多久 应该还没普及?
楼主: yoco (眠月)   2016-12-01 23:34:00
这个领域三个月就翻两翻了...
作者: DJWS (...)   2016-12-02 06:52:00
这么快?可以请你提供统计数据来源吗?

Links booklink

Contact Us: admin [ a t ] ucptt.com