楼主:
yoco (眠月)
2016-11-16 18:08:37有问题想要请教资料结构算法们的大大 <(_ _)>
最近无聊,想要作个 personal project:search engine
我知道怎么在字串里面作快速的精准搜索,比方说 KMP、BM、 suffix tree 之类
但我不知道怎么作快速的模糊搜索 @@
想请各位前辈给一些资料、方向、关键字,感谢万分。
ps. 如果能顺便有如何在硬盘上有效率的保存 index 的相关资料那就更好了 XD
作者:
FRAXIS (喔喔)
2016-11-16 22:08:00你要先定义什么叫做模糊k-mismatch 容许k个字符错k-difference: edit distance 小于 k
作者:
pttworld (批踢踢世界)
2016-11-16 23:53:00多年前修课使用foxpro,也没发挥真正的威力。
作者:
DJWS (...)
2016-11-17 05:12:00bloom filter硬盘保存就 B-tree 吧 刚刚谷歌一下还有啥 CPS-tree
楼主:
yoco (眠月)
2016-11-18 02:57:00感谢各位 XD
限英文的话可用 soundex,pg、mysql 都有支援
作者:
DJWS (...)
2016-11-20 06:30:00声纹比对的话 实务上比较常见到 hidden markov model^^^^^^^^发音比对 更正一下
楼主:
yoco (眠月)
2016-11-28 02:14:00声音比对现在主流不是 LSTM-RNN 了吗 XD
作者:
DJWS (...)
2016-11-28 09:05:00LTSM-RNN 实验室才刚做出来没多久 应该还没普及?
楼主:
yoco (眠月)
2016-12-01 23:34:00这个领域三个月就翻两翻了...
作者:
DJWS (...)
2016-12-02 06:52:00这么快?可以请你提供统计数据来源吗?