推 MrCAKE: 如果是这样,关键字拓展之后还是卡关,就要想其他招了 06/26 08:35
推 MrCAKE: 以后AI检索更强的话应该能帮忙(吧) 06/26 08:41
推 patentable: 以目前机器学习的AI架构,还没办法做到了解文义 06/26 09:49
→ patentable: 对于检索的帮助其实非常有限,主要用在统计用字频率 06/26
09:50
https://hant-kb.kutu66.com/others/post_13649887
目前的AI可以做到“句子相似度”的计算,如上连结。
'this is a sentence'及'this is also sentence'的计算结果,高达0.915479828613的
近似度。
因此,如果要用机器帮忙找前案的话,可以先写下要找的句子(或词袋),然后用“句
子相似度”的算法,来找出近似的专利。word2vec是由google提出来,google专利资料
库的近似专利,应该也是用这个算法计算出来的。
考虑到专利用语的多变化,(以下是我乱想的,没有理论基础)想要提高演算的精确度时
,选择词袋中的词就很重要,可以考虑先对句子中的词进行处理。举例,可以考虑先把
下位词更换成上位词,或者把所有的近似词换成相同的词等,但这个需要自己整理词库。
因此,个人认为用机器帮忙找专利,是有机会的,但需要为不同的领域准备好自己的
词库。要用一般的词库应该很难达到实用的效果。
下面有整理出几个句子相似度的算法。
https://reurl.cc/WdQkVx