[闲聊] 一技术描述与 多专利请求项1的相似度

楼主: ides13 (juso)   2020-07-05 15:14:16
分享一个“找出“一技术描述”与 “多个专利请求项1 ”间的相似度”的程式。
https://reurl.cc/9EmGQn
1、要使用这支程式,建议安装,anaconda python。并且,需要gensim 套件。
2、功能:找出“一个技术描述(sentance1)”,与 “patentlist 中各专利请求项1 ”间
的相似度。
3、此程式的使用方式如下:
#sentance1 指的是一个技术的描述,最简单的方法就是一个发明的请求项的记载方式。
#patentlist 提供想要比对的美国专利书号码,例如['US7654301B2', 'US7654300B2',
'US7654329B2']。
4、改变上述要点3中的变量sentance1及patentlist并执行后,会得到
claim_similarity.txt的文件,打开该文件后,可以得到相似度的计算值,如最后所述。
5、结果:如果把一件专利的不同组的请求项,当作sentance1时,相似度会达0.9以上。
因此,此方法有实用上的“可能性”,但实际上效果可能没有很好,需要再优化。目前,
我把它当作阅读顺序的排序,觉得满好用的。
如果显示0的值,表示没有爬到该专利的内容。
目前只能从google专利数据库中爬到美国专利的内容。
与US5419973A间的相似度 = 0
作者: kaikai1112 (骨髓捐赠match也是种缘份)   2020-07-06 10:21:00
感谢分享
作者: airrooco (批批踢三星级潜水伕)   2020-07-08 08:31:00
不明觉厉 XD

Links booklink

Contact Us: admin [ a t ] ucptt.com