Re: [新闻] 家登光罩盒诉讼演出逆转胜:从赔偿9亿多

楼主: ides13 (juso)   2020-06-28 00:26:51
推 MrCAKE: 如果是这样,关键字拓展之后还是卡关,就要想其他招了 06/26 08:35
推 MrCAKE: 以后AI检索更强的话应该能帮忙(吧) 06/26 08:41
推 patentable: 以目前机器学习的AI架构,还没办法做到了解文义 06/26 09:49
→ patentable: 对于检索的帮助其实非常有限,主要用在统计用字频率 06/26
09:50
https://hant-kb.kutu66.com/others/post_13649887
目前的AI可以做到“句子相似度”的计算,如上连结。
'this is a sentence'及'this is also sentence'的计算结果,高达0.915479828613的
近似度。
因此,如果要用机器帮忙找前案的话,可以先写下要找的句子(或词袋),然后用“句
子相似度”的算法,来找出近似的专利。word2vec是由google提出来,google专利资料
库的近似专利,应该也是用这个算法计算出来的。
考虑到专利用语的多变化,(以下是我乱想的,没有理论基础)想要提高演算的精确度时
,选择词袋中的词就很重要,可以考虑先对句子中的词进行处理。举例,可以考虑先把
下位词更换成上位词,或者把所有的近似词换成相同的词等,但这个需要自己整理词库。
因此,个人认为用机器帮忙找专利,是有机会的,但需要为不同的领域准备好自己的
词库。要用一般的词库应该很难达到实用的效果。
下面有整理出几个句子相似度的算法。
https://reurl.cc/WdQkVx
作者: patentable (可专利)   2020-06-29 06:52:00
最大的问题确实是词库,还有上下位用语的关系
作者: VanDeLord (HelloWorld)   2020-06-29 09:58:00
DL角度来看,原始资料清洗剩下的资料量和演算模型难搞之前想开发DL模型算法,不过这一块太吃AI科学家能力,弄个五人团队加上硬件一年硬生生要掉我1200万台票,市场规模有限,暂时放弃先看后面AI硬件有没有办法降价XD算法的部分等 AutoML的发展,看起来有机会AutoML的好处是,将足够清洗好后的资料喂进去,会自己找最适合的演算模型, 而不是靠人设计模型,对于没有顶尖AI科学家的企业来说,这一块商机感觉很大
楼主: ides13 (juso)   2020-06-29 11:33:00
曾经想过这上面的的想法创业,但觉得应该不可能,只留在想想的阶段,对于敢付出实际的人,都感到佩服。V大你真有勇气。https://reurl.cc/WdQOvDhttps://reurl.cc/8GM9j7上面有代码,提供给有兴趣玩的网友参考。只要更换sentance1及2的文字,就能算出相似度。https://reurl.cc/xZM3NZ“GoogleNews”词向量的下载地址,如上。
作者: VanDeLord (HelloWorld)   2020-06-29 13:52:00
https://arxiv.org/pdf/1905.07870.pdf当初还找了金庸古龙小说训练出来的演算模型,跑一个月以终于一个claim里面有一小段话看起来比较像样google : AI论文机器人不过我也发现有些美国网站开始有推销AI写专利这一块发明人只要输入发明内容,就会生成专利说明书给你..orz不过我看内容还是需要人工校阅就是了在语意模型里面, 英文比中文简单太多了...叹
楼主: ides13 (juso)   2020-06-30 15:03:00
https://reurl.cc/j7Z0zpAI HUB,有在进行类似的专案。
作者: ealvis   2020-07-13 04:30:00
其实你用svm类似的方向去想ai分析专利,会落入pre-train那些拘束。但其实用cluster的方式去想专利相似应该会比较适合。以医疗分析也是这样,其实你不用管原本的分析标的在你的眼光是什么特性,因为分析后的ai会告诉你为什么他要这样分析。但真正的问题是拿ai来弄专利太浪费钱,拿这些钱来弄人命才比较好赚钱
楼主: ides13 (juso)   2020-07-14 13:37:00
谢谢提供进一步资料,原来还有cluster的方式。https://reurl.cc/KkaYxg目前是想找一种能够帮助检索的方式,但理论基础太弱了。
作者: VanDeLord (HelloWorld)   2020-08-01 14:30:00
cluster是传统语意分析方式cluster分析是有其优点

Links booklink

Contact Us: admin [ a t ] ucptt.com