楼主:
ericerix (Ponwar)
2022-05-04 16:26:17请原谅我标题有点晶晶体,因为字数的关系才打成那样的QQ
如标题,因为研究需要,想搜寻大量符合我要的 pattern 的程式码以供研究,
例如:我要找有运用到 `a = b/c++;` 这种的程式码,其中 a, b, c不限,
最好是属于 library,也就是大家都会使用的函式库。
目前锁定 github,但 github 的搜寻能力好像没办法达到。
下载大量的程式码 透过既有的AST Parser分析特定的tree pattern
作者: CRPKT (crpkt) 2022-05-04 17:23:00
sourcegraph 研究看看github 有新的搜寻功能在封测,要申请才有
作者:
alihue (wanda wanda)
2022-05-04 17:45:00找可以用 regex 的搜寻引擎
作者:
TSW (翘班帝国)
2022-05-04 17:47:00先缩小范围,像是Apache基金会,可以整个都抓下来再分析
作者:
johnny94 (32767)
2022-05-04 17:53:00问copilot
regex能处理的有限 复杂一点的expression夹在另一个expression里 你reg会写到崩溃 除非这种case你要直接放弃
作者:
qqaatw (qq)
2022-05-04 20:05:00sourcegraph
作者:
Hsins (翔)
2022-05-04 21:30:00作者:
mohai (墨海)
2022-05-05 10:56:00一楼是正解,之前帮忙开发 SonarQube 程式库找 code smell也是抽象语法树下去分析
作者:
seebass (Far Far Away Kingdom)
2022-05-07 21:57:00code2vector and dataset