[讨论] 如何网络上在搜寻拥有特定pattern的code

楼主: ericerix (Ponwar)   2022-05-04 16:26:17
请原谅我标题有点晶晶体,因为字数的关系才打成那样的QQ
如标题,因为研究需要,想搜寻大量符合我要的 pattern 的程式码以供研究,
例如:我要找有运用到 `a = b/c++;` 这种的程式码,其中 a, b, c不限,
最好是属于 library,也就是大家都会使用的函式库。
目前锁定 github,但 github 的搜寻能力好像没办法达到。
作者: EricTCartman (阿ㄆㄧㄚˇ)   2022-05-04 16:33:00
下载大量的程式码 透过既有的AST Parser分析特定的tree pattern
作者: CRPKT (crpkt)   2022-05-04 17:23:00
sourcegraph 研究看看github 有新的搜寻功能在封测,要申请才有
作者: alihue (wanda wanda)   2022-05-04 17:45:00
找可以用 regex 的搜寻引擎
作者: TSW (翘班帝国)   2022-05-04 17:47:00
先缩小范围,像是Apache基金会,可以整个都抓下来再分析
作者: johnny94 (32767)   2022-05-04 17:53:00
问copilot
作者: EricTCartman (阿ㄆㄧㄚˇ)   2022-05-04 18:20:00
regex能处理的有限 复杂一点的expression夹在另一个expression里 你reg会写到崩溃 除非这种case你要直接放弃
作者: qqaatw (qq)   2022-05-04 20:05:00
sourcegraph
作者: ss8651twtw (linsc04)   2022-05-04 20:58:00
grep.app
作者: Hsins (翔)   2022-05-04 21:30:00
https://cs.github.com/about封测中, 但现在申请应该一个礼拜会收到
作者: mohai (墨海)   2022-05-05 10:56:00
一楼是正解,之前帮忙开发 SonarQube 程式库找 code smell也是抽象语法树下去分析
作者: splitline (台ㄎ废文王)   2022-05-05 16:28:00
grep.app
作者: seebass (Far Far Away Kingdom)   2022-05-07 21:57:00
code2vector and dataset

Links booklink

Contact Us: admin [ a t ] ucptt.com