Re: [讨论] GPU加速Transistor层的模拟器

楼主: erspicu (.)   2026-05-30 22:54:41
※ 引述《erspicu (.)》之铭言:
: 标题: [讨论] GPU加速Transistor层的模拟器
: 推 SkyFluid: 想这么做也可以, 但有件很关键的事你没有注意到. 01/03 01:39
: → SkyFluid: 硬件在跑的时候,并不是所有的电晶体都有作用. 但你用gpu 01/03 01:40
: → SkyFluid: 模拟(emu)时,会在编译期先决定哪些电晶体需要跑.除非能 01/03 01:41
: → SkyFluid: 事先拿到testbench,不然就是全部电晶体都要emu,这是巨大 01/03 01:41
: → SkyFluid: 的负担. 同时,某条signal有上百个load是很正常的事,不过 01/03 01:42
: → SkyFluid: 这会造成在emulation时的同步问题. 01/03 01:44
: 推 SkyFluid: 有兴趣的话, 你可以看一下去年CAD-contest, NV出的题目 01/03 03:20
这东西是有弄出一些小成果 有兴趣可以看看
https://erspicu.github.io/AprVisual/index.html
不过很偏芯片设计那块领域的东西
倒不是说真的有原创性贡献 而是很多现有文献做法拿去实际测试和叠加
把真的有效益性的方法给叠上去 然后实务工程上的优化程式 极尽可能加速
当然结果还是可以预期 用netlist层去跑模拟 花了很多时间跨过一座山又一座山
找了很多办法下去试 虽然效能改善明显可见 搞到目前开源纪录第一名
https://erspicu.github.io/AprVisual/comparison.html
实际上离实机realtime模拟的效能还是差几百倍
简单来说真实任天堂红白机fps大概是60.x , 我现在一秒还算不到一张
平均算一张大概要10秒左右 但说真的一些大神相比结果已经强上不少
主要是有ai 叠加文献纪录中的方法
https://erspicu.github.io/AprVisual/design.html
再说一次 我没有什么算法上独创的贡献 我做的事情是极尽可能从现有方法中
用ai当辅助 克服工程阻力 不断测试验证 然后把有效的方式拼凑在一起
ps.其实很多学术的方法纸上谈兵很漂亮
实际上你用cpu跑就是有很多你没想到的问题 很多东西都是这边cost低了
结果cost拿去做另外的评估 或是需要额外的纪录 结果额外评估的cost
或是额外的纪录资讯反来造成d-cache崩溃 诸如此类
然后thread也是 要处理资源lock问题 搞到最后也是崩溃
不过这是专案初期 我还是很想冲透过netlist层
直接把一张frame rendering的时间压缩到几秒内完成
后续可能再想想 说不定有机会灵光一现
反正就满有趣的东西 另外也可以当成电脑效能测试的banchmark
在我电脑上的数据最高曾经到达 71k hc/s 1张不用10秒
作者: saladim (杀拉顶)   2026-05-31 03:13:00
不是这领域的 考古一下是2020年底开头的 现在GPU跟ML/AI跟当年又有天壤之别 或许有新的可能?

Links booklink

Contact Us: admin [ a t ] ucptt.com