Re: [菜单] 数值分析用电脑 MiyaKami PTT批踢踢实业坊

Re: [菜单] 数值分析用电脑

楼主: MiyaKami (米汉堡) 2024-08-07 00:18:52

原文删光光
由于前一篇回答此类问题是2019年，也还在这个领域工作就干脆更新一下
数值分析套装软件很多种，
常见有ANSYS LS-DYNA ABAQUS Fluent COMSOL这类泛用型物理模拟
也有许多化学类的模拟软件(我不熟)
而这类软件的核心都是从"解偏微分方程式"这个目标衍伸而来的
其运作流程是
1. 几何资讯(CAD)离散化，也就是俗称的切网格
2. 矩阵组合，解反矩阵，这是所谓的求解计算
3. 结果产出
如何配置一台符合预期的计算主机也可从上面3点一一解释
1.切网格部分目前绝大多数软件都是自动切分网格，使用者只需要手动
输入一个尺寸(最多再输入最小尺寸)，软件会自动铺设并且还会制作过度元素
这在20~30年前是想不到的功能，我公司前辈讲古说因为以前内存不够大
大概是配个512MB到1G，工程师会觉得公司好舍得给我好的电脑配备
因为网格数量会直接占用内存，即使是矩阵0区不计算也会划分空间留用
所以老工程师会手动制作网格，用各种花式手法去制作精良(品质良好)的网格
甚至会简化原始模型，例如拿掉不重要区域的导R角，
然后把 "mesh is art" 这句话挂在嘴边(一脸秋样)，
其这些手法都是为了降低内存使用，因为矩阵大于内存是不能计算的
软件方因应方法曾开发了一个 swaping 功能，其实就是把硬盘当内存用，
来避免"不能算"的状况发生，也能想像到这样的计算速度会有多慢了
但算得慢总比不能算来得好，至于手动制作网格学习成本太高，也不会有妹子
在你旁边说哇你网格好强喔
手动做三天，自动只要3分钟　所以不建议学这个
现在王道就是自动网格然后买大内存+高时脉多核心CPU硬干就是了
所以内存选择越快越好，买到多大取决于你的模型有多大，
不知道模型会有多大，那就买满现在能插满的
2.矩阵求解部分，这个需要看题目，简单说就是如果是一般大小的线性题目基
本上几分钟到几十分钟就会解完了，阿就解一步反矩阵是会多慢，如果是频率
域算太久，你要先想是不是选错扫频策略
所以这部分会预先假设做的题目是时域非线性(学术上才称得上有一些些难度)，
在非线性求解过程，会有非常多步的迭代跟时间增量步，简单说就是会一直try
解反矩阵~验证收敛性~反复做，在这个步骤CPU效能是吃满的，所以CPU的时脉
直接决定了解题快慢
基于这个架构要谈几件事：
a. 核心数不等于执行绪，这个是某家起的坏榜样，超执行绪(Hyper Threading)
技术是~我赌你使用电脑时不会一直让CPU很忙碌，所以我把一个核心模拟成
两个核心，这样看起来框框超多的，卖相很好
很抱歉，在模拟过程还真是CPU满载，所以16C/32T开启平行32核，你会发现一件
神奇的事情，原本要加速反而速度变更慢，因为资源互抢了
b. 快取的重要性，因为使用到平行计算功能(intel MPI/MS MPI)，在数据的吞
吐频率跟资料大小，因为软件不同也不甚熟悉无法详述，依照之前资工资源
班上课老师说的~快取buffer是预先读取前后几十行的程式码，让使用者操作
不卡顿，在计算上SMP平行计算效能是会集中调配使用，这部分快取就很重要
我也实测过，快取越多效率越好，快取像便宜白菜给的AMD，我只能给个赞
c. 时脉，CPU规格上面会有两种时脉，一个是基本时脉，另一个是turbo时脉
turbo时脉讲的是单核使用时的极限，还可能根据体质以及散热而无法达到此值
所以在使用上建议买32C/64T 满载最多用到16C
我这边上上个月配的 TR 7980 32C/64T (5.3 / 4.0 GHz)
测试非线性物理专用型CAE
32C 4.2 ~ 4.5 GHz (常时 4.2 GHz)
16C 4.8 ~ 5.0 GHz (常时 4.8 GHz)
基本上会跳动偏高，观察怀疑是迭代完成准备存取下一步时的喘息时段
所以原PO买了7985也不用烦恼，测测看 32C/64C 再决定要不要开满
3.结果产出部分，就是把计算完的某个时间点结果存到硬盘
这时取决的就是硬盘写入速度了，
其实这二十年来电脑硬件进步神速，内存便宜又大，CPU核心数比前女友还多
最后还是被硬盘速度拖到，在SSD还没普及的时候，算一个非线性题目常是2天
起跳，当装了SSD后同题目竟然可以剩下10多小时，可见硬盘写入速度有多拖
沓，现在 Gen 4 到 Gen 5 才隔没几年，这种进步速度让我期待接下来的发展
当然也可以在软件设定上面减少结果存盘数量也能做到加速的效果，但不保证
会不会漏看什么重要的物理现象
上礼拜计算的一个题目档案存了100多Gb算是特例，但是5Gb~10Gb应该是跑不掉
然后还是要提醒一下 SSD 做 RAID 只有读取有加速受惠，写入没有
结论：
必要零件选用优先度
1. RAM 决定了能计算的题目大小，有余裕就买满
2. CPU 时脉越高越好>核心数(取决使用的软件)>快取
3. 硬盘读取写入(特别是写入)速度越快越好，
然后容量大小评估一下，或是习惯常清空间
其他零组件
CPU水冷必备，跑个题目可能要几天，你也不希望热当机重跑吧
显卡看模型结果复杂度(分辨率/网格数)，网格太多可能会卡顿，选个vram多的
不用绘图卡
另外以上只是大方向并非绝对，特别是题型或学术领域不同可能差异很大
也欢迎其他大大补充

继续阅读

Re: [情报] INTEL 13/14代5年延保清单公布-涵盖AreLies Re: [情报] INTEL 13/14代5年延保清单公布-涵盖散装oopFoo [公告] ilv1181023 水桶六十日AreLies [请益] macbook用的kvm切换器a72096688 [菜单] 53K 修图游戏ArmandoBenne [菜单] 数值分析用电脑Timberray [新闻]英特尔准备接收第二套艾司摩尔EUV设备seitune16 [菜单] 22K多开游戏机(半套)osoku [菜单] 55K 白色游戏机Nivlatus [菜单] 姪子段考进前30名礼物ilv1181023