Re: [新闻] 中正资工新技术助电脑效能大跃进 获“系统界奥斯卡”肯

楼主: LuoShiWu   2023-07-19 03:08:02
先讲一下为什么会有这样的想法
大概二十多年前芯片网络(network on chip)就很红
意思是芯片上有很多运算核心(core),每个core就像一台小电脑
然后把他们连接起来的方式就叫做芯片网络
芯片网络的原理跟电脑网络差不多,但芯片网络会比较有规则性
比较像是电脑教室的电脑,整齐摆放、整齐拉线,不会像是宿舍里面的电脑
又刚好知道 Linux kernel 的 spinlock 算法是 MCS
MCS是把等待进入 critical section 的 task 以 linked list 连在一起,形成FIFO
又又刚好,研究所时是做scheduling的,看到linked list,直觉上就是可以scheduling
然后就是最短路径排程了
跟别人的差别在于,我读书读得比较少 :-p
大概十几年前有人推出一个叫做cohort的算法,在多处理器上以grouping的方式排序
这个方法跟最短路径的差别是:
“同一个group的是不分前后顺序,也就是同一个group就不再做细致的优化”
使用最短路径,优化的细致度好很多,但这方法也有些缺点,方法稍微复杂一些
我认为处理器的核心数目越多,那么最短路径方法才会赢过其他方法
运气很好的是,AMD忽然爆发小宇宙(参考 圣斗士星矢),多核心从4颗变成32以上
就从“早晚会有用的算法,变成现在就有用”
cohort是一个很棒的方法,非常的成功,在多处理器架构下他的效能很好,
因为很成功,做这方面的人都会去看他这篇论文,cohort的grouping概念
就影响了这时期的spinlock方法,因为我不晓得有cohort因此没有受到影响
再来是为什么投了四年还要继续投,难道第二、第三年不会想要放弃吗?
我真的很想上OSDI,但reviewer不太相信我们,有一种“民雄地下道标语的感觉”
“不是路走到尽头,而是该转弯”
(参考:https://hackmd.io/_uploads/HkQzvS4c3.jpg,来源:facebook网络)
但。。。老天爷就叫我一条路走到黑,投稿到次一级的会议
那个reviewer给我的感觉并不是相不相信的问题,而是有没有认真看
要被后者reject,还不如被前者。为什么执著于会议,因为我的领域就是会议比较重要
讲到这里好像都很吃运气,补充一点不是运气的部分
芯片网络不是我的研究领域,但念博士时还是有去看一下,这是因为计算机组织很迷人
google news也会推最新的硬件技术给我,因此这部分还有持续了解
第一次看到 MCS,是在“奔跑吧Linux kernel的作者‘笨叔叔’”的wechat论坛
他下了个耸动标题“Linux kernel 黑科技 MCS”
大家可以去看MCS的文章,https://zhuanlan.zhihu.com/p/89058726
我概略性的看过,无论是中文或者是英文都看不懂(我相信jserv一定秒懂)
看不懂去洗个澡,然后看懂这个方法也想到这个资料结构可以排程
排程是我的老本行,虽然很久不做scheduling,但直觉还是有的
这种有先后顺序,而且还是FIFO的铁定可以排程
能改善多少要看算法多逼近最短路径,算法的cost多少则看要逼进到则样的程度,
不能太追求最短路径,否则光是演算的成本就会过高
感觉起来就是跟作业系统耍暧昧,若即若离。写论文渣一点没关系啦,能动就好
最后就是写程式,我们本来就对C语言和计算机结构比较熟,
问题不是太大,三个星期完成骨干,后面就是定量分析和实际跑跑应用程式
在过往的研究上,失败的纪录超多,虽然国科会的报告写得好像是一回事
但是改善幅度太小,根本不值得发表,有时候对实验室做出来的成果也没啥信心
这部分也不适合发表,我真的很缺论文,但也很讨厌读到过度包装的论文
视情况决定要不要写,实验室总是要运营
有四年的时间在绩效方面,本废宅完全是国科会的米虫
感谢国科会愿意让米虫每年都有经费可以拿,感谢委员愿意相信计画书
有一点成果以后,又希望国科会可以多给实验室经费
只有使用AMD 32核心处理器,审查委员眉头一皱,觉得这里面肯定有猫腻(真的发生)
“Intel、ARM的服务器太贵”,这不能是理由,这是研究者自己要想办法的
“人在不顺利时希望社会主义,
顺利时希望希望功利主义”
~~陈厝寮170号,废才哲学家,shiwu
我看到有人提到“压榨硬件效能会不会增加耗电”这问题很棒,
lock-unlock,就像是receive-send,unlock就是将资料丢给下一个人
lock则是撷取资料,如果资料传递路径变短,原则上会降低温度
但实际上是:因为传输变得更有效率,每个核心的“微小闲置”变得非常少
这个微小闲置就是pipeline的bubble,或者本废宅在实验室等email的时间
如果传递距离比较近,速度快,核心找不到偷懒的理由,因此很辛勤的工作
基于
“台湾劳工变成老板,就会是血汗老板”的基本原理
核心很忙是我们乐见的,因此整体温度是增加的,花那么多钱买CPU,不超爆它吗?
“然而我们并没有那样的血汗,至少给了大同电风扇,
比起城户沙织,还算是不错”
~~引用(https://hackmd.io/_uploads/S1R4G8N52.jpg)
跟圣斗士一样,我们的小宇宙是不够的,还有来自成大jserv大人、城市大学、中研院
顶头上司,中正大学、科技部+国科会
参加会议时,有位在美国工作的台湾人说:这篇论文就是一股台湾味
不是气势宏伟的,而是小家碧玉型,台湾学术界比较少气势宏伟的服务器
跟左岸的闲聊,系统软件是国家重点项目,外加企业挹注资金,的确宏伟高大许多
右岸的论文也是气势滂薄
台湾软件,搞了很久,我从小废宅变成了老废宅,台湾很重视利基 niche(硬件)
认为软件可以在硬件基础上变大变强。
在Nvdia上的确看到这样,软件所成的护城河,让AMD很难攻进去。
x86能红到现在,也是靠软件所形成的完整生态圈,
ARM很难切入x86的普通领域,特别是许多公司有专属软件,这类软件的可移植性很差
规划上很合理,在落实方面常常偏向于“硬件功能的直觉延伸”(有错请纠正)
大家怎样理解“驱动程式”,这不一定是作业系统底层的那个驱动,
我认为直觉上延伸自硬件,而没发展出超乎硬件的软件,就只能称之为驱动程式
iPhone会成功,是因为它上面有很多软件,这些软件让我们更离不开iPhone
台湾这样的发展没好没坏,或许在有限的人力、物力下,这样的模式最适合
也或许可以像是新加坡那样,有更开放的空间
太多运气成份在里面,或许没有机会再到OSDI,
基于“知耻近乎勇,无耻那绝对是神勇”的精神
询问工作人员可不可以在会后把OSDI的牌子带回家纪念,底下是这次最好的收藏
https://hackmd.io/_uploads/S1n25_Qqn.jpg
左边是Ron高举OSDI的牌子,背景是我P图的
https://hackmd.io/_uploads/rkHL1vV9h.jpg
跟工作人员说,可不可以给我Ron也一张名牌
国名有些问题,在官方正式文件已经做了修改,但名牌没改,不要砲我
废材被闪电打到,就会有熊熊火光
系统软件的大神,是不断地发光,让这个领域持续进步
像jserv是全方面的领先,而我对系统的认知就只是单点
如果有研究生需要喝一碗热鸡汤,这个文章应该可以给您恢复一些生命力

Links booklink

Contact Us: admin [ a t ] ucptt.com