[理工] 107 台大 计系

楼主: b10007034 (Warren)   2018-12-05 01:37:54
HI, 各位大大
想讨论今年第二大题
https://imgur.com/7n6WZw0
这个cluster我参考原文书及张凡第七章画的
https://imgur.com/a/d4QDu0S
题目提到reduction,我翻原文书翻到这个
https://imgur.com/nI9Lxy9
f
题目貌似没给rotation,是假设平均的seek+rotation=5ms?
最大应该是所有资料放在一颗硬盘然后传上来吧?
最小是多颗硬盘组RAID,然后计算吗? 不太确定
g
题目提到data transfer可以和computation时间重叠,且data transfer时间比较久
所以只要计算资料传到GPU就好?这个资料是多大,我们决定吗
h
这边我只想到决定好reduction的次数乘上100us就好
课本的pattern是8个传到剩1个,reduction3次,应该是 以2为底 log N
i
total time应该是 资料读到电脑的时间 + 资料处理时间(GPU) + reduction ?
题目也没说 内存频宽、大小 ,还有Network的速度感觉好少条件
bottleneck我猜是硬盘
大大有任何想法吗?求解感谢
作者: Dora5566 (咩休干某)   2018-12-05 20:59:00
有给D个disk 就用RAID read最慢的那一种做lower bound吧
楼主: b10007034 (Warren)   2018-12-10 11:16:00
台大 f, min. time=5ms max. time=5ms+10^15/250*10^6)g 切成1KB为最小不可分割运算单位,意思是有10^15/10^310^12 computers,每台有8张GPU,128GB的频宽GPU运算时间=1KB/128GB 约等于7.8125nsh 共10^12 computers,要把这些node运算的资料加起来考虑到10^12非2的倍数,reduction operations=floor(log(10^12))=39(次),因此传输时间等于3.9msi total min. time=5ms+3.9ms+7.8125ns约等于8.9msbottleneck为硬盘的seek time,建议换成SSD业界人士给我的答案,应该差不到哪里去。

Links booklink

Contact Us: admin [ a t ] ucptt.com