Re: [新闻] 辉达H100显卡“订价139万”...上架就秒杀 bachelorwhc PTT批踢踢实业坊

Re: [新闻] 辉达H100显卡“订价139万”...上架就秒杀

楼主: bachelorwhc (单身老王) 2024-07-07 11:44:03

※ 引述《sxy67230 (charlesgg)》之铭言：
: H100真正的目的就是拿来训练LLM跟NN模型而已，普通人根本没Data是要训练三小模型= =
: ？
看你讲那么大声结果根本外行
训练LLM的dataset网络上都找得到根本看不完
从wikipedia撷取到从fandom蒐集次文化资料、pdf电子书等等
还有专门RolePlay的chat资料集
跟从游戏撷取的对话文本等等.....
只要你的运用不偏门大部分的资料都找得到
自己写一个爬虫也没多难我上周才写了一个爬pixiv dict的程式
LLM的pretrain跟fine tuning资料来源不是问题时间跟钱才是
大部分的做法是拿现有pretrain过的model在runpod上租GPU来再训练

继续阅读

[问卦] 两个女生跟我告白要怎么选mnssddxs [问卦] 杜汶泽当初为什么没有把梁朝伟去按摩的blueink5566 [新闻] 郑文灿涉贪500万交保陈其迈今天说话了taiwan08 Re: [新闻] 台女称兰屿遇“萨满巫师祖灵”　达悟族人Lineage097 [问卦] 中华宽带一直断线barkingdog [问卦] 男孩子直肠特别温暖有加分吗danny91074 [问卦] 大明王朝1566溃堤用人命去埋就是骗人的songgood Re: [问卦] 为什么会有家长既不帮亲又不帮理？Zcould [新闻] 面试台积电4次全被刷！成大女硕士崩溃“iduku Re: [新闻] 郑文灿涉贪遭声押“收贿500万” 法官裁violetking