Re: [新闻] 联发科AI平台MediaTek DaVinci“达哥” aPplAus PTT批踢踢实业坊

Re: [新闻] 联发科AI平台MediaTek DaVinci“达哥”

楼主: aPplAus (灿烂) 2024-04-10 20:38:57

原文恕删
小弟刚好最近有跟到一些台湾LLM的发展，可以补充一下关于模型的部分。联发科的研究
单位联发创新基地，做语言模型有一段时间了，之前有一版Breeze-7B模型，发布了一篇
技术论文放在arxiv：
https://arxiv.org/pdf/2403.02712.pdf
论文提到这个模型是从mistral-7B 继续训练而成，花了7000小时的H100，灌了650GB的da
ta。如果有一半是中文，325GB，也灌了超过1000亿汉字（3bytes=1word)，其实很多了啦
。
然后Breexe是从Mixtral训练而成，是更大一级的模型，论文好像还没出，但很多公司都
有不同大小的模型，做法应该不会差太多（？）。最近有开放API试用：
https://huggingface.co/MediaTek-Research/Breexe-8x7B-Instruct-v0_1
跟ChatGPT的比较，最重要的点应该是，像Breeze-7B这种已经开源的模型，对能架服务器
的公司来说，是用越多越赚；跟token收费的ChatGPT 用越多越贵截然不同。Breexe不知
道会不会开源就是了。
达哥的部分，没有亲自用过，但有认识的人用过。基本上就是平台，然后有一些功能，像
是读pdf等等。就把AI推广给更多人的东西，应该是不错啦。

作者: turndown4wat (wat) 2024-04-10 21:08:00

这样发哥明天是涨还是跌?

继续阅读

[请益] 今年金融股不可能再出事了吧？humbler [情报] 美国3月份CPIxephon [新闻] 一年内2次疑食物中毒藏寿司新庄宏汇店addy7533967 [情报] 2363 硅统3月自结 -0.03DrowningPool [新闻] 3月出口418.2亿美元年增18.9%表现优于预yipi1357 [新闻] 换人坐！国泰金超车富邦金拿下金控获利三kellindil Re: [心得] 真有永远的多头分析师耶!!!!geniustu Re: [心得] 真有永远的多头分析师耶!!!!midas82539 [情报] 2488汉平 2024/03营收 Y+72.85% M+42.43addy7533967 [情报] 3052夆典113年3月营收qw5980162