Re: [问卦] DeepSeek对行业市场的冲击很大吧！ bluebluelan PTT批踢踢实业坊

Re: [问卦] DeepSeek对行业市场的冲击很大吧！

楼主: bluebluelan (新阴流大目录免许皆传) 2025-02-01 16:04:56

你太腿了= = 你会惊讶有人把R1放在手机上测试
就代表你跟这个行业完全不熟= =
对于开源也很不熟
两年前就有llama2, GPT2各种大小的模型随你下载
在手机上头跑我们只考虑你的model size 你是llama DeepSeek 还是阿萨布鲁8.7都没差
玩家土炮都会比公司快因为不用在意用户体验只是像是一个大学生专题等级的东西
会动就好
依照2025年的手机紧绷能跑个4B这个大小的模型用INT8 大概需要4GB的内存
如果是用INT4 大概对半只需要2GB 一些关键的参数会用到Q5_0效果会比较好
但是一个AI模型占用2GB内存有点夸张通常比较适合的是100M~1B 这个大小的模型
像是R1 1.7B 用INT4 or Q4_1这种大概900MB 对于现代的手机而言不是什么问题
差别只有token rate而已
你用纯CPU也能跑甚至跑得还不差完全够自用
只是GPU更适合因为同样的耗能 token rate更高
你只追求会动那什么东西都行
追求不高的token rate 你的桌电就行
追求商业等级的token rate 目前只有GPU行
大概是这样
: 当一堆人在炒DS抄袭盗用其实也用了五万颗H100没什么了不起的时候
: 全球玩家已经有人试着把DS离线安装在手机上测试
: 发现这东西真的可以大幅减少对硬件的需求
: 而且最可怕的是这东西还开放原始码给大家使用
: 有人下载了671B到自己个人电脑建模
: 而这对市场整个行业的发展方向其实是很大的冲击吧
: 有没有这种开源给全球玩家去玩的八卦??

继续阅读

Re: [新闻] 宜兰车祸1死3伤！追撞驾驶上香致歉　死HuangJC [新闻] 安芝儇发文“中国新年快乐”被呛！急发zoeapezoo [新闻] 影／夫妻难得同框黄国昌：日本留学4年LIN9 [问卦] 刮刮乐两千的一张中五千算幸运吗？jenny780517 [问卦] 某人搬到上海有什么好报导？ryhma Re: [问卦] 经历什么一个人会变乐观开朗tok892xt7 [新闻] 嘉义市咖啡店挂“我缴税不是为了养共匪！osalucard [问卦] 急！抢到老板群组红包888怎么办notimenofree [问卦] 臣有三策保大湾百年无忧，汝等可有之？SkyIsMyLimit Re: [新闻] 研究机构：DeepSeek硬件GPU支出逾160亿台PaulDavis