Re: [新闻] 台湾人工智能实验室推解决方案争取“可 sxy67230 PTT批踢踢实业坊

Re: [新闻] 台湾人工智能实验室推解决方案争取“可

楼主: sxy67230 (charlesgg) 2024-12-06 21:23:51

阿肥码农阿肥啦！
12月开始准备放长假了。有时间说一下Federated LLM的一些东西好了，Federated Learnin
g for LLM大概22年就有零星的研究，不过比较有综述写得蛮好的主要是去年港科大的一篇F
ATE-LLM把整个脉络跟方向做一个比较具体的说明然后他们提出他们的框架。
其实说白了就是分布式计算的架构，Edge端将梯度跟损失给中央计算完后再给边缘端更新，
差别在于为了让Edge端跟Server传输量减量所以使用了parameters efficient fine tuning
的方法只更新adapter/prompt的参数而已。
然后今年大概2月比较有名的就是上海交大提出的OpenFedLLM大概就是把DPO这种离线Prefer
ence Learning 方法用到Federated LLM上。主要还是RLHF太难做到Federated Learning 上
了，所以才取巧用DPO来结合联邦学习。
不过真的说当前联邦学习的缺陷就是真的使用到实务上依旧无法解决LLM的幻觉问题，而且
当前大模型为了产品稳定性每一轮的叠代更新都需要进行红队测试跟稳定性测试，这个其实
很难再Fed的架构上做到。Fed本质上就是为了隐私问题诞生的，但他必然会失去中心化的优
势。
差不多4酱

继续阅读

[新闻] 芯片霸主崩坏 CNN曝2010年已见伏笔hvariables [新闻]ChatGPT o1 模型上线，专业版月费 200 美pl132 [新闻] 悲情台积电工程师老婆与阿公级银发同事4jeff0025 Re: [新闻] 4小时协商破局！中华电信工会发起夜宿抗zxc0312 [新闻] ASML推High-NA EUV乐高模型 851个零件复wahaha23 Re: [讨论] 不要再N了!yokann [新闻] 台积电亚利桑那州晶圆厂良率优于预期，KotoriCute [新闻] 台湾人工智能实验室推解决方案争取“可askaleroux Re: [面试] KLA Applications Engineer面试心得yokann [新闻] 4小时协商破局！中华电信工会发起夜宿抗qazxc1156892

Re: [新闻] 台湾人工智能实验室推解决方案 争取“可

Re: [新闻] 台湾人工智能实验室推解决方案争取“可