文心一言实力不如ChatGPT是理所当然的,微软投资几百亿美元并且用微软的云端训练整个网
路资料两年了,到了去年底才终于开花结果
目前这种LLM模型,最重要的就是 资料 算力 和算法,其中基础的资料是非常重要的,Chat
GPT在建立模型的过程跟一般的Ai一样要机器学习建立模型,而ChatGPT的基础原理就是由上
一个字生成下一个字,周而复始,其中在训练的过程还会经过人工挑选优质回答和一些和添
加一些限制来引导训练方向,但总体而言跟其他Ai模型一样训练出来的模型基本上是黑盒子
,是无法直接改动的,所以基础语料的重要性不言而喻
而中文跟英文在目前网络的资料量91%左右,而中文只有0.11%,甚至还没有日文0.12%多,文
心一言基本上就是专攻中文的,所以在先天条件下其实就不如ChatGPT(GPT的中文回答很多
时候也是经由英文生成答案再转成中文的
第二个就是算力差距也很大,之前微软的训练场所都是5万张A100在24小时跑模型的,美国之
前已经要求NV禁售高阶运算卡很久了,目前百度能用的卡就是一些消费级的和以前囤积的卡
,听说他们之后要用他们的国产摩尔线程的显卡,不过那个效能和NV差距非常大,在算力这
方面上几年内也是追不上OpenAi团队的
不够就算如此,我也觉得百度这次算厉害了,为什么?因为隔壁Google 开始公测的Bard实际
表现还不如文心一言,甚至可以说惨多了,全靠同行衬托啊。而且百度这次不像很多中国公
司一样拿外国产品套个皮就说自研,而是真的在做产品,这点就挺厉害了,不过他们会下去
做主要也是想继续霸占中国浏览器市场的龙头地位就是了