※ 引述《ZMTL (Zaious.)》之铭言:
: 嘘 ken1990710: 人的数据库是文化从无到有一代一代传承下来的,而且 03/04 11:21
: → ken1990710: 懂得这些资料内涵意义是什么,Ai只是无脑的拼凑人给 03/04 11:21
: → ken1990710: 的资料,连资料内容都不懂能谈上什么创意,而且Ai自 03/04 11:21
: → ken1990710: 己也不能判断什么叫创意,差这么多你也能来嘴喔 03/04 11:21
: → SALEENS7LM: 一个连自我思考、人格意识、基本情感都没有,只能依 03/04 11:21
: → SALEENS7LM: 靠数据库去机械式回答的弱Ai,的确不会创作也没有创 03/04 11:21
: → SALEENS7LM: 意,真要像vivy 那样真的会创作,已经是非常遥远的未 03/04 11:21
: → SALEENS7LM: 来,Ai进化到非生物人类的时候了 03/04 11:21
: 虽然说我之前说过不要把ChatGPT当搜寻引擎用,
: 不过ChatGPT aka GPT3.5 aka 现代主流的自然语言处理(NLP)模型
: 倒也不是这么没用的“无脑拼凑”、“机器式回答”...
: 这大概是1950~1980年代自然语言模型就在做的事情。
: 1980~2000年左右NLP开始会用统计的方式去推那分析,
: 2000年以后现在真的在“模拟思考”,用的是类神经网络+机械学习的方式,
: 电脑已经有能力去“推测”他从来没学过得内容并去做出回应了。
: (对于NLP的部分可以参考:
: https://aiacademy.tw/what-is-nlp-natural-language-processing/
: 不过这篇只提比较多是台湾/中文,有兴趣我可以去翻我这个礼拜看的一叠国际论文出来)
: 很多人以为ChatGPT给错误的答案是因为他拼到网络上错误的资料,这就是误解,
: 只是因为他没有这样的资料,所以他基于他学习过的内容“做出推测”所以才是错误的。
: 然后对于ChatGPT到底好不好用呢?
: 这是前几天麻省理工的研究论文(请恕我在工作还没时间看)
: https://images.plurk.com/6aKwK6j6oeCTcRDoL4qijc.png
: 但根据业界大老的摘要指出
: https://www.facebook.com/segacheng/posts/10106881826311703
: “MIT 研究人员发布论文量化 ChatGPT 对内容生成工作的影响:
: * 生产力提升 37%(工时减少 37%)
: * 工作品质提升 19.8%”
: “最令人忧心的,还是 ChatGPT 带来的生产力提升数字 37%。
: 因为在 21 世纪初,学者计算出在 19 世纪蒸汽动力普及的那段时间,
: 这个技术革命在背后贡献了 22% 到 41% 劳工整体生产力的提升。
: 而人类社会花了超过 100 年,才吸收掉工业革命对职场带来的冲击。”
: 有兴趣可以自己去找来读一下,上面的FB有提供原始论文连结。
我刚看完那篇MIT的Paper,
"Experimental Evidence on the Productivity Effects of
Generative Artificial Intelligence"
我个人的看法是:上面那个业界大老的结论讲得太夸张
在Introduction里面、paper 第2页那边有讲到他们怎么进行这个评估
"This paper takes the first step towards answering these questions.1 In an
online experiment, we recruit 444 experienced, college-educated professionals
and assign each to complete two occupation-specific, incentivized writing
tasks. The occupations we draw on are marketers, grant writers, consultants,
data analysts, human resource professionals, and managers. The tasks, which
include writing press releases, short reports, analysis plans, and delicate
emails, comprise 20-to 30-minute assignments designed to resemble real tasks
performed in these occupations; indeed, most of our participants report
completing similar tasks before and rate the assigned tasks as realistic
representations of their everyday work."
"A randomly-selected 50% of our participants—the treatment group—are
instructed to sign up for ChatGPT between the first and second task, are
walked through how to use it, and are told they are permitted to use it on
the second task if they find it useful. The control group is instead
instructed to sign up for the LaTeX editor Overleaf. This design allows us to
estimate the causal effects of ChatGPT using a combination of within-person
and between-person variation, and performance on the first task serves as a
measure of baseline ability that enables our inequality analyses."
1. 他们找来了 444 个有经验的、大学毕业的职业人士来受测
2. 测验的内容是要他们完成 两个 预计要花20~30分钟的 文章写作 工作
3. 他们把这444个人分成两半,其中一半的人作指定的两份工作都用一个线上的
LaTeX 编辑器 Overleaf,是为控制组;另外一半的人完成第一个工作后,
会告诉他们怎么用ChatGPT,然后让他们自己决定是否要在第二个工作用ChatGPT
(奇怪,LaTeX 编辑器?LaTeX 在一般人的使用中有夯过吗?)
附图:那444个人的一些统计资料
https://i.imgur.com/TEVjnsU.jpg
以“文章写作”的部分这是可以预期的,
但这是针对写作工作,而且还是单项预期20~30分钟的较大型的写作工作
Paper里面讲的是平均可以减少10分钟,
所以才有业界大老那句" 生产力提升 37%(工时减少 37%) 工作品质提升 19.8%"
问题在于:这能否反应“生产力”?
比如写文章的瓶颈在于 domain knowledge,
简单的例子就是:一个研究人员把4个月的工作成果花14天写成paper
假设ChatGPT可以类似地把14天减到8天好了,对这研究员来说,
整体的生产力其实没有太大的变化;讲得夸张点,就算把这写paper的时间扣掉,
也没啥差,因为主要的工作并不在 写作 上。
当然有人会觉得我这例子很极端,毕竟研究人员知识这么宝贵的很少。
但,有多少职业是常常在制作单项预计要20~30分钟的长文的?