https://www.cna.com.tw/news/firstnews/202103145002.aspx
影视制作导入大数据是近年国际趋势,2016年《我们与恶的距离》首次为台剧点了第一把
火,如今星火燎原。
文:叶冠吟
21岁到30岁的年轻人最关心什么?
分龄统整2019年Google关键字搜索:21岁是生日与礼物;22到24岁,在乎自己是否还能长
高;大学、研究所毕业后的25到28岁,开始在意存款;到了29、30岁,烦恼如泉涌,从婚
姻、转职、薪水、存款到健康检查……一连串议题,多到连表格都写不下。
“30岁最痛苦,烦恼一堆”,资策会数位服务创新研究所副主任徐毓良,指著投影幕上的
数据感慨说道。
这是公共电视迷你剧集《大债时代》剧本设定的辅助数据资料,也是资策会服创所团队继
金钟奖台剧《我们与恶的距离》后,第二度与公视合作,以大数据分析协作剧本开发。
探讨青年负债议题的《大债时代》,由张书豪、林柏宏、李霈瑜(大霈)主演,三人饰演
高中死党,毕业后各奔前程,分别成为公司负责人、斜杠创业家与银行债务催收员。但32
岁那年,张书豪跳楼轻生,两位好友替张书豪解决所留钜额债务的同时,也得各自面对沉
重的生活压力。
编剧的大数据门诊 处方来自PTT
“年轻人碰到债会躲起来吗?”“买毒品的年龄层?在哪买?”“年轻人最常见的债务是
什么?”“30岁受薪阶级的平均月薪是多少?”“企业掏空案到底要掏要多少钱才算多?
”“黑道讨债和银行债权管理的差异?”
一如有着十万个为什么,方梦贞形容与资策会合作的过程,就像跟医生定期门诊,只是处
方来自扎实的数据资料。
徐毓良指出,《大债时代》与《我们与恶的距离》两者提出的数据辅助需求不同,前者已
有故事大纲和人物设定架构,后者则是在“无差别杀人事件”主题的资讯海中,捞出剧本
线索。
徐毓良认为合作的方向很明确,就是回答方梦贞提出的问题,并判断剧本可能需要的数据
内容,分类后,再利用文字探勘的方式取得资料。
首先当然是以“债”、“年轻世代”相关内容为关键字,从PTT(批踢踢实业坊)、脸书
、新闻网站、网络论坛,挑选出网友评论度、分享转贴数量高的文章,搜集符合主题及需
求的内容。同时,也就不同个案问题爬梳法院判决书,甚或是外送的菜单。
徐毓良指出,借由PTT上的资讯,很容易就可找到各职业的个案。“30岁左右的人,会在
职涯版分享工作经验和过程。”团队就从中找到银行、行销、高科技等各行业的年轻人个
案,观察他们对于生活、薪水、职场、房贷等看法与抱怨,或觉得哪些工作比较好赚钱。
鉴于《我们与恶的距离》资料过于庞杂,导致编剧吕莳媛难以消化,徐毓良面对《大债时
代》,将上万笔资料删减、统整成100笔,再转译成方梦贞团队能理解阅读的形式:例如
文字云、表格、关键字等,同时也将资料汇集成小型数据库,供编剧日后查询参考。
大数据反复验证 戏剧缩影现实人生
经历4个月反复验证,方梦贞与《大债时代》编剧团队借由大数据资料,调整故事情节与
人物设定。她苦笑:“来回修改的过程是辛苦的,但改完后就不会心虚虚的,确实符合现
状”。
方梦贞透露,原本规划林柏宏的角色是要揭发公司的掏空弊案,但经由数据考证才惊觉,
这是公司少数人才可能接触的案件。“20多岁的人,不论职等或资历都不大可能接触到这
么机密的事,况且大部分年轻人连租房、买房都有困难,甚至吃饱都成问题,更在意寻找
自我价值的认同。”最后,只好将这条支线删除。
另一条放弃的剧情线,是“年轻上班族因压力吸毒”。徐毓良分享,团队爬梳500多篇法
院判决书和文献,发这个年龄层根本不大会接触毒品。“20、30岁这群人,生活压力都喘
不过来,根本没钱买毒品,经济宽裕的中年人与家庭富裕的孩子,反而才是主要使用者。
”
方梦贞分享,编剧团队除了删除不合现实的设定,也从数据中找到先前未注意的职业,掌
握年轻人在意的趋势,从而丰富了剧中角色的内容。
编剧团队删除不符现实的剧情之外,也借由数据增添人物角色丰富度:例如主角年龄提高
了5岁,变成30多岁。方梦贞解释:“刚毕业的新鲜人,面临的压力还没那么明显,大概
工作8、9年有些存款后,家里与社会对你比较有期待,而30岁世代就是被夹在中间,最痛
苦的那一层。”
徐毓良团队在PTT利用自动索引程式“爬虫”发现的“银行债权催收员”一职,最终也成
为了女主角的职业。剧本原先设定女主角是公务员,为赚钱买房兼职家教,与“债”的距
离较远,没想到后来发现,在民间贷款机构与非法讨债集团之外,还有银行债权管理部门
这样的催收工作。
在编剧把女主角年龄拉高,变成银行债权管理部门的小主管后,副业也改为时下流行的外
送员,让工作性质和内容更符合剧情走向,角色更加立体。
徐毓良指出,大数据并非左右编剧创作,反而是个辅助,帮助编剧找出田野调查过程被遗
漏、未被看见的资讯。方梦贞也附议,“数据是趋势,田调是细节”,两者相辅相成,提
升了编剧设定剧本大方向的效率,也捞出有趣的趋势议题。
横跨机器与编剧语言 徐毓良读数据定乾坤
《大债时代》播出后,许多观众都说在戏里看到了自己与亲友:“99%的我们都是咏晴,
即使房价再高、也要硬咬著牙买房。”“大债时代就是目前年轻人的缩影。”
方梦贞在宣传《大债时代》时,也特别感谢徐毓良团队的协助,让剧本真实呈现当代青年
面对生存困境的无奈,讲出新世代心声。
摊开4个月的合作过程,其实《大债时代》与资策会团队仅开了7次会。这意味必须在短期
内精准理解、回应剧组的问题。方梦贞本来得知要与资策会共事时,担心双方会有沟通障
碍,“没想到他们对影视术语不陌生,还会举出欧美剧中的类似情节跟我们分享”。
徐毓良笑言自己做的事,就是简单三步骤:听懂客户问题;翻译给机器;最后再把机器产
出的结果,转译回客户。“如果听不懂客户需求,有再高的技术、再强的敏锐度都没用,
解决问题才是关键。”
但是这翻译机的建立,可不简单!
徐毓良在2016年结束《我们与恶的距离》的合作之后,投入2年时间,以实验性质免费与
影视工作者合作,除了精进数据技术,也学习了解编剧到底需要什么,编剧是如何思考,
热心的编剧友人,还替徐毓良开了一长串书单。
“全部都看完了,但没有看很细啦!”徐毓良的办公桌放满密密麻麻的参考书,从创作经
典《场景设定创意辞海》、《故事的解剖》、《畅销书密码》,到没书皮、被拆成方便携
带的无名书。
与编剧沟通之路没有捷径,只有涓滴累积。尤其资策会执行剧本开发的团队,
包含徐毓良在内,仅有3个人,偶尔加个0.5,请工程师协助“爬虫”。徐毓良坦言,没有
政府的专案支持下,单仰赖大数据协助剧本开发,无法养活整个部门。“太新的事情,要
人掏钱不容易。”
万般设定起头难 照世明灯大数据
目前徐毓良的团队,有5、6个案子正在进行,从剖析年轻女性的感情观、年轻人大学毕业
后的出路,掌握世代价值观差异、协助国外IP转化成本土共感元素,还有运用司法文本与
社群数据找到犯罪手法,验证背景设定等等。
徐毓良认为,在许许多多的戏剧类型中,大数据最能提供协助的有两种:一是“有开放资
料文本的”,二是“剧情观点多元且混乱的”,像《我们与恶的距离》就是在探讨社会对
随机杀人事件的不同观感。
徐毓良指出,每个人看资料,下意识只会看喜欢的东西,自动过滤不熟悉的内容,“尤其
政治特别明显,绿的就喜欢看绿的,蓝的喜欢看蓝,看到另一党就会生气,可是事实应是
把蓝绿白拼起来后,中间那块才较接近真实,而我们就是试图还原。”
不过大数据也非万能,“有数据是基础,数据量够大才是大数据”,徐毓良解释,像刻画
台湾工地百态的《做工的人》,或以消防员为主题的《火神的眼泪》,这类网络资料量较
少的职业,还是得仰赖编剧的田野调查与实际探访职场职人。
大数据对于历史、神怪题材,也较难提供协助。徐毓良分享,曾有人想请他协助调查国共
内战后,被国民党留下或被带回台湾的华侨老兵资料,想写成剧本,但徐毓良只能婉拒。
“你在Google查到的内容,就是我能做的,这比较适合问历史、民俗专家”。
但徐毓良特别想打破一个迷思,不是只有“写实剧”能用大数据辅助,“科幻”类型也是
有所助益,“我可以做出未来年表”。
2002年,由汤姆克鲁斯主演的电影《关键报告》(Minority Report)中,未来世界的警
察已可透过犯罪预示系统,事先埋伏、逮捕嫌犯。片中展现的扩增实境(AR)、触控萤幕
、电子纸到无人车等,已经出现在我们生活周遭。
徐毓良指出,借由政府法规以及科学杂志等数据,替剧组写出“未来年表”不是不可能。
说到底,徐毓良目前的成绩,归功于资策会服务14年所累积的专案经验,再加上自己一颗
旺盛的好奇心。所有人丢出来的剧情问题,对他来说都是充实自己的题库,也惟有如此,
才能继续当编剧导演们的“徐”伯温,以数据库为影视产业卜一个未来。
要数据还是编剧 准确与套路的两难
大数据能完全取代编剧吗?
2015年成立的比利时人工智能公司ScriptBook,专攻剧本分析。只要上传剧本至
ScriptBook系统,6分钟内就能完成分析、获得详细数据,包含角色魅力量表、目标族群
预测、观众满意度指数等。ScriptBook也曾用算法预测过去两年上映电影的国际票房收
益,准确率高达86%,相当惊人。
https://www.scriptbook.io/
ScriptBook另一阶段的目标是故事自动生成,在内建30万份剧本资料的写作系统中,编剧
只需输入关键字与主题,选择长度并选定角色特征,系统就会填补剩下空白。他们认为人
类与AI共同写作,未来将成常态。
早在4、5年前,中国影视圈也已利用大数据分析,整合影视剧、演艺人员资讯,预测市场
反应,协助资方利用AI选择演员,预测选角组合对票房的影响。
徐毓良笑言,在中国工作的编剧友人曾告诉他,每个人电脑都有一个剧本分析器,稿子写
完,就丢进去验证哪些地方需要加强,才能成为“爆款剧”。“但我朋友就不愿意,因为
剧本就会长得很套路。”
嘲讽这种套路,也被中国玩成另类自娱。
“资深游戏玩家老张意外穿越到自己玩了10年的‘武林争霸’游戏世界中,从此拥有所向
披靡的强大力量,但他在穿越之初,就因误会成为武林公敌,随之而来的是一连串的围剿
和阴谋……”
以上内容,是由中国数据视觉化团队DATAMUSE开发的自动剧本生成器“国产烂剧制造厂”
所产制的内容,只要选取故事类型,输入两位主角名字,就能即时生成剧情介绍。
https://datamuse.guokr.com/
DATAMUSE表示,自动剧本生成器的制作初衷,是在思考为何中国拍摄技术越来越好时,低
分国产剧却越来越多。他们爬梳6000多部中国戏剧作品,从导演、剧情、演员多角度挖掘
数据规律,设计出这个自动剧本生成器。
DATAMUSE感慨,当编剧想推展剧情时,就喜欢以“昏迷、搬家、出轨、流产和精神病等桥
段,反复填充”,这意味着编剧缺乏想像力。
蓝色数据海 我想要一个未来
数据的科技蓝海,投影在方梦贞工作室的白墙上,她站在墙前,程式语言交织在脸上。
《大债时代》是方梦贞首部利用大数据开发的作品,合作经验愉快,也替剧组扣紧时事议
题。徐毓良团队既是观众又是数据分析者,能客观提供意见,也能精简资讯,“光从1、2
万笔资料,变成100、200笔,阅读量直接少100倍。”
方梦贞坦言,过去创作像土法炼钢,没有科技协助,写剧本找演员全靠“直觉跟猜”,虽
然尽力阅读相关报导与案例,最终主创团队只能以经验值辅助,嗅出时下议题或趋势。
但是把作品丢回市场,能不能引起观众共鸣?方梦贞笑回:“跟判断一个人会不会红一样
,这个行业都带着一点点赌的成分。”就像当初剧组选择林柏宏饰演创业屡次失败、油而
却不令人厌的杨大器。
“柏宏一坐下来,聊没多久,听他讲小时候爸妈做生意、到处卖东西的故事。角色身上那
亟欲成功,赚钱让家里过好生活的心情,他完全理解。那是我从没听过的柏宏,那时我就
在他身上看到大器的影子。”
或许这就是大数据无法看到的细节,方梦贞幽默地耸耸肩,“但你可以用数据知道,6成
观众都觉得这个人很帅,那红的机率确实比较高。”
对于大数据与影视的关系,方梦贞既乐观也保守,虽不否认大数据可能扼杀创意,但若有
机会再使用大数据分析、开发剧本,会以辅助形式来寻找线索或验证疑问。
“若全然依赖大数据,我会觉得有些可惜,有些戏剧能打动人、吸引人,是因为它超乎一
般人的生活。如果只看一般人注意的,就不会看到有趣的点。”方梦贞眼里闪著光,或许
也有那么几部电影、戏剧,是带着观众的想像,飞到更遥远之处。
大数据是能帮你快速抓住大方向、推你一把。不过更远的路,或许情感、直觉、创意更是
有用。方梦贞调皮的说:“连大方向都抓不到,再多小细节都没有用啦!”