楼主:
sharkdd (雪克)
2012-09-07 17:53:061.原文连结:
http://ppt.cc/Z-Jj
2.内容:
苹果微软谷歌三强战声控 九大车厂拥护Siri最具赢面
张玮容╱北美智权报 编辑部
语音控制是最直接的人机沟通方式,这项技术由来已久,美国的声控市场也出现不同产业
整合、并购的热闹景象。Apple为加快语音控制发展脚步,买下 Siri并大动作与车商洽谈
,同步申请专利。Microsoft则整合旗下产品、并推出Windows Phone已开发声控版图;语
音辨识商Nuance 发展策略多角化;Google则先攻手机与电视整合声控先机。在三强抢攻
的声控战场中,目前以Apple取得双B、Toyota等九大车厂的拥护,最具冠军相。
近日国内成功大学向美国法院控告Apple Siri 语音控制系统侵权一案,使得在市场已开
始广泛投注开发与应用的语音控制及辨识技术又再度备受关注。语音控制已行之有年,然
而,卡在处理器速度及NLU算法、数据库尚未发展完备的瓶颈,致使声控接口迟迟不能
普及。从2000年开始,语音行动上网需求浮现,初始是将语音搜寻器安装于电脑电话整合
系统 (CTI) 的服务器平台上,以利消费者查询以电话查询即时股票、餐饮等讯息。近几
年开始,声控市场起了莫大变化,技术成熟、数据库愈来愈完整,美国各大厂在声控版图
的发展不尽相同,产业变化热闹缤纷。
Apple 以金钱换取时间 并购Siri、同步抢攻汽车声控
Apple在2011年推出 iPhone 4S,搭载 Siri语音秘书系统,让语音控制技术又成为各家业
者竞相追逐的技术。尽管 Microsoft 宣称在 2005年即已推出手机语音控制概念,Google
也于一年多前推出类似的语音搜索 (voice search) 服务,但 Siri 掀起的热潮仍使
Microsoft 及 Google 望尘莫及,原因在于语音控制技术的难度及门槛,并非靠科技研发
便能达成,语音识别的工作原理相当繁复(如图一),当中牵涉了人的自然用语习惯、各
种口音、讲话速度等人为因素,因此必须累积更多的人力及时间来建构语料数据库。
Apple在开发语音控制技术时,也曾尝试自行开发,于2009年申请的专利
(US2010312547A,图二) 便可得知。然而语音控制成效不佳,为加快语音控制发展技术,
并赶上 iPhone新机推出时程,Apple于 2010年买下Siri,快速在手机作业系统iOS中集成
语音控制,并在用户体验方面对语音控制功能进行优化,虽然Siri语音系统现今仍未臻完
美,但已成功达到再一次的技术创新,让它使用起来更加自然,更像对话式的语音控制,
而非只有下达简单指令。
Siri窜起之后,也促使提供 Siri 技术、专门开发声音及语言解决方案的Nuance加快语音
控制发展脚步,曾经控告 Vlingo这家语音辨识服务厂商的Nuance,选择尽弃前嫌,于
2011年底以5亿美金并购了Vlingo,透过这两家厂商的技术及资源整合,Nuance 于今年8月
发表了行动程式虚拟助理Nina,为市场上首度提供SDK解决方案的厂商,同时Nina提供的
SDK支援iOS与Android平台,透过云端提供了语音辨识、文字转语音、声音生物辨识及自
然语言理解技术,不但能理解使用者所下的指令或查询,也能辨识说话者的身份。开发人
员只要将Nina嵌入自己的程式或不同平台中,便可让使用者透过声音控制程式来完成某些
工作。
汽车声控市场角力战 Apple, Microsoft, Nuance, FORD竞合关系
除了致力于手机语音控制技术的布局与发展,Apple也大张旗鼓的将版图扩张至汽车声控
市场。Apple在今年的全球开发者大会上正式公布,在未来的一年内计画与全球多数主要
车厂合作,将Siri整合入汽车车体设计之中,计画在今年第三季发表SEFM
(Siri Eyes Free Mode) 抢市,即将iPhone的Siri按钮复制到汽车的方向盘上,如此驾
驶便可透过汽车影音系统与Siri交谈,利用语音控制与连接汽车的新技术让Siri完成找路
、定位、播放音乐等工作。依Apple公布的资料,目前决定参与整合并支援Apple Siri 功
能的车厂分别是 Audi、BMW、Crysler、Honda、General Motors、Jaquar、Land Rover、
Benz及TOYOTA等九家车厂。
继Apple计画在今年第三季发表SEFM (Siri Eyes Free Mode) 抢市,Microsoft也不甘示
弱,与车厂福特合作推出车用智慧声控平台SYNC;而Google则将借由今年下半年陆续问世
的Android车载资通讯 (Telematics) 系统,力推语音搜寻服务。三大平台商的频繁大动
作,显示已卯足全力角逐汽车声控商机,而汽车声控市场激战也蓄势待发。
福特为各大车厂在汽车声控及语音控制等技术投入最积极的汽车公司,应用了Nuance语音
识别技术,新一代的福特车款搭载SYNC AppLink软件,提供驾驶者使用语音操控智慧型手
机,Android、BlackBerry和iPhone等智慧型手机上的应用程式都可以操作。Microsoft相
中汽车声控这块大饼,投资 Nuance、与福特联手打造的SYNC车载资通讯平台,以声控功
能做卖点,并已售出四百万台在市场先攻下一席之地;然而,挟有两大应用程式平台的
Apple与Google已急起直追,将对微软后续发展带来极大威胁与挑战。
随着Apple跨足汽车业,目前全球一线车厂的高阶车款皆有标配或选配声控功能,这也意
味着 Siri这样新元素即将整合至汽车车款。尽管 Microsoft 投资的 Nuance 已抢先提供
汽车声控解决方案,然而声控功能仍不如 Siri 来得自然、强大,而在平台商跨足汽车业
的同时,难度不只是技术,更在于同时整合汽车、手机、安全系统等产业。因此在后续的
市场抢攻策略中,各大厂之间呈现何种竞争格局、又采用哪些整合模式,将是汽车声控产
业的焦点议题。
Microsoft 整合旗下产品、推出共用程式 与Apple区隔市场
不甘让Apple Siri专美于前,Microsoft继 Windows Phone 7 可以透过语音启动应用程式
后,于今年6月发表 Windows Phone 8,导入透过语音控制应用程式 或进行网页搜寻等功
能,再度强化其语音控制功能,也采用三大平台(手机、平台、个人电脑)的共用程式,
让使用者能游走于三种产品之间。然而,因其应用程式商城种类尚不够强大完整,仅10万
余个应用程式,市占率目前仍不敌有50万个应用程式的 Android 手机及 iPhone。
Microsoft在手机语音控制的发展似乎不若 游戏机 Kinect 来得受人瞩目。报导指出
Microsoft 可能在近期计划将Xbox 360上安装IE 9浏览器。同时还计划将新的浏览器与
Kinect整合,让使用者透过语音和手势来操控浏览器。整合旗下产品,使 Xbox 360具有
Bing 视频搜索功能及 Kinect 语音辨识功能,此举意欲提高使用者体验人性化的程度,
也与Apple专长领域有所区隔。
Google 整合手机与电视声控
行动搜寻市占率高达97%的Google,在一年多前也推出语音搜索服务(voice search),
为了强化行动搜寻功能,Google推动“Grand Prix”计画,让工程师改造行动搜寻系统,
计划能随时随地搜寻、用声控或拍照取代打字。Google并于2010年发布Voice Action,使
Android智慧手机能够透过此程式将声音转换成文字讯息发送以及使用Google搜寻以及
Google地图。尽管拥有强大搜寻市占率,Google开发语音控制功能的速度始终跟不上
Apple,原因在于未来即时整合自有产品及平台。向来以创意及技术开发的 Google,未能
迅速推出新行动产品或广告,现在则需要推出某些创新,才能从行动平台获得更多营收。
Google发展声控技术的脚步虽略为落后,但其触角已成功延伸至电视产业。据
Patently Apple网站的消息指出,在Apple推出iCloud与Siri功能的前几天,Google向
USPTO提出透过行动装置上之声音控制功能遥控Google电视的专利,这意味着未来
Android智慧型手机内将内建这项声控技术,以达到手机同步显示与Google电视进行语音
控制的需求。如图三所示,这项声控技术不只能够应用在电视机的节目上,亦可应用到
无线音乐播放的功能。在距离家里将近400公尺处便可感应,因此消费者在到家前可先行
声控设定播放家里的音乐、并打开电视。
Amazon 强化网站搜寻 并购 Yap
据美国证券交易委员会 (SEC) 文件显示,Amazon 在2011年9月收购了语音辨识技术公司
Yap,交易双方一直没有透露相关消息,显示目前Amazon的一切产品都还没有设计声控,
但 Amazon也悄悄踏出声控发展的一小步。Yap的技术主要用于将语音转换为文本,而
Siri 的功能不仅限于语音文本转换、更着眼于将语音转换为指令的功能。因此,Amazon
并购 Yap 不单只是为了与 Siri抗衡,主要用意在于建立自己的语音技术平台,用来强化
Amazon的客户服务与网站行动搜寻。
综合以上所述,声控技术虽然发展已久,但因技术限制及语料累积,至近两年才堪称开花
结果。从手机应用扩展到汽车声控,语音辨识及控制技术愈臻成熟的同时,也出现了不同
产业间的整合现象。手机、导航、影音系统、汽车公司、语音控制技术商、平台商、
安全系统制造商之间的竞合关系,使声控产业益显热闹。各大厂的在声控领域的发展策略
亦不尽相同,从USPTO查询可得知(表一),Microsoft虽有367项相关的语音控制专利,但
主要应用在于自家游戏产品 Xbox及 Kinect,虽以推出Windows Phone紧追在后,但因其
应用程式种类不够多,目前难获消费者青睐。获得Microsoft投资的Nuance 则以210件专利
表现亮眼,除了并购、与车厂合作、同时是上游技术供应商,发展策略相当多元化。
Apple为一举攻下智慧型手机语音控制市场,并购 Siri并成功抢进汽车声控事业,时效掌
握迅速抢得先机。Google语音控制专利件数为16件,同步显示并整合手机与电视声控功能
令人瞩目。而声控专利申请仅2件的Amazon,以并购 Yap策略显示其意图不在于和 Siri抗
衡,反倒着眼于网站搜寻服务。