1.媒体来源:
台湾新浪网
2.完整新闻标题/内文:
巴西当地时间7月17日,随着百度董事长兼CEO李彦宏现场输入首个葡语版搜索关键词“
BrazilChina”,百度巴西葡语版搜索引擎正式启动。
对于正在向创新型国家迈进的中国来说,技术创新输出将成为未来对外经贸和外交的重点
方向。作为最大的中文搜索引擎企业,百度近年来也以技术创新为后盾,积极推进国际化
发展战略。此次进军葡语搜索市场,正是百度国际化战略的重要一步。
进军巴西推葡语搜索
百度一直对全球化市场和多语种搜索“蠢蠢欲动”,在海外研发、海外人才招募、海外市
场开拓、海外业务支撑上都有多重布局。在此之前,百度就先后发布过泰文搜索和阿拉伯
语搜索,在更早之前的2008年,百度还高调进入了日本市场。此外,百度贴吧、Hao123、
百度安全客户端、百度浏览器等产品均已推出泰文等外文版本。
巴西是金砖成员,人口众多,经济即将迎来爆发式增长,是继中印等国家之后的下一代新
兴市场,发展空间广阔。以百度贴吧为例,其海外MOU高达3000万,其中来自巴西的就有
1500万。正是在这一背景下,百度决定进军巴西市场。
从百度的国际化发展战略来看,发布葡语搜索确实是百度海外战略的一个里程碑式的事件
,不仅预示著百度在海外市场掀开了新的篇章,而且走出了真正凭借技术实力闯市场的海
外发展模式。
逐一突破三大难点
搜索引擎是一门“语言科学”,搜索引擎的发展过程实际上是其“语言处理能力”的提升
。百度在中文语言处理上的优势自然不必多说,不过,要把中文领域积累的优势复制到新
的语种上,却并不容易。
百度开发葡语搜索引擎,面临几个难点:
难点一:语种差异带来的NLP算法挑战。
葡语属于屈折语,和中文孤立语相比有大量形态变换,构词、句法等方面上也有很大差
异。
如何破解?百度借助NLP(自然语言处理系统)透彻分析语言特点,在大数据环境下运用
统计方法快速定位差异、总结规律,制定出有针对性的语言分析手段,能解决语种差异上
的“初识挑战”。
难点二:积累空白背后的语料词库缺乏。
搜索引擎不断积累全网内容、Query请求以及基于此分解的词库、语料和算法。与
百度已深耕15年的中文搜索不同,在葡语搜索引擎领域,百度没有这些数据积累,要从头
开始。
如何破解?除了吸引国际优秀人才加入,大规模应用机器学习模型和自然语言技术之
外,百度在早期技术研发中已经考虑到了未来多语种的可能性,搭建了可扩展、可迁移和
国际化的技术框架,这个系统缩短了小语种NLP基础技术建设周期。
难点三:市场差异对产品、运营和推广带来新挑战。
葡萄牙语是世界第六大流行语种,使用它的国家和地区包括葡萄牙、巴西、安哥拉、中国
澳门、西班牙等。每个国家和地区都有本地化的市场特点和用户习惯,进而对产品、技术
和运营提出不同要求。
如何破解?百度技术和产品团队已经习惯的中文搜索思维需要推倒重来,不能预先假
设,必须分析当地语言特性、市场特点和用户反馈,同时聘请专业语言专家做跨界研究,
制定更合理、更通用的技术方案。
靠NLP与Google竞争
百度进入巴西以及葡萄牙语搜索市场还有一个障碍,那就是对手Google。Google早已进军
葡语搜索和巴西搜索市场,百度引以为豪的NLP技术、深度学习技术也是Google的强项,
说到底还是要看百度与Google在新的战场PK技术。
百度NLP技术并不比Google弱。搜索圈内人都知道,百度NLP团队是世界领先的NLP技术团
队之一。百度NLP技术更注重实用性和工业价值,强调技术为产品服务,这与Google相比
风格迥异。当Google鼓捣无人汽车、GoogleGlass等酷玩意儿的时候,百度正在做阿拉丁
计划、地图、O2O、金融、贴吧、知道等更“接地气”的业务和产品。
百度在巴西与Google竞争,还有非常有利的一点:巴西十分需要百度,会给予百度相应的
支持。据了解,百度与巴西科技创新部的合作包括:百度将在巴西建立世界级企业研发中
心,为巴西互联网科技提供创新性解决方案,培养互联网科技人才,支持巴西创业公司。
在业界关注百度葡语搜索上线消息本身的同时,资本市场也将开启一轮对百度市值增长空
间的想像。假以时日,百度与Google在其他多国的PK和较量,势必将引发全球搜索引擎市
场更大范围的格局变化。
3.新闻连结:
http://ppt.cc/lXE7
备注: 有野心