人物专访:结合互联网及大数据应用的网络警察- 专访新加坡Google数据分析师 Patrick
语音原文:http://shelleyadventure.com/patrick-interview-part1/
知道网络警察这个工作吗?本集要专访的人物是目前在新加坡Google办公室担任数据分析
师的香港朋友Patrick,他在台大及伦敦政经学院完成他的大学及硕士学历后,回到香港
Yahoo工作,几年前,又转往新加坡Criteo 及Google工作,一直在互联网工作的他,今天
要跟我们分享他海外工作的内容及聊聊互联网的趋势发展。
网络警察的工作内容
我在Google是一个数据分析师,主要负责网络广告投放publisher分析.。在Google里面,
Publisher有分两种,第一是网页,第二是App。我就像网络警察一样,利用大数据来抓一
些不好的App,胡乱投放广告或者App内容有不恰当的内容却投放了Google的广告。
由于市场上有几百万的App在投放Google广告,我们,我们team 必须利用大数据来有效快
速抓高风险的App,然后对违规App进行处分。
大数据的内容很多,比如说使用者行为、App投放广告行为、应用市场搜寻下载行为、应
用市场搜寻下载行为、用户对App评论投诉等等多种数据来源,我们数据来源,我们团队
续建一个有效地模型来侦测出高风险的App。
想要进入big data 领域的建议或要培养的核心能力?
如果要成为一个Data人,不管是叫Data Analyst或Data Scientist. 我觉得要具备三个条
件:
第一是Presentation 能力:
Presentation可能是对Technical Background 或Non-technical Background 的或者是对
外或对内部的差别。当然,共通处就是要学会用最简单最短的文字来呈现你的分析结果。
对有技术背景或非技术背景的(Non-technical background)
如果是面对非技术背景的人比如说是销售同事,那报告的内容不需要最直接比如说公司的
产品为客户的订单增加百分之几,减少百分之几的时间,图表必须要一目了然,因为大部
分非技术背景的人都不会关注分析的过程跟假设,很多人就会关注分析的结果而已。
而面对技术背景的人做的Presentation,就需要做一个比较完整的报告,包括一开始的
Abstract或者叫summary或者叫TL;DR ,先把结果讲出来。然后开始说整个分析的阿桑先把
结果讲出来。然后开始说整个分析的Assumption, Limitations , Level of
confidence, Suggestions 和Next step或Action item等。
对外或对内部的团队
然后对内跟对外Presentation的处理方式又有不一样。
对外部的话,一般会放大优点,缩小缺点。
你会强调公司为客户带来的效益有多大,当解释么一方面没有去做的很好的话,就必须要
用一些数字来做解释。比如说上个月我们公司为你带来的订单减少了30%,你可你会强调
公司为客户带来的效益有多大,当解释么一方面没有去做的很好的话,就必须要用一些数
字来做解释。比如说上个月我们公司为你带来的订单减少了30%,你可能使用过往的资料
来证明订单下降是跟市场季节性的变动有关的。
如果是对内部观众的报告,那就需要以中立的手法来呈现。
比如说新的产品为那就需要以中立的手法来呈现,比如说新的产品为公司订单增加30% 但
盈利却只增加了5%,那报告必须要点出产品有成效,但整个产品只带来一些低价值的用户
,不一定符合效益。
第二条件是Documentation的能力:
网络公司很注重Documention,一方面是知识资讯传承,另外一方面是data如何有好理解
的呈现方式,因此,这时候若是能够将资料或数据透过清楚的图表来呈现,可以更容易帮
助团队了解了解情况。
第三条件是自我学习能力:
由于网络产业变化很快,因此很重要的是要不断学习。不管是透过内部学习,或是利用第
三方网络课程像是Udemy等线上课程,都能增进自我的硬知识。我有一位资深同事,更会
定期看学术论文,帮助他找灵感,相当好学。
以上都是我认为要具备的软实力,至于Technical Skill: 我会建议目前还在学的大学生
,若是对这一行有兴趣,可以去修相关的课程包含以下统计软件及图表软件:
Excel
SQL
Python
R
Tableau
大数据的过去及目前发展趋势
大数据现在的确是很火热的话题,一般是处理预测、分类和推荐等需求。前几年当大家还
在讨论Machine Learning 跟AI的时候,其实就是针对用户的体验和为用户创造价值,例
如说要提高搜寻的准确度、推荐跟使用者相关的产品、找出高价值的客户等等。
但从两年前开始,特别是美国总统大选时在Facebook上面的假新闻事件,到去年Facebook
和Google 的CEO 分别到国会听证会,引发广泛讨论用户隐私安全、资料使用、网络资讯
正确性和安全性的担忧,这些隐忧会对网络的名誉、企业客户的品牌安全有一定的影响。
因此,很多网络公司这两年都大量投资安全与信任(Trust and Safety)这一块,主要打
击网络不良和危险讯息、System Gamer和网络违法行为。比如说,电商平台会打击钻系统
漏洞以骗运费补贴或推荐新使用者折扣优惠、又或者盗版货。社交平台打击色情特别是儿
童色情、假新闻、冒充身份,Email 抓Phishing 邮件,视频分享平台有版权影平或不当
内容影片、网络金融服务机构也在打击各重洗黑钱和诈骗行为。
总而言之,很多企业已不只单单以Business/commercial oriented 层面运用ML和AI,现
在更注重Operational 层面上保护客户和公司的利益与安全。
你在网络公司待了有段时间,可以跟我们分享你的观察吗?
有的,我觉得以下两点是我发现网络人的共性,不管是在Google还是其他网络公司。
第一个是Fast Learning:说到这个,我发现公司的TOP Sales跟一般销售的差别,Tops
sales 通常非常的好学,他们不单单只是了解商业层面,也会去请教背后的技术原理。尤
其越是成功的业务,通常会不断精进自己的能力或是知识,才能够获得客户对他们的信任
。另外,他们通常有很强的技术背景,能够直接提供解答及服务给客户。
第二个是要主动的(Proactive)找专案来做
在Google 有熟知的Extra mile 或是120% Project,这些都是鼓励工程师能够利用自己的
创意去为公司创造更多价值。我觉得在网络业,本身就是要不断懂的快速学习以及保持主
动的态度,才不会被淘汰。
文章原文:http://shelleyadventure.com/patrick-interview-part1/