台湾目前做bioinfo、genomics这块的人不算很多,理工背景出身再少一些,
在这边分享一下申请PhD的过程以及一些自己的想法。长期看留学板,非常感
谢出国前辈们的分享,也希望自己可以提供未来有志者一些帮助。
Research Interests
Computational Biology (Genomics), Bioinformatics,
Human Genetics, High-performance Computing
Results (All PhD)
Admission
CMU-Pitt CPCB (1/27)
no interview
onsite Open House: 3/1-3
fellowship
UIUC CS (1/27)
Skype interviews: 12/27 (email 12/23), 1/21 (email 12/19)
RAship
JHU CS (2/28)
Skype interview: 1/12 (email 1/9)
onsite visit: 2/28
RAship
Rejection
UCSF iPQB (12/16), MIT CSB (1/13)
Stanford BMI (1/23), Yale BBS (CSB Track) (2/8)
UC Berkeley (3/6), UC San Diego BISB (3/6)
Harvard BIG (3/8), Princeton QCB (3/10)
Pending
UCLA EE
Skype interview: 2/15 (email 2/11)
decline on 3/19
JHU Human Genetics
waitlist (1/18)
UW EE
Decision
JHU CS
Background
Education
M.S. in Electronics Engineering, NTU (2015-2017)
B.S. in Electrical Engineering, NTU (2010-2015)
B.A. in Economics, NTU (double degree)
GPA: 3.92/4.3 (43/201)
Exchange student, UIUC (2014)
Standardized Tests
GRE
157(76%)/170(97%)/3.5(42%) (2017/9)
TOEFL
105 (R29/L27/S24/W25) (2017/9)
101 (R25/L27/S23/W26) (2013/10)
Publications
Journal:
1st author x1 (in preparation) // alignment algorithm (software)
Conference: // 全部都是生物资讯相关的数位电路 (IEEE CAS)
1st author x(1+1 submitted)
2nd author x1
co-author x(2+1 submitted)
Experience and Awards
Student Researcher, NTU (2013-2017)
Technical Intern, Synopsys, California, USA (2016)
Teaching Assistant x3, NTU (2015-2017)
Novatek Fellowship (2016)
General Chair, NTUEE summer camp (2013)
NTUCOS (2010-2012)
Letter of Recommendation
3 from NTU: 指导教授、硕班口试委员 x2 (生机系、台大医院)
大纲
1. What is Computational Biology?
2. Why PhD?
3. 申请准备
3-1. 时程
3-2. Program选择
3-3. Standardized Tests
3-4. Letter of Recommendation
3-5. Curriculum Vitae
3-6. Statement of Purpose
3-7. Contact
4. After Submission
4-1. Interview
4-2. Onsite Visit
4-3. 选校
1. What is Computational Biology?
这是一个新兴的领域,核心是“利用计算方法处理生物的问题”。这个学科
常见的名称是computational biology(计算生物学)和bioinformatics(生物
资讯学),对于这两个名称的区分满混乱的 ([1,2]),大致上可以当作同义词...
而我个人着重的是computational genomics ([3]),再把研究领域限缩到
genomics(基因体)的层级。
21世纪初,“人类基因体计画(Human Genome Project)”定序第一组人类基
因体,也带动基因定序技术的突破性成长,现今的技术已经可以高速、精确、
便宜的定序生物基因体,提供基础生物学、医学领域新型且高效率的分析
方式。但因为基因体的资料量与复杂度都非常高,很需要有效率的方法来处
理、分析资料,所以计算端的投入也相当重要。
在电机系,很多人听到生物就倒退很多步 XD,当然做相关研究懂生物是个
plus,但核心基本上就是算法/资料结构,我的研究多在处理字串、也有一
些graph结构,有些人会做big data analysis等等,生物的特性一般来说会
model为算法的constraints,并没有到非常复杂,这边可以参考台大生机
系陈倩瑜老师的slides ([4])。
2. Why PhD?
我想这是关于申请出国最重要的一个问题,我每一次的面试都有被问到这题,
毕竟一个PhD大概就是4-6年,对校方/申请者本人都是巨大的投资,我身边
也不乏人PhD唸一唸发现“这不是自己想要的”、“其实对研究没有这么有兴
趣”,拿到国外名校PhD admission不是什么人生胜利组证书,回归根本还是
要倾听自己内心的声音,想想自己未来想做什么事、当个怎样的人。
NTUEE出国唸书的风气很盛,不过我大学期间并没有计画要唸PhD,申请了一
学期的交换去UIUC,体验一下短暂的留学生生活,当时觉得在美国生活实在
太辛苦了(当时那边功夫茶还没开,买不到珍奶这件事我觉得非常不OK),不
宜久留。另外一个原因是我当时做数位电路,在美国感觉没有比台湾好多少,
就决定留在电子所跟专题的指导老师唸硕班,我在大学时代的最后一个专
题project是做处理DNA序列(sequence alignment)的数位电路,当时没有什
么想法,不过这个project成了后来我走向生物资讯的关键。
在硕班期间,我打算延伸大学时期的sequence alignment研究,因此修了一
些相关的生物资讯课程,也参与满多实验室内的其他projects,我在这时期
增加了不少学术写作的经验、也累积了几篇发表。在更认识生物资讯之后,
我发现这个领域真的太有趣了,新一代定序技术的发展才短短十来年已经造
成很大的impact,加上我自己很喜欢跨领域的学科,于是开始重新考虑出国
唸PhD。
硕二上,我跑去医学院修了“次世代定序、生物资讯学与基因体医学
(NGS-BI-GM)”,这是最后让我确定要申请PhD的原因。这门课有一大部份是
从基因体医学的角度来切入新一代定序技术的影响,因为我从小就很怕血不
敢当医生QQ,觉得能用自己的专业提供人类医疗另一个层面的帮助是非常棒
的事情。
我觉得博士班的期程比较足,硕班的两年时间偏短,虽然我没有打算一定要
走学界,但我认为若能在好的实验室做出好的研究,不管以后往哪走都很有
帮助,加上computational genomics program大多只有PhD,所以MS vs.
PhD的选择对我来说不是大问题,我最后全部申请PhD。
3. 申请准备
3-1. 时程
我的准备时间非常赶,算是运气满好的一路都满顺利,也多亏许多朋友鼎力
协助,才能申请到理想的学校,可以的话还是早点开始准备申请的事情比较
好,像GRE五年内有效,先找个比较闲的时候考一考放著也不错。
9月:
英文考试(基本上都在唸GRE)、CV初稿
10-11月:
SOP、LOR初稿x1、找program
大致11/25左右完成所有文件 (第一批deadline是12/1)
12月:
联络教授
3-2. Program选择
这部份我觉得有满大的讨论空间,因为生物资讯这块大部份没有独立的系所,
有些学校会放在ECE/CS下面(偏重计算),有些会有专门的
bioinformatics/computational biology program(大多偏重生物)。
我的计画是这两类的系各投一半
生物:
Harvard BIG、MIT CSB、UCSF iPQB、
JHU HG、Princeton QCB、Yale BBS (CBB)、UCSD BISB
计算:
CMU-Pitt CPCB、UC Berkeley EECS、UIUC CS、
JHU CS、UCLA ECE、UW EE
在申请结束之后,我认为我这样的program分配不是很好,CS近年已经不太好
申请,但生物的系又更难:一是我非相关科系出身;二是招生名额少,像
MIT CSB今年只收6-8人、Harvard BIG今年据说国际生只收2人;三是国际生
的身分问题,我有联络上Yale的老师,他请我去确认是否适用
training-grant/CSC funding,结果是都不行,后来Yale没有发面试/录取给
我,最后偏Bio的系我一间都没上。
再选择一次的话,这些生医program我会少投几间,改投电资为主的program,
像Princeton我有兴趣的实验室也都有在CS department。但也可能遇到一
个问题是有些CS科系做生物资讯的老师不够多,因此另一个途径是海投一大
波以量取胜,但要考虑推荐信跟财力的问题。
另外建议可以申请教育部百大奖学金,107年度合作的学校有Cambridge、
Oxford、UIUC、Columbia、WUSTL、Caltech等,如果申请上的话教育部会出
一些经费支援(通常是全额奖学金的一半)。我把这个奖学金填给UIUC CS,不
过后来发现他们其实不太缺钱...面试我的老师也明确说这不会影响录取。我
的理解是EECS普遍比较多private funding,比较有弹性;而偏生医的科系以
政府经费为主,对国际生的限制比较多,有外部经费来源的话学校的经费压
力比较小,可能会带来录取上的帮助。
选择program也特别要注意该校的深度,也就是自己有兴趣的实验室/老师的
数目,毕竟唸一个PhD是段不短的时间,和老师处不好、老师被别的学校挖角
或跑去开公司都很常发生,如果一间学校只有1~2位老师的题目比较相关,就
学之后的容错度会低很多。我大概是抓有3间以上相关实验室的program来投。
3-3. Standardized Tests
通常申请PhD的话,G/T的分数不是最重要的事情,一般是建议考过门槛即可
,理工科抓G320/T100大致堪用(不过还是有些学校把托福门槛定得比较高、
或是想当TA的话有要求speaking分数)。分数过门槛之后,高个三五分我觉得
没有太大的差别,除非能拼到G335/T115以上这种很突出的分数,不然建议把
时间投资在别的地方。
通常这些英文成绩的要求都不是绝对,但如果申请者的表现不是非常特殊的
话,每个环节都很重要,英文没过门槛可能会直接被摆到申请者pool的后段,
相当可惜。之前看到一句话:“英文考试再难,也不会有唸一个PhD难”,
我觉得满受用的,勉励G/T苦海中的考生。
3-4. Letter of Recommendation
推荐信可能是所有申请项目里面最重要的一项,JHU CS即在官方的Q&A ([5])
中提到推荐信是他们最优先看的项目:
What does it take to get accepted into the PhD program?
The four areas we weigh are, in rough order of importance: letters
of recommendation, your record of projects or research,
undergraduate institution and transcript, and GRE scores.
在邀请推荐信前,可以先规画自己的申请资料想强调哪些方向。因为我是转
领域,指导教授的专长是硬件架构,因此我希望我的推荐信可以展现我在生
物资讯领域也有好的研究能力。我的另外两封信都来自台大外系教授(修过一
位教授两门课、一位一门课,都是我的硕班口委),他们都是生物资讯的专家,
一位做computation端、一位做genetic medicine,我认为这样的组合可以
从生医、资讯两端来强化我的申请资料。我在加州实习的主管也有答应可以
帮忙写推荐信,但因为公司的领域离生物资讯比较远,所以选择了现在的组合。
如果有唸硕士班,可以主动邀请教授担任口试委员,这非常有助于老师更了
解你,而且我邀请的两位外系教授都是相关领域的专家,他们在我的口试中
给了非常好的建议,对我的硕论的研究、后续的方向都很有帮助。
推荐信邀稿的时间我抓一个月,并提供教授们需要的资讯。我先做好一版CV
之后开始联络教授,虽然CV后来会再修,但通常足够做为写信的参考。另外
有些老师可能会希望有草稿,虽然拟草稿要花一些时间(还要特别注意用句不
要太像自己的SOP XD),但也可以藉著拟稿promote自己想强调的特质,透过
交叉掩护来显现自己在申请资料中的优势。拟稿时,尽量想像教授的立场来
描述自己,可以参考[6]。
3-5. Curriculum Vitae
这应该是申请资料里面比较好准备的一项,毕竟核心的内容都是先前的累积
成果。我直接拿朋友的latex模版来改,网络上也有很多CV的template,挑一
个喜欢的再微调即可。
排版的建议是简洁、明确、强调重点。我认为我的优势是publication不少,
所以把这栏放在满前面,想要给人“这学生有研究能力”的印象;另外,
research experience也是重要的字段,要把做过的project写清楚,强调自
己做了什么事情、结果有多好。
我完全没写相关课程,后续面试中偶尔有被问到修过哪些生物的课,倒是没
人问过修过哪些CS课(我其实没什么修 XD),我觉得这些资讯成绩单上就有,
没有必要写来占珍贵的版面。至于奖项、课外活动这些项目,如果有世界级
的奖项或是活动参与当然很加分,但因为这些项目很容易灌水(毕竟国外教授
不会知道台湾某大学的校内比赛是否有代表性),所以不建议花太多篇幅。不
过我还是有列一些上去,因为我觉得那些活动参与对我来说是重要的经历,
都略过的话觉得人生不太完整。
CV有一件很重要的事情是要避免错字/文法错误(不只CV,全部申请资料都要
注意),务必多次检查,能找到朋友帮忙看也会很有帮助。
3-6. Statement of Purpose
SOP在理工领域的申请中,通常是唯一可以看出申请人内心想法的资料,所以
我在SOP的写作中,非常强调自己的想法(为什么要唸PHD、为什么做这个领域、
对研究领域的insight等等),相关的经验则是作为该想法的支持。如果在
SOP中只是一一介绍自己的经历,则沦为详细版的CV,无法让审查者对你有更
多的认识。
我参考板上jasontang学长贴的MIT media lab范文(#1M3WGqwO)来设计我的
SOP,我的文章围绕着“我对这个研究领域的想法”来开展,再佐以我的经验
来增加说服力,整体架构如下:
1. 为什么做computational genomics
2. 我认为在这个领域中要成功的关键特质:
(a)整合不同计算方法的能力
(b)跨领域合作的能力
3. 我有深厚的算法基础
(佐证:先前的发表经验)
4. 为什么“(a)整合不同计算方法的能力”重要
(佐证:我在硕论中整合多种方法,做出很好的结果)
5. 为什么“(b)跨领域合作的能力”重要
(佐证:我做过跨领域的合作project,因为双方能力互补,所以最
后成果不错)
6. 未来目标──希望能够利用计算方法帮助医疗进步
(佐证:志工经验、社会科学的学习给我启发)
7. 写一些目标program的优点,结论说所以我们很适合呢
虽然说最终希望以“想法为骨干、经验为辅佐”的结构呈现SOP,但其实开始
构思时的出发点还是以自身经验出发,毕竟有相关的经历强化,抛出来的想
法才会看起来扎实,而且也希望SOP上可以摆上自己最好的一面。
我的方法是先把自己比较特别的经验列在笔记本上,再去整理这些材料,并
配合自己对于研究领域的想法来组织整篇文章。呼应先前在推荐信段落写到
的,在组织文章时应该先想过自己想要在申请资料中想强调哪些特色,能强
化这些特色的材料要优先保留,难免有些好材料不适合整篇文章的大结构,
还是得忍痛拿掉。
我十月开始写SOP,10/15第一版、10/22第二版、10/29第三版,前面真的很
惨,每一次改版几乎都是砍掉重写,到第三版才有比较满意的架构(不过后面
还是改很多)。一开始真的写得很像字多的CV,那时候整天都在想要怎么组织
这篇文章,写SOP要多花时间来调整架构、不要怕重写。
因为我相较于我的朋友们,算满晚申请学校,所以拜托了非常多正在国外唸
书的朋友来给我建议。特别是在文章架构规划的阶段,如果能找到有经验的
人给些建议,会有非常大的帮助。
有个小议题是需不需要在SOP里面提到有兴趣的老师,我都有写,不过后来觉
得不需要占这个版面,大部份的申请系统都有字段填professor of
interest (POI)了。但如果在申请送出前有联络到老师,则建议提及。
3-7. Contact
首先讲一下联络教授,我总共主动写信给九位老师,大部份挑EECS的老师寄
信,生物program因为几乎都是委员会审查,我就只选一些最想去的实验室
PI写信。内容首先是简单的自我介绍,然后会提到老师的paper中和我过往经
验较相关的部份,如果有用到很类似的方法也会特别提出来。
联络结果如下:
正面回应 x2
今年不收人 x1
我不在委员会如果录取了欢迎再联络 x1
请我确认经费可行性(前面提到的Yale老师) x1
没回 x4
正面回应其中一封就是我未来JHU的指导教授,另一封有面试,但我后来跟他
说我会去别间学校,值得一提的是这两位教授后来跟我约面试都是回复我当
初寄的那串信。
联络教授会不会影响录取这不好说,但仍然有一些好处:首先,我写信前会
读过教授的研究内容,确认研究方向、运用的方法符合自己的兴趣,这让我
多认识了很多原本略知一二但不熟的研究题目,对整个生物资讯的领域有比
较开阔的了解、对后续选校也有帮助;第二,有些老师就是没打算收人,早
点知道这个消息就不会占一格申请系统的POI名额,甚至可以改投别的
program,或是老师可能会介绍其他相关的教授给你认识。
另外推荐一个多认识教授的方法,至少在生物资讯领域,很多教授的交流是
透过twitter,开个帐号搜寻一下有兴趣的老师,有时候可以知道他们的研究
近况、甚至有没有打算收人(我当初看到JHU老师po文说他今年要收PhD学生,
当天马上寄信,也得到正面回复),twitter的推荐功能也可以找到其他相关
领域的教授,对于选择投哪些系很有帮助。此外,每天刷一下,看看教授们
在关心什么题目,有助于更全面地了解研究领域的发展,这对研究生涯绝对
是好事,也有个近期一点的好处是面试的时候可以拿这些题目来聊。
另外也可以考虑联络学生,尤其是台湾学生,如果发现目标实验室有正在就
学/刚毕业不久的台湾人,可以试着写一封有礼貌的信联络他/她,我有联络
到几位友善的学长姊,回答我对于实验室的风格、学校的状况、业界走向等
等的各式问题,非常感激他们的协助。申请学校可以尽量积极,多认识、多
了解都是好事。
4. After Submission
4-1. Interview
如果有拿到面试,那录取的机会已经很大了!必准备的内容包含自我介绍、准
备要问老师的问题、以及“所有”申请资料里面有提到的内容。另外“为什
么要唸PhD?”、“唸完PhD之后的规划是什么?”这类问题也都要好好准备,
我后来几个面试直接把这些内容包在自我介绍里面一起讲 XD。
面试前建议先拟个稿,端看对自己英文的信心决定要拟多细,我有大概写一
份自我介绍和最重要的一两个project,当然实际面试不会照稿唸,但先走过
一遍到时候比较容易正常发挥,不然面试的时候应该都会满紧张的,有时候
会漏掉重要的内容。另外,我第一次面试的时候,教授请我介绍一下我的研
究经验,我傻傻的从最久以前的project开始讲,没想到教授听一听就开始问
问题,但我根本有点忘记研究的细节,虽然后来有回想起来,但其实满抖的,
因为面试时间有限,建议好料先端上桌。
在自己提问的部份,我都会问老师你指导学生的风格是什么、学生毕业之后
的发展、学校跨领域合作的机会,当然还有研究相关的内容。
4-2. Onsite Visit
Onsite visit是个非常有助于认识该学校/program的机会,CMU-Pitt CPCB的
open house是办给已录取的学生,我也趁旅行的一天空档安排飞一趟
Baltimore拜访JHU的实验室。
我去JHU时还没有offer,但老师还是很爽快地答应让我去参观,还主动说可
以补助我来回Baltimore的机票和住宿费用。我把这趟visit视为额外的
onsite interview,不过当天的行程还算轻松,主要在和实验室学生、教授
meeting,每段都是30分钟,除了老师有问一些technical问题,其他时间都
在聊天,我也找机会观察老师和其他学生的互动。我在离开JHU当天晚上收到
老师寄来的offer。
CPCB的open house有三天,大部份有收到offer的学生都有来,主要的行程在
第二天,这天我meet了五个教授,各20分钟,还有各种午餐、晚餐social,
我那天身体状况不太好(到Pittsburgh前一天飞机delay硬是在纽约多待一晚QQ),
整天吃B群和咖啡硬撑著,行程结束回房间瘫在床上整个人动不了...
可以的话旅程安排得松一点,比较有时间调整。
对我来说,visit之后两个program都有加分,和未来可能的同学、现在的学
生、教授们聊聊都很有益于自己选择学校,也可以稍微认识接下来要待好几
年的城市。加上学校会多少补助一些费用,负担不算那么大,我认为非常值
得走一趟。
4-3. 选校
先简介一下我有录取的programs:
UIUC CS:
收我的教授研究做得非常好,和许多外系、外校老师都有合作,学校的CS也
非常强、计算资源丰富,另外原本UI系统的医学院只有Chicago分校有,今年
UIUC也要开医学院,未来可能会有一些医学相关的合作机会,不过跟我另外
两间学校比起来,生医相关的资源还是少很多,而且他们Bioinformatics
and Computational Biology group偏小,核心教授有四人(网站上挂六人,
但有两位本业是别的领域)。
CMU-Pitt CPCB:
这是CMU和Pitt (U. of Pittsburgh)合开的PhD program,是很有特色的一个
规划,CMU是CS #1、Pitt在医学领域也非常强(NIH funding top-5、
Pittsburgh城市满满都是UPMC医院大楼),这个program结合两边的强项,资
源丰富。网页上可以看到CPCB可以选择的实验室数目非常多,奖学金优沃(再
考虑Pittsburgh物价,真的很多 XD)、而且保证给到毕业。
在CPCB,两间学校的教授都可以指导学生,最后如果选CMU的advisor就拿
CMU毕业证书、选Pitt就拿Pitt,前两年修课的时候是两边跑(核心课程是四
门生物入门课、一门machine learning)。这个program今年约莫收24人,今
年有看到中国人x2、韩国人x2 (这边指的是拿该国学历申请,大学/MS在美国
的没算进去),往年会有10~12人去唸,目前CPCB应该是没有台湾人。
研究的部份,因为教授数目非常多,大部份的研究领域都有相关的教授,不
过整体来说比较著重machine learning,很多人的研究都和ML有点关系。
JHU CS:
学校的CS排名不太好(#25 @US News 2018 CS Ranking),一部份的原因是系
不大,不过整体来说engineering的资源比上述两间弱。但JHU的compbio非常
强,他们开发的Bowtie系列aligner可以说是史上最成功的生物资讯软件之一,
此外,JHU的医学院极好,在这边预计可以有满多机会参与生医相关的研究。
最后我主要在考虑CMU和JHU两间学校,CMU的优点在于非常强的CS,还有
program非常广,想做什么题目做大概都可以,缺点是做algorithm的老师偏
少(主做这块的仅有一位,但他做得非常好);JHU的优势在医学,且有非常好
的alignment/genome data processing algorithm的开发经验,另外我觉得
老师和学生的互动很好,我也比较喜欢JHU的campus。
两边的客观条件我觉得都非常好,最后算是凭感觉去做决定。因为我刚开始
做compbio时就读了JHU老师做的Bowtie的paper,后续做研究时也用了类似的
方法,最后秉持一个想和偶像一起做研究的心态决定加入JHU。
结语
从大学到硕班毕业,一路上自己算是迂回前进,大一、大二花较多时间在课
外活动,虽然有点伤GPA,但这大大影响我的价值观,也培养了团队合作、表
达等软实力;大学后段做了一些数位电路,还一度半转行唸了一个经济系;
硕班开始往生物资讯发展,进而决定申请博班。虽然许多经历在CV上看起来
不太相关,但这对我都是很重要的养分,让我更认识自己、清楚自己想要的
是什么,以致于现在可以很坚定的往下一个目标前进。
引用一位我的高中老师说的话:“如果目标是90分,那尽量做95~100分的准
备,如此就算失常也可以达标。”我在硕班第一年尚未决定申请学校,但当
时累积的一些研究成果对于后来申请PhD有很大的帮助,鼓励各位有余力的话
拉高自己的标准,把手上的事情做好、做到超乎标准,有一天说不定就会派
上用场。
致谢
追梦路上,得到非常多的鼓励、支持、包容,感谢卢老师长期的指导,给我
极大的空间自由发挥;感谢两位陈老师,你们是让我坚定走上这条路的大推
手;感谢好友们提供的建议以及协助,被我疯狂骚扰还是这么有耐心;感谢
各路贵人的帮助;感谢台大电机带给我更开阔的视野;感谢家人、女朋友的
包容和支持。
最后,我知道自己是个幸运的人,从小有很好的家庭、社会支持,期勉自己
莫忘初衷,成为一个更好的人,将这些不出于己的幸运反馈于社会。
Reference
1. https://www.quora.com/What-are-the-differences-between-bioinformatics-and-computational-biology
2. https://rbaltman.wordpress.com/2009/02/18/bioinformatics-computational-biology-same-no/
3. http://www.cs.jhu.edu/~langmea/resources/lecture_notes/genomics_comp_genomics.pdf
4. http://bioinfo.bime.ntu.edu.tw/c4lab/FAQforUndergraduates.pdf
5. https://www.cs.jhu.edu/graduate-studies/graduate-admissions-information/graduate-admissions-faq/
6. https://www.quora.com/What-do-professors-generally-consider-and-write-in-their-recommendation-letters-for-their-undergraduate-students-for-graduate-studies