26fall PhD NLP/LLM 申请总结贴
Overview
受 25Fall funding cut 以及 LLM申请赛道竞争加剧的影响,26Fall 的申请形势依然十分严峻。相比两年前,许多学校和实验室的预期招生人数都明显减少。在这一轮漫长而反复拉锯的申请过程中,我自己的申请并不算顺利,最终算是有些侥幸地成功上岸。龙大申请nlp的同学也不是很多,所以在这里也分享一下自己的申请经历和一些总结,供大家参考,希望能够提供一些帮助。
申请时候的BG
大致方向: Social NLP, Agent, Multimodal, Human-AI Interaction
Pub: nips, naacl, 然后iclr,cvpr在投(之后都中了),其他的coauthor合作的paper若干
TOEFL: 提交的90 (speaking 22), 标化成绩这个可以参考我之后的项目list,龙大大多数的项目语言成绩都可以waive
Letter: 国内:本校ap,外校合作的professor;美国:暑研的老板。三封均为强推
重要程度: Connection > Letter > Match程度 > Pub质量 > Pub数量 > GPA & TOEFL
申请的list: GT ML, JHU CS, NEU, NYU GSAS, UCLA CS, UCSB CS, UCSD CS, UNC CS, Duke CS, NWU CS, UChi CS, UIUC CS, UMich CS, USC CS, UT Austin CS, UT Austin iSchool, UW CS, UW iSchool, UWM CS; 大概的申请策略是,跳过四大和一些强committee的学校,从top5开始抽奖到top30,包括一些泛CS的组,比如说information science,ece有些项目也有PI是做nlp的。
Admitted: UCSB (return), GT降录MSCS
语言没Waive的: Duke, UChi, UT, NWU, UW iSchool (speaking不够直接desk reject), UIUC (speaking RA卡22,TA卡24), USC, NEU; Fee Waived: UChi, JHU
关于强committee/prof: 比如四大,UWM, Connell, UIUC(3个prof vote发phd offer,两个prof vote发ms), 这些学校都是典型的committee决定的。但是对于其他的一些往年看来是强prof的学校,收到funding影响TA的名额会减少,就变相增强了committee的话语权,比如说有学校就要求PI能够保证4年的funding才可以招学生(以往可能是两年),同时也会限制PI的招生人数。这也就导致有些项目招生人数锐减,可能一个PI就只会招一两个。
Reserach Journey
虽然 paper 远没有 connection 那么重要,但随着这两年顶会论文数量不断膨胀,在申请时,入学前已经有一篇顶会 accept,基本已经可以视作一个较为明显的门槛。可对于本科生直博申请者来说,这件事并不容易:一方面,时间本来就很紧,在四年里既要兼顾课内学习,又要推进科研并做出稳定产出,难度其实很大;另一方面,如今审稿的随机性也很强,哪怕投稿的是一篇自己认为质量不错的 paper,也未必能得到理想的结果,这进一步压缩了申请前的容错空间。
从我自身经历来讲,我是大二下先开始了第一段科研(实际上就是给phd打杂,也和现在的方向不相关),等到大三暑假(24 summer)的时候,我才真正开始做自己在 NLP 方向上的第一个项目。此后我才逐渐有了比较持续的产出。后来我也决定,等文章正式拿到 accept 之后,再继续积累一些 connection,因此最终选择 gap 一年,放到 26 Fall 再申请 PhD。所以说,我觉得四年内的timeline应该是:
大二下开始第一段科研(尝试为主,确定自己喜欢的方向)-> 大三在本校(没有成果套北美lab很难)内继续推进,完成第一篇论文 -> 简历上有一些经历之后,从大三下就开始找北美暑研,remote或者onsite进lab科研(通常是target 9月底iclr)-> 之后就是确认推荐信,准备申请材料,提交申请。
Connection
如何建立自己的connection几乎是申请最重要的事情。首先,你可以借此认识一些同辈申请者,以及 PhD、postdoc、prof 等已经在这个体系里的人,他们往往掌握着很多关于申请的一手信息。这些信息差会直接影响你对学校、项目和 lab 的判断,也能帮助你在选择时少走很多弯路。其次,更重要的是,通过与 professor 的实际合作,你才有机会拿到更有分量的 recommendation letter,让对方为你的 research 能力做背书。对于申请 PhD 来说,这一点非常关键,因为站在 PI 的角度,他们通常很难把手里的 grant 投给一个自己几乎不了解的学生。
暑研选择
在龙大本校科研来说,对于nlp方向lab的选择并不多,而且国内推荐信的份量相对较弱,因此对于北美暑研的依赖会比较大。因为现在非top校的lab,招生都会特别保守,基本都会优先考虑return,已经有长期的合作基础了,所以暑研的目的最好还是要能稳住一个return offer。对于lab的选择,我觉得可以通过这几个角度来衡量:1.之前intern的去向,2.组里面有多少intern,return率是多少,3.prof的指导风格,connection如何等。最后,也是我认为最重要的一点,就是在做选择之前,一定要对自己的能力有一个比较清晰的认知。相比一味追求名气,选择一个真正适合自己的 lab 往往更重要。对于实力非常强的大佬来说,去四大做暑研,往往也能顺利拿到 return,或者拿到其他 top 学校的 offer;但对于大多数人而言,申请并不是只看“上限”,更重要的是找到一个与自己背景、能力和发展目标相匹配的去处。另外,推荐信这件事也不要盲目追求 professor 的 title,真正重要的还是信本身的强度。与其拿到一封来自大牛但内容泛泛的推荐信,不如拿到一封真正了解你、能够具体说明你研究能力和潜力的强推,这在申请中往往更有分量。
学术会议
其他建立connection的地方就是学术会议了。在开会的时候,你可以通过自己的poster宣传自己的作品,让更多的同行熟悉你,同时你也可以通过poster session和其他参会者交流,了解他们的研究方向和兴趣。在会议当中,让你和自己感兴趣的 professor 进行一对一交流。相比线上邮件,这种线下沟通通常会更直接,也更容易给对方留下印象。
Ending
总而言之,我觉得申请 PhD 其实就是一个不断“convey”的过程。首先,你得先 convey 自己,想清楚自己为什么想读 PhD、是不是真的适合做研究;其次,你要通过 paper 去 convey reviewer,把自己的问题意识、方法设计和核心贡献讲清楚,让审稿人能够理解并认可你的工作;最后,你还要去 convey professor,在推荐信、套磁和面试这些环节里,让对方看到你的研究能力、发展潜力,以及你和他们组的匹配度。
最后祝大家申请顺利,也欢迎找我connect: tobyyang7@outlook.com