麻省理工学院
人工智能实验室
aiworkgpaper3161988年10月
来自it人工智能实验室:如何做研究?
作者:人工智能实验室全体研究生
编辑:davidchapan
版本:13
时间:1988年9月
译者:柳泉波北京师范大学信息学院2000级博士生
摘要本文的主旨是解释如何做研究。我们提供的这些建议,对做研究本身(阅读、写作和程序设计),理解研究过程以及开始热爱研究(方法论、选题、选导师和情感因素),都是极具价值的。
pyright1987,1988作者版权所有
备注:人工智能实验室的workgpapers用于内部交流,包含的信息由于过于初步或者过于详细而无法发表。不像正式论文那样,会列出所有的参考文献。
1简介
这是什么?
并没有什么神丹妙药可以保证在研究中取得成功,本文只是列举了一些可能会有所帮助的非正式意见。
目标读者是谁?
本文档主要是为it人工智能实验室新入学的研究生而写,但对于其他机构的人工智能研究者也很有价值。即使不是人工智能领域的研究者,也可以从中发现对自己有价值的部分。
如何使用?
要精读完本文,太长了一些,最好是采用浏览的方式。很多人觉得下面的方法很有效:先快速通读一遍,然后选取其中与自己当前研究项目有关的部分仔细研究。
本
文档被粗略地分为两部分。第一部分涉及研究者所需具备的各种技能:阅读,写作和程序设计,等等。第二部分讨论研究过程本身:研究究竟是怎么回事,如何做研
究,如何选题和选导师,如何考虑研究中的情感因素。很多读者反映,从长远看,第二部分比第一部分更有价值,也更让人感兴趣。
?小节2如何通过阅读打好ai研究的基础。列举了重要的ai期刊,并给出了一些阅读的诀窍。
?小节3如何成为ai研究领域的一员:与相关人员保持联系,他们可以使你保持对研究前沿的跟踪,知道应该读什么材料。
?小节4学习ai相关领域的知识。对几个领域都有基本的理解,对于一个或者两个领域要精通。
?
?小节6如何写期刊论文和毕业论文。如何为草稿写评审意见,如何利用别人的评审意见。如何发表论文。
?小节7如何做研究报告。
?小节8是有关程序设计的。ai程序设计与平常大家习惯的程序设计有所不同。
?小节9有关研究生涯最重要的问题,如何选导师。不同的导师具有不同的风格,本节的意见有助于你找到合适的导师。导师是你必须了解如何利用的资源。
?小节10关于毕业论文。毕业论文将占据研究生生涯的大部分时间,本部分涉及如何选题,以及如何避免浪费时间。
?小节11有关研究方法论,尚未完成。
?小节12或许是最重要的一节:涉及研究过程中的情感因素,包括如何面对失败,如何设定目标,如何避免不安全感,保持自信,享受快乐。
2阅读
很多研究人员花一半的时间阅读文献。从别人的工作中可以很快地学到很多东西。本节讨论的是ai中的阅读,在第四小节将论述其他主题相关的阅读。
阅读文献,始于今日。一旦你开始写作论文,就没有多少时间了,那时的阅读主要集中于论文主题相关的文献。在研究生的头两年,大部分的时间要用于做课程作业和打基础。此时,阅读课本和出版的期刊文章就可以了。(以后,你将主要阅读文章的草稿,参看小节三)。
在
本领域打下坚实的基础所需要的阅读量,是令人望而却步的。但既然ai只是一个很小的研究领域,因此你仍然可以花几年的时间阅读本领域已出版的数量众多论文
中最本质的那部分。一个有用的小技巧是首先找出那些最本质的论文。此时可以参考一些有用的书目:例如研究生课程表,其他学校(主要是斯坦福大学)研究生录
取程序的建议阅读列表,这些可以让你有一些初步的印象。如果你对ai的某个子领域感兴趣,向该领域的高年级研究生请教本领域最重要的十篇论文是什么,如果
可以,借过来复印。最近,出现了很多精心编辑的有关某个子领域的论文集,尤其是an-kauffan出版的。
ai实验室有三种内部出版
物系列:workgpapers,os和technical
reports,正式的程度依次增加,在八层的架子上可以找到。回顾最近几年的出版物,将那些非常感兴趣的复制下来。这不仅是由于其中很多都是意义重大的
论文,对于了解实验室成员的工作进展也是很重要的。
有关ai的期刊有很多,幸运的是,只有一部分是值得看的。最核心的期刊是artificial
tellince,也有写作"thejournalofartificial
tellince"或者"aij"的。ai领域真正具备价值的论文最终都会投往aij,因此值得浏览每一年每一期的aij;但是该期刊也有很多论
文让人心烦。putationaltellince是另外一本值得一看的期刊。gnitive
science也出版很多意义重大的ai论文。achelearng是机器学习领域最重要的资源。ieeepai(pattern
analysisandache
tellince)是最好的有关视觉的期刊,每期都有两三篇有价值的论文。ternationaljournalofputer
vision(ijcv)是最新创办的,到目前为止还是有价值的。robotics
research的文章主要是关于动力学的,有时候也有划时代的智能机器人论文。ieeeroboticsand
autoation偶尔有好文章。
每年都应该去所在学校的计算机科学图书馆(在it的techsare的一层),翻阅其他院校出版的ai技术报告,并选出自己感兴趣的仔细加以阅读。
阅
读论文是需要练习的技能。不可能完整地阅读所有的论文。阅读论文可分为三个阶段:第一阶段是看论文中是否有感兴趣的东西。ai论文含有摘要,其中可能有内
容的介绍,但是也有可能没有或者总结得不好,因此需要你跳读,这看一点那看一点,了解作者究竟做了些什么。内容目录(thetableof
ntents)、结论部分(ncsion)和简介(troduction)是三个重点。如果这些方法都不行,就只好顺序快速浏览了。一旦
搞清楚了论文的大概和创新点,就可以决定是否需要进行第二阶段了。在第二阶段,要找出论文真正具有内容的部分。很多15页的论文可以重写为一页左右的篇
幅;因此需要你寻找那些真正况。jo
ol有了一个好想法。她将尚不完整的实现与其他一些工作融合在一起,写了一份草稿论文。她想知道这个想法究竟怎么样,因此她将论文的拷贝发送给十位朋
友并请他们进行评论。朋友们觉得这个想法很棒,同时也指出了其中的错误之处,然后这些朋友又把论文拷贝给他们各自的一些朋友,如此继续。几个月后,jo对
之进行了大量修订,并送交给aaai。六个月后,该论文以五页的篇幅正式发表(这是aaai会议录允许的篇幅)。最后jo开始整理相关的程序,并写了一个
更长的论文(基于在aaai发表论文得到的反馈)。然后送交给ai期刊。ai期刊要花大约两年的时间,对论文评审,包括作者对论文修改所花费的时间,以及
相应的出版延迟。因此,理想情况下,jo的思想最终发表在期刊上需要大约三年时间。所以牛人很少能从本领域出版的期刊文章中学到什么东西,来得太迟了。
你,也可以成为一个牛人。下面是建立学术关系网的一些诀窍:
?有很多讨论某个ai子领域(如连接主义或者视觉)的邮件列表,选择自己感兴趣的列表加入。
?
当与很熟悉本领域的人讨论自己的思想时,他们很可能不直接评价你的想法,而是说:“你读过某某吗?”这并不是一个设问,而是建议你去阅读某份文献,它很可
能与你的想法有关系。如果你还没有读过该文献,从跟你交谈的高手那里得到该文献的详细信息,或者直接从他那里借一份拷贝下来。
?当你读到某份让你感到很兴奋的论文,复印五份送交给对之感兴趣的其他五个人。他们可能会反馈回来很好的建议。
?本实验室有很多针对不同子领域的非正式(持续发展的)论文讨论组,他们每星期或每两星期聚会一次,对大家阅读完的论文进行讨论。
?有些人并不介意别人去翻看他们的书桌,也就是说,去翻阅他们堆在书桌上的不久要阅读或者经常翻阅的论文。你可以去翻翻看,有没有自己感兴趣的。当然了,首先要得到主人的许可,要知道有些人确实反感别人翻自己的东西。去试试那些平易近人的人。
?同样,有些人也并不介意你翻看他们的文件柜。实验室中可是有很多学问精深的人,他们的文件柜里也是有好多宝贝。与利用学校图书馆相比,这通常是更快更可靠的寻找论文的方式。
?
只要自己写下了些东西,将草稿的拷贝分发给那些可能感兴趣的人。(这也有一个潜在的问题:虽然ai领域的剽窃很少,但也确实有。你可以在第一页写上“请不
要影印或者引用”的字样以做部分防范。)大部分人并不会阅读自己收到的大部分论文,因此如果只有少数人返回评论给你,也不用太在意。你可以如此反复几次
——这是期刊论文所必需的。注意,除了自己的导师,一般很少将两次以上的草稿送给同一个人。
?当你写完一篇论文后,将论文的拷贝送给那些可能感兴趣的人。别以为人家自然而然地就会去阅读发表论文的期刊或者会议录。如果是内部的出版物(备忘录和技术报告)就更不容易读到了。
?你保持联系的人越是各式各样,效果就越好。尝试与不同研究组,ai实验室,不同学术领域的人交换论文。使自己成为没有联系的两个科研组交流的桥梁,这样,很快的,你的桌子上就会冒出一大摞相关的论文。
?
如果某篇论文引用了自己感兴趣的某些东西,做好笔记。维护一份自己感兴趣参考文献的日志。到图书馆去看看能不能找到这些论文。如果要了解某个主题的发展轨
迹,可以有意地去做一张引用的“参考文献”图。所谓的参考文献图,是指引用组成的网:论文a引用b和c,b引用c和d,c引用d,等等。注意那些被经常引
用的论文,这通常是值得阅读的。参考文献图有奇妙的性质。一个是经常有研究同一主题的研究组相互不了解。你搜索该图,突然发现了进入另一部分的方式,这通
常出现于不同学校或者不同方法存在的地方。尽可能了解多种方法是很有价值的,这总比非常深入的了解某一种方法更好。
?暂时搁置。跟别人交谈。告诉
他们你在做什么,并询问人家在做什么。(如果你对与别的学生讨论自己的想法感到害羞,也要坚持交谈,即使自己没有什么想法,与他们讨论自己认为确实优秀的
论文。这将很自然地引导到下一步做什么的讨论。)每天中午在活动楼七层有一个非正式的午餐讨论会。在我们实验室,人们都习惯于晚上工作,所以午餐的时候可
以跟别人组成松散的小组进行讨论。
?如果你与外界的交流很多——做演示或者参加会议——去印张事务名片,主要要使自己的名字容易记住。
?
从某个时间开始,你将会开始参加学术会议。如果你确实参加了,你会发现一个事实,几乎所有的会议论文都令人生厌或者愚蠢透顶。(这其中的理由很有意思,但
与本文无关,不做讨论)。那还去参加会议干吗?主要是为了结识实验室之外的人。外面的人会传播有关你的工作的新闻,邀请你作报告,告知你某地的学术风气和
研究者的特点,把你介绍给其他人,帮助你找到一份暑期工作,诸如此类。如何与别人结识呢?如果觉得某人的论文有价值,跑上去,说:“我非常欣赏您的论
文”,并提问一个问题。
?获得到别的实验室进行暑期工作的机会。这样你会结识另外一群人,或许还会学到另外一种看待事物的方式。可以去问高年级同学如何获取这样的机会,他们或许已经在你想去的地方工作过了,能帮你联系。
4学习其他领域
通
常的情况,你只能做ai领域的事情,对ai领域之外的事情一无所知,好像有些人现在也仍然这么认为。但是,现在要求好的研究者对几个相关的领域都了解颇
深。计算的可行性本身并没有对什么是智能提供足够的约束,其他的领域给出了其他形式的约束,例如心理学获得的经验数据。更重要的是,其他的研究领域给了你
思考的新工具,看待智能的新方法。学习其他领域的另外一个原因是ai本身并没有评价研究价值的标准,全是借自于其他领域。数学将定理作为进展;工程会问某
个对象是否工作可靠;心理学要求可重复的试验;哲学有严格的思辨;等等。所有这些标准有时都在ai中起作用,熟悉这些标准有助于你评价他人的工作,深入自
己的工作以及保护自己的工作。
经过六年左右的课程方可获得it的phd,你可以在一到两个非ai领域里打下坚实的基础,在更多的领域内具有阅读水平,并且必须对大部分内容具有一定程度的理解。下面是如何学习自己所知甚少领域的一些方法:
?选修一门研究生课程,这很牢靠,但通常不是最有效的方法。
?阅读课本。这方法还算不错,不过课本的知识经常是过时的,一般还有很高比例的与内容无关的修辞。
?找出该领域最棒的期刊是什么,向该领域的高人请教。然后找出最近几年值得阅读的文章,并跟踪相关参考文献。这是最快的感受该领域的方法,但有时候你也许会有错误的理解。
?找出该领域最著名的学者,阅读他们所著的书籍。?跟该领域的研究生泡在一起。
?参看外校研究该领域的系的课程表。拜访那里的研究院办公室,挑选有用的的文献。
下面是一些需要了解的与ai有关的科目:
?计算机科学是我们所使用的技术。你需要选修的初级研究生课程肯定不能让你对计算机科学有足够的了解,因此你必须通过阅读学习更多的知识。计算机科学所有的领域——理论体系结构,系统,语言等等——都是必须学习的。
?
数学可能是接下来需要了解的最重要的学科。对于工作在视觉或者机器人学的人来说更关键。对于以系统为中心的工作,表面上看,并不相关,但数学会教你有用的
思维方式。你需要能阅读定理,如果具有证明定理的能力将会给本领域的大多数人留下深刻的印象。很少有人能自学数学,光做个听众是不够的,还得做习题集。尽
可能早地选修尽可能多的数学课,其他领域的课程以后选也很容易。
计算机科学是以离散数学为基础的:代数,图论,等等。如果你要从事推理方面的工
作,逻辑是很重要的。逻辑在it用得不多,但是在斯坦福以及其他地方,这是认识思维的主流方法。所以你必须具备足够的逻辑知识,这样你才能保护自己的观
点。在it数学系选修一两门课程就足够了。要是研究兴趣在感知和机器人,那么不仅需要离散数学,还需要连续数学。在分析,微分几何和拓扑学具有扎实的基
础将会给你提供最常使用的技巧。统计和概率只是一般有用。
?认知心理学与ai共享几乎完全相同的观点,但是实践者确实具有不同的目标,他们主要是做实验而不是写程序。每一个人都需要知道认知心理学的某些知识。在it,ollypotter开了一门很好的有关认知心理学的初级研究生课程。
?
如果你想做有关学习的工作,那么发展心理学是很重要的。发展心理学从一般意义上讲也是很有用的,它能告诉你对于人类智能来说,哪些事情难哪些容易。它还给
出了有关认知体系结构的认知模型。例如,有关儿童语言习得的工作就对语言处理理论施加了坚实的约束。在it,san
carey开了一门很好的有关发展心理学的初级研究生课程。
?心理学中更“软”的部分,例如心理分析和社会心理学,对ai的影响看似很小,但具有
潜在的重大意义。它们会给你非常不同的理解人是什么的方式。象社会学和人类学这样的社会科学可以起相似的作用。具有多种观点是很有用的。上述学科你需要自
学。不幸的是,很难区分出这些领域哪些是优秀的成果哪些是垃圾。到哈佛去学习:对于it的学生来说,很容易交叉注册哈佛的课程。
?神经科学告诉
我们有关人体可计算硬件的知识。随着最近可计算神经科学和联结主义的兴起,对ai具有非常大的影响。it的脑和行为科学系提供了非常好的课程,视觉
(hildreth,io,richards,ullan),移动控制(hollerbach,
bizzi)和普通神经科学(9015,由专家组讲授)。
?如果你想研究自然语言处理,语言学是很重要的。不仅如此,它还包含了很多有关人类认
知的约束。在it,语言学主要由chosky学院负责。你可以去看看是不是符合自己的兴趣。ekoff最近出版的书《won,
fire,anddanrothgs》可作为另外一种研究程序的例子。
?工程,特别是电机工程,已经被很多ai研究机构作为一个研究领域。我们实验室在培养程序中加入了很多需要确实做一些东西的要求,例如分析电路。了解ee也有助于建造定制的芯片或者调试自己的lisp机器上的电源。
?物理学对于那些对感知和机器人感兴趣的人具有强大的影响。
?
哲学是所有ai领域看不见的框架。很多ai工作都有蕴含着哲学的影响。学习哲学也能帮助你运用或者读懂很多ai论文中用到的观点。哲学可沿着至少两个正交
的轴分解。哲学通常是某种东西的哲学;有关思维和语言的哲学与ai更相关。然后存在着多种哲学学派,从比较大的范围来分,哲学可分为分析哲学和大陆哲学。
分析哲学有关思维的观点与ai领域大多数研究者一致。大陆哲学则对我们习以为常的很多东西有非常不同的看待方式。它曾经被dreyf用于证明ai是不
可能的。就在不久前,有几位研究者认为大陆哲学与ai是相容的,提供了另外一种解决问题的方法。it的哲学属于分析哲学,哲学学院深深地受到
chosky在语言学方面工作的影响。
看起来要学习太多的东西,是不是?确实如此。要小心一个陷阱:认为对于所有的x,“只有我对x了解的更多,这个问题才会变得容易”。要知道,与之相关需要进一步了解的东西是永远没完的,但最终你还是要坐下来,解决问题的。
5笔记
很多科学家都有做科研笔记的习惯,你也应该这样。可能你曾被告知从五年级开始,对于每一门科学课都应该记笔记,确实如此。不同的记笔记方式适用于不同的人,可以做在线笔记,记在笔记本或者便笺簿上。可能需要在实验室有一个,家里还有一个。
在笔记本上记录下自己的想法。只有你自己才会去读它,因此可以记得比较随意。记录下自己的思索,当前工作中遇到的问题,可能的解决方案。对将来可能用到的参考文献作小结。
定期翻阅你自己的笔记本。有些人会做月度总结,方便将来的引用。
笔记中记录中的东西经常可以作为一篇论文的骨干。这会使生活变得轻松些。相反,你会发现写粗略的论文——标题,摘要,分标题,以及正文的片段——是一种记录自己当前工作的有效方式,即使你并不准备把它变成一篇真正的论文。(过一段时间你或许会改变想法)。
你或许会发现verajohnn-steer的书《notefthed》很有用,该书并不是描写如何做笔记的文献,它描述了随着思想片断的积累,创新思想是如何出现的。
6写作
写作的理由有很多。
?在整个读研的过程中,你需要写一到两篇(这取决于你所在系的规定)毕业论文,以获得phd或者s。
?勤于写作不仅仅给你练习的机会。
?学术的规则就是要么发表,要么腐烂。在很多领域和学校,这通常开始于你成为一名教授时,但是我们实验室的很多研究生毕业之前就已经开始发表论文了。鼓励发表和分发论文是很好的政策。
?写下自己的想法是很好的调整思路的方式。你会经常地发现自以为很完美的想法一旦写下来就显得语无伦次。
?如果你工作的目的是不仅为自己还要为他人服务,就必须把它发表。这也是研究的基本责任。如果你写得精彩,会有更多的人来了解你的工作。
?ai但凭单打独斗是很难做的,你需要经常地从他人那里获得反馈。对你的论文作评论就是最重要的一种形式。任何事情,要做就要做到最好。
?
阅读有关如何写作的书籍。strunk和white的《elentf
style》对基本的应该如何不应该如何做了介绍。cire的《the‘slebyle》(houghton
iffl)是有关在句子级别如何编辑的书籍。jacesbarzun的《sipleanddirect:arhetoric
forwriters》(harperandrow,1985)是有关如何作文的。
?写论文时,读读那些写作高超的书,并思考作者的句法运用。你会发现不知不觉地,你已经吸收了作者的风格。
?要成为写作高手,需要付出颇多,历经数年,期间还要忍受和认真对待他人的批评。除此之外,并无捷径可走。
?写作有时候是很痛苦的,看起来好像是从“实际的”工作中分心了。但如果你已经掌握了写作技巧,写起来会很快。而且如果你把写作当作一门艺术的话,你能从中得到很多乐趣。
?
你肯定会遇到思路阻塞的情况,这有很多的可能原因,没有一定可以避免的方法。追求完美可能导致思路阻塞:无论开始写什么,总觉得不够好。要理解写作是一个
调试的过程。先写一个草稿,然后返回修订。写草稿有助于理顺思路,如果写不出来正文,那就写个大纲。逐步对之细化,直到已经很容易写出子部分的内容。如果
连草稿也写不出来,隐藏掉正在写作的所有窗口,然后随便输入自己脑袋里想到的东西,即使看起来好像是垃圾。当你已经写出了很多文本后,重新打开窗口,将刚
才写的东西编辑进去。
另外一个错误是以为可以将所有的内容依次写出。通常你应该将论文的核心内容写出来,最后才是介绍部分。引起作者思路阻塞的另一个原因是不切实际的以为写作是很容易的事情。写作是耗时耗力的,如果发现自己每天只能写一页,也不要放弃。
?