1、我阅读科研文献的一些做法 我写这个本来是想跟武夷山老师前段时间的博文给研究生的忠告建立起某种联系,但是时间已经过了很久了。我就以我自己的课题为例,挂一漏万,纯粹抛砖。本文分三节,第1节主要是讲搜集文献的整体步骤,第2节主要讲具体得到一些Paper的资源,如何去整理,第3节是讲在查找和阅读文献时如何记笔记。以下的方法可能只适用于外文文献,因为我根本上不看中文的文献。中文期刊的编年惯例、CNKI和维普等数据库的功能等等都有些不一样。在写之前我想向各位研究生读者先声明一句:没心搞研究的,将来不想当科学家的,准备考公务员或者找工作,读博只想随便对付一下的同学,就不用看这篇文章了。因为这篇文章讲的所有东
2、西在你们眼里都是毫无必要,傻冒之极,连搞笑的效果都达不到。1. 文献的“主流化刚开始读研究生,不管是导师给你的题目也好,自己上网看到的也好,一开始你手头上有的只是一两个代表着你兴趣点的关键词Keywords。也许如果题目是你自己找来的,你还会有少数paper。你现在的任务还不是决定你自己具体要解决什么问题,而是先了解这个小领域的研究历史,目标是从整个研究小史中看出大家为了理解这一问题都做过什么努力,现在到达了一个什么程度。只有在这个根底上,你所提出的新想法,你所做的奉献,才会“入流,将来才会好发文章。所以,你必须要从几个关键词开始,最后获得大量文献。而且希望所找到的这些文献都是处于或围绕着该领
3、域研究历史的主流的,而不是一些trivial的工作。以下是我的做法。我的课题最初得到的关键词就是“物理凝胶化,再加上从专业上讲,我是搞高分子的,凝胶又必定是高分子网络-小分子溶剂的二元体系,因此我要找的文献应该关于“高分子、“溶液和“物理凝胶化。我一开始是在Google 上搜索这几个关键词的。在此我先要讲讲我对搜索引擎的看法。1.1 一般搜索引擎很多同学用百度搜中文的东西,搜外文的东西也充其量用Google 谷歌。但根据我的使用经验,百度搜索技术十分差劲,或者说它对搜索结果进行了人为的调整,导致你无论搜索什么,所出来的东西离你真正想要的相差很远。Google 的搜索技术虽然基于Google,但
4、由于中国审查和中国的营利模式的原因,其搜索结果也经过了人为的调整。在Google 搜索中文和英文信息都令人满意,绝不会像某些同学所想象的那样,认为用英文的Google 搜中文会有很多该搜到的搜不到反倒百度会如此。在大多数的上,键入 google 后自动会转入 google 谷歌,需要在页面下方点击“Google in English才会进入真正的Google 。使用英文的Google 的另一个好处是,你能使用Google所开发的所有工具和功能,因为Google仅有局部工具进行了汉化并在Google 谷歌上发布。1.2 搜索的技巧关于Google搜索技巧的文章在网上有很多了,但是我看了都等于没看
5、。除了用空格隔开关键词之外大概是and的效果,我只懂用表示or的符号“|,还有用双引号表示精确对应。再就是点开advanced options了,里面可以有更多的搜索选项。就算是这样,我都懒得用这么多技巧。回到我自己的例子,我搜“physical gelation,看看出来点什么结果;然后再搜“polymer physical gelation、“polymer solution physical gelation等等,换变换着关键词的组合,以刺激搜索引擎的智能,让它尽量给你新的东西。在搜索结果中会直接出现一些科研文献,甚至是pdf。但是从Google上搜到的这些文献往往是不太主流,但目前也只
6、能先翻开来看看了。通过看这些文献的Introduction局部,你会: 知道更加相关或准确的关键词。然后回到Google 搜出更加相关的paper 通过Introduction中的讲述和引用,知道一些局部的研究历史,并得到主流的文献 不要急着看文献的Introduction的具体介绍,先尽量得出些关键词,穷尽Google 所能得到的东西。最后其实关键词也无非那几个,在Google上,你已经无法获得什么新的东西了。这时,由于你毕竟浏览了好几篇paper的Intorduction,大概对本领域的以前研究有些模糊的印象。1.3 科学研究工作的类型或地位我又要暂时离开主线,单独讲讲另一个问题。因为和仅
7、仅在Google上瞎搜索不同,接下来你将会找到大量的文献了,这时你需要对这些文献有所取舍。因此,最好脑中要对科学研究工作的类型或地位有清晰的认识。武夷山老师的博客里已经说过:表现于理论,可以是提出新概念可以是小概念、发现新现象可以是小现象、引入新方法、构建新模型、改良旧模型,等等。表现在实证,可以是搜集新数据、从一个新的角度或采用新的方法去分析新数据或老数据、根据分析结果提出理论建议以上引文我把最后四个字“政策建议改为“理论建议,因为我做的是根底研究,无非是就是在理论与实验之间倒腾。1.4 Introduction+参考文献现在回到我的例子,经过不断Google,我已经搜到的一些Paper。现
8、在的任务就是按年代往前搜索文献。现在,通过手头上有的Paper的Introduction局部,会得到一些参考文献,这些参考文献的Introdcution又会提供更多的参考文献。在一开始,这样的搜寻方式会导致你的文献数量以几何方式增加。而且,尽管我清楚要进行取舍,但在我对这一领域还很模糊的情况下,我根本上没有怎么去“舍。但是,还是有几个原那么要记住。 任何一篇文章的Introduction局部,都可以分成两局部,第一局部就是吹大牛,第二局部就是具体到本文的方法、材料和元素的具体介绍。“吹大牛局部所引用文献一般都比拟重要比拟主流的文献,但是第二局部在讲具体方法具体材料时的所引用的文献,就要看情况了
9、。如果这篇文章所用的方法、材料等等是本领域经常用到的主流,那么这部份所引用的文献也是需要看的;如果这篇文章所用的方法、材料等等在本领域来说是很次要的,完全是补充性的,甚至是没事找事的,那你就不用管它引用的参考文献了。不过,也许在一开始你连这个问题都判断不了,那就只能照单全收了。 这一阶段的目标是尽量找到最老、最原始的那些研究。因此如果你想减轻你的负担的话,可以在年份上跳跃一下。比方,如果一下子找到了20年前的一篇paper,那么这十年间的paper的introduction就可以都不看了,直接从20年前的那篇paper的introduction开始,重新向更早扩展。这十年间你所跳过的paper
10、,将来有时机找到的。 1.5 ISI Web of KnowledgeISI Web of Knowledge的用处有两个方面: 在上面按topic搜你的关键词,可以找到更多相关的文献,其意义上面已意讲过了,前面讲过的搜索的技巧此处也适用的 在上面搜某一特定的paper,可以查到这篇文章发表之后的被引用情况 要在ISI上查某特定的文章,可以直接按title搜标题,也可以通过期刊名、发表年份和作者结合起来找。值得注意的是,ISI收录的文章是不全的,例如Macromolecules只从九十年代之后开始收,而且每一期都不是全收。所以就算搜索得当,也不一定就能搜出实际存在的文献,尤其是比拟七十年代以前
11、的。刚刚我说过,通过paper的introduction引用文献,不断在年份上进行回溯,目的是为了找出整个研究历史主线上的研究工作。其根本意图就是搜出少数年代久,但是比拟重要比拟核心的经典paper。然后,就要通过ISI,找到引用这些主流而且经典paper的文献记录,并进一步查找引用这篇老文献的文献列表。根据这些文献的标题,你就可以选出一些比拟主流的文章来,这样就能从老到新地回到研究历史的主线上来。但是由于刚刚说了ISI不收很老的文章,所以你不要等到回溯到五六十年代之后才用ISI,而是到了七八时年代就先用ISI查找一下引用情况,局部回到主线中来,然后再利用从ISI找到的这些比拟接近主线的文章往
12、早期回溯,找到更加主流的经典paper。有一些比拟老的文献如果ISI没有收,那就可以看看该文献的期刊所属的出版商网站上的这篇文章的页面。现有一些大的出版商网站,每一篇文章的页面都会自动显示被引文章。1.6 要屡次反复所谓要屡次反复,就是说你查到一定的文献,就可以先认真阅读了。阅读的时候按年份从早到晚的顺序。在阅读的过程中,你会: 对本领域的根本问题更加清晰 发现本领域内一些奉献比拟大的牛人 发现很多该找到的文献之前没找到 这样,不管是哪个原因,你都会觉得你又必要再花时间去搜集文献,走回刚刚所讲的步骤。一直到最后,你就会发现这个领域从最开始一直到现在的整个脉络的文献你根本上都有了。2. 查找Pa
13、per的资源上一节说的是一般的步骤,在这些步骤中所遇到的一个具体问题是: 根据paper的什么信息,如何搞到该paper的全文 paper多起来了怎么去有序地整理 2.1 大量文献管理几百上千篇的paper,怎么去整理呢?这就一定要使用文献整理器的软件。现在主流的文献管理器软件根本功能都差不多,也足够了。我就以EndNote为例。安装EndNote,事实上就是安装了一个数据库。从数据库的角度上说,所有不同领域不同主题的文献,理论上用一个库就可以搞定。领域上的差异可以利用每条信息项的属性进行区分和检索。但是,有一条原那么是,从大量信息中查找特定的子集,最好能不用Search就不用Search,因
14、为Search的精确查找方式太笨;模糊查找方式又怕还是有些该找到的找不到。所以,比拟满意的方法是够按一定的排序方式排序,然后人工按照顺序往下检。这样的话想找到什么就必能找到什么了。但这种方式不允许总信息量太大。所以不要试图把你有生以来所做过的课题所有文献都用一个数据库来管理,而是应该按照课题所涉集的领域,分开不同的库来管理。不过,分得太细也不好,相关的领域,或者说思维方式一致,在你脑中有某种统一性的领域,不要分开不同的库。不要造成你研究一个问题需要在好几个数据库文件切换的这种状况。用数据库的另一个好处是,当你已经有很多文献了,遇到一个新文献,你怎么知道这篇文章你有了没有呢?通过数据库一查就能查
15、到。我做的课题是高分子凝胶化过程的非线性流变学研究,因此,关于高分子凝胶化的文献要看,非线性流变学的研究要看。此外我具体采用的化学体系是聚丙烯酸,因此关于聚丙烯酸乃至聚电解质的理论和实验方面的文献也要看。我把凝胶化和非线性流变学的文献用一个数据库管理,把聚丙烯酸方面的文献用另一个数据库来管理。在EndNote中,同一个数据库下面还可以建立群组Groups,你可以按需要建一些群组。要在数据库中录入文献,可以通过导入功能。现在各大文献数据库中,查到的paper页面都支持导出成RIS或者EndNote的格式,EndNote、Reference Manager还有Note Express等软件也都兼容
16、导入多种格式。所以,查到的paper点一下导出,在EndNote里点一下导入,文献的标题啊作者啊之类的信息都不用自己输入了,很多时候连Abstract也自动导入。只有少数文献数据库不支持导入功能,那就要自己输入一下。至于文献的PDF文件,存在一个“文件名的问题。很多同学都用文献的一长串标题来作为文件名。如果PDF文件多起来了,就多搞几个目录。总之他们好似要求自己起码要记得自己都有什么文献。我往往一个课题的文献阅读所涉及到的文献数量是上千的,我不可能知道事先我都有什么文献,它是什么文件名,放在哪个目录,所以我是这么做的:刚刚说了,我的数据库是按领域来分的,于是在我上我也建一个相同领域的目录,相应的数据库文件放在该目录下面,所有该领域的PDF