1、书书书第 1 章绪论网络信息检索,顾名思义,就是在网络上检索信息资源。为方便检索,信息资源一般是以数据库的形式组织和存储的。所以,网络信息检索不仅涉及信息资源及检索,还涉及数据库技术及网络技术。本章主要介绍信息资源的相关概念,数据库的概念、类型、结构,以及网络的起源与发展、互联网提供的基本服务以及接入方式等。1.1信息资源和信息素养1.1.1信息、知识和文献1.1.1.1信息信息泛指人类社会传播的一切内容。信息普遍存在于自然界、人类社会和思维方式中。人们通过获得、识别自然界和社会的不同信息来区别不同事物,得以认识和改造世界。信息、物质和能量是构成世界的三大要素,缺一不可。但是,信息与物质、能量
2、不同,其价值主要体现在以下两方面:(1)可以满足人们对精神领域的需求,如学习材料、娱乐信息等。(2)可以促进物质能量的生产和使用,如通过获取有效的供销信息提高产品流通效率等。人类认识世界的过程,就是不断地从外界获取信息和加工信息的过程。而人类改造世界的过程,就是把加工外部信息所取得的“主观”信息(生产计划、公司决策等)反作用于外部世界的过程。1.1.1.2知识知识是指人们对某个事物的熟悉程度,是人们在改造客观世界实践中所取得的认识和经验的总和,它可能包括事实、信息、描述或在教育和实践中获得的技能。它可能是关于理论的,也可能是关于实践的。知识是构成人类智慧的最根本的因素。1.1.1.3文献情报与
3、文献工作词汇基本术语(GB/T48941985)将文献定义为“记录知识的一切载体,即用文字、图形、图像、视频、音频等技术手段记录知识的物质载体”。“知识”是文献的核心内容,“载体”是知识赖以保存的物质外壳,即可供记录知识的固态物质。1.1.1.4信息、知识与文献之间的关系信息与知识密不可分,信息是构成知识的原料,知识的产生离不开信息。信息是物质的属性,是广泛存在于自然界和人类社会中的一切事物的存在方式和运动状态的客观反映,是人类认识世界的依据。知识是人类创造的精神财富,是人类接受了来自自然界和人类的大量信息后,将反映自然现象和社会现象的信息经过加工而成的,用于指导人类社会实践。文献是记录知识和
4、信息的一切载体,是知识或信息的重要存储和传播工具。文献经过传递、应用于理论与实践又产生新的信息。信息、知识、文献之间的关系如图 1 1 所示,通过循环往复,推动人类社会不断前进。图 1 1信息、知识、文献之间的关系1.1.2信息资源1.1.2.1信息资源的定义信息作为一种资源,即称信息资源,可以从广义和狭义两个层次来理解其含义。广义的信息资源是指信息活动中各种要素的总称,既包含信息本身,也包含与信息相关的人员、设备、技术、资金等因素。狭义的信息资源只限于信息本身。本书主要讨论狭义的信息资源及其检索技术。1.1.2.2信息资源的分类按信息资源的存在状态可将其分为潜在的信息资源和现实的信息资源两大
5、类。其中潜在的信息资源是指个人在认知和创造过程中储存在大脑中的信息资源,其特点是能为个人所理解和利用,无法为他人直接理解和利用;易于随忘却过程而消失,因此是一种没有表达出来的,有限再生的信息资源。潜在信息资源在此不作重点讨论。而现实的信息资源依据其载体不同可分为体载信息资源、文献信息资源、实物信息资源和网络信息资源。2网络信息检索(1)体载信息资源体载信息资源指以人体为载体并能为他人识别的信息资源,按其表达方式又可分为口语信息资源和体语信息资源。口语信息资源是人类以口头语言表达出来但未被记录下来的信息资源,如谈话、授课、讲演、讨论等;体语信息资源是以人的体态表达出来的信息资源,如表情、手势、姿
6、态、舞蹈等。(2)文献信息资源文献信息资源是用一定的记录手段将系统化的信息内容存储在各类载体上而形成的一类信息资源,即以文献为载体的信息资源。文献信息资源涉及范围广,很难用统一的标准进行分类,一般可以按其出版类型、信息的加工程度划分。按信息资源出版类型划分。信息资源出版类型一般指记录有知识的文献的出版类型。文献的种类很多,一般将文献的出版形态划分为十大类,即图书、期刊/报纸、科技报告、会议文献、专利文献、学位论文、标准文献、政府出版物、产品样本和产品目录、档案文献。其中图书、期刊/报纸被称为普通文献(白色文献),其余 8 种被称为特种文献(灰色文献)。不同的文献类型具有不同的特性。对文献类型及
7、其特点的基本了解,将有助于人们根据课题或目的的不同,有针对性地检索和利用文献。下面对十大文献的特点分别介绍。图书。图书是一种按章成册的出版物,是对已有研究成果、生产技术知识、实践经验的概括和论述。图书按其内容性质和作用可分为普及读物、教科书、丛书、专著、论文集、参考工具书等。图书内容比较成熟、系统,有目次表和索引,查阅方便,可以帮助人们较全面、系统地了解某一学科或专业领域的基本知识、基本理论,是传播知识的重要工具。但是由于出版周期较长,知识的新颖性不够。期刊/报纸。期刊,又称为杂志,是指一种有固定名称,定期或不定期出版的连续出版物,具有出版周期短、报道文献速度快、内容新颖的特点,能及时反映当代
8、社会发展趋势和科技发展动向,是交流学术思想和进行科学研究的最基本的文献形式,是利用率最高的文献类型。期刊按出版的周期可分为周刊、旬刊、半月刊、月刊、双月刊、季刊和年刊等;按内容可分为学术性期刊、报道性期刊、检索性期刊及大众性期刊等。报纸是期刊的一种特殊类型,是以刊载新闻和事实评论为主,定期向公众发行的一种连续出版物。其基本特点是内容新、涉及面广,是读者最多、影响最广的文献信息资源。及时性是报纸区别于其他文献的最主要特征。科技报告。科技报告是指科研过程进展情况的阶段性记录或科研成果的报告。其特点是内容新颖而详尽,常附有大量的数据、图表、原始实验记录。科技3第 1 章绪论报告的类型有技术报告、札记
9、、论文、备忘录、通报等。科技报告一般单独成册,有具体的篇名、机构名称和统一的连续编号(报告号)。科技报告的发表一般快于科技期刊和其他文献类型,大部分属于保密和控制发行,少部分以公开或半公开形式发表。科技报告在一定程度上反映了一个国家或某一个学科的科研水平,是不可多得的信息资源。会议文献。会议文献是指在国内外各种学术会议和非学术会议上发表的论文和报告。由于会议都有特定的议题,因而会议文献论题集中,内容新颖,代表某学术领域的最新成就,反映该学术领域的最新水平和发展趋势。因此,会议文献是了解国际和国内的科研水平、动态和发展趋势的重要文献资源。专利文献。专利文献是实行专利制度的国家和地区及国际性专利组
10、织在审批专利过程中产生的官方文件及其出版物的总称。它通常包括专利说明书、专利公告、专利检索工具以及其他与专利有关的法律文件等,其中主体是专利说明书。根据专利的技术水平和应用情况,专利分为发明专利、实用新型专利和外观设计专利。与一般文献相比,专利文献具有及时性、新颖性、详尽性、系统性、实用性、可靠性等特征,它既是技术文件又是法律文件,是重要的技术经济信息来源。学位论文。学位论文是高等学校或科研机构的毕业生为获得各级学位在导师指导下撰写和提交的科学研究、科学试验的书面报告。根据学位的不同,学位论文分为学士论文、硕士论文和博士论文三种。学位论文所探讨的问题比较专门和系统,具有一定的独创性、新颖性、科
11、学性和较强的专业性,其质量要经过该领域的专家审查和学术委员会的考核。除少数经删节后在期刊上发表的学位论文外,大多数学位论文不单独出版,需要通过专门的渠道才能获取。标准文献。标准文献是有关产品和工程的质量、规格、生产过程及其检测方法等具有规范性的技术文件的总称,是生产或科研活动中对产品、工程或其他技术项目的质量品种、检验方法及技术要求所作的统一规定,也是人们从事产品或零部件设计、检验所必须遵守的具有法律约束的技术文件。标准可分为国际标准、区域性标准、国家标准、行业标准和企业标准等。通过标准文献可以了解和研究世界各国产品和工程建设的特点和水平,也可以为研制新产品、升级老产品、改进技术水平等方面提供
12、参考依据,对产品和工程设计人员来说是不可缺少的参考资料。标准文献是一种经权威机构批准的规章性文献,具有一定的有效时间,需要随着技术发展而不断地修订、补充或废除,更新比较频繁。政府出版物。政府出版物是由政府部门及其所设立的专门机构发布出版的文献信息资料,包括政府报告、政策法令、规章制度、会议纪要、调查统计资料4网络信息检索等。政府出版物大致可分为行政性文献和科学技术文献两大类。政府出版物的主要特点是正式、权威,材料充实,数据可靠,是了解各国政治、经济、科学技术的方针政策及其发展状况的权威性信息来源。产品样本和产品目录。产品样本和产品目录是对定型产品的性能、构造和原理、用途、实用方法和操作规程、产
13、品规格等所作的具体说明,是进行技术革新、设备改造、试制新产品的重要技术参考资料。产品样本一般图文并茂、形象直观、可靠性强,产品和技术信息比较完整,同时,出版发行迅速,更新及时。档案文献。档案文献是指中央和地方各级机关、企事业单位、社会团体等,在从事各项活动时直接形成的具有保存价值的并经立卷归档的各种资料。档案包括技术档案、人事档案、文件档案及其他档案。档案资料是研究历史、了解现状的可靠资料,具有无可争辩的客观性和可靠性,同时,也具有一定的保密性,内部控制使用。按信息的加工程度划分:一次信息资源。一次信息资源,也称原始文献,是人们研究或创造性活动成果的直接记录,一般指公开出版的图书、期刊论文、科
14、技报告、会议论文、专利文献、学位论文等。不管其信息存储于何种物质载体及出版的版次,只要是原始资料就是一次信息资源。它具有新颖性、创造性和系统性等特征,参考和使用的价值较高。一次信息资源具有零碎、分散、无序的特征,有的很难获取。二次信息资源。二次信息资源是对一次信息资源加工、整理而成的。它将分散的、无序的一次信息资源进行加工整理,使之成为系统有序的信息资源。二次信息资源具有浓缩性、汇集性、有序性等特点,它的作用不仅在于报道信息的内容,更重要的是可以提供一次信息资源的线索,例如书目、题录、文摘、索引等。三次信息资源。三次信息资源是系统地组织、综合研究和分析一次和二次信息资源的结果,是通过二次文献提
15、供的线索,对某一范围的一次文献进行分析、综合研究、归纳、整理等深加工所生成的文献。三次信息资源具有资料性和实用性,是对一次文献信息资源进行的浓缩、提炼、重新组织,内容有较大的变化。它可分为两大类:一类是综述、述评等,如各种综述、动态、进展报告;另一类是参考性工具书,如百科全书、年鉴、手册、词典、文献指南等。零次信息资源。零次信息资源是指未经正式出版发行的最原始的记录,如书信、手稿、笔记、实验记录等。其主要特点是内容新颖,具有原始性,但不成熟,分散,难于检索。零次信息资源与一次信息资源的重大区别是前者没有形成正式文献,没有正式发表。5第 1 章绪论零次信息资源是最原始的信息资源,虽没公开交流,但
16、是它是生成一次信息资源的主要素材。一次信息资源是最主要的信息资源,是人们检索和利用的主要对象。二次信息资源是对一次信息资源的集中提炼和有序化,是检索一次信息资源的工具,故又称为检索工具。三次信息资源是按知识门类或专题将一次信息资源重新组织、高度浓缩而成的。(3)实物信息资源实物信息资源是指以实物为载体的信息资源。一切物质实体蕴含着的丰富信息均可视为实物信息,它给人们提供了充分认识事物的物质条件。其特点是直观、真实和零散。依据实物的人工与天然特性又可将实物信息资源分为以自然物质为载体的天然实物信息资源和以人工实物为载体的人工实物信息资源。(4)网络信息资源网络信息资源是以网络为纽带连接起来的以网络为主要交流、传递、存储手段的信息资源。网络信息资源通过网络将原本相互独立、分布于世界各地的数据库、信息中心、文献中心等连接在一起,形成一个内容与结构全新的信息载体。1.1.3电子信息资源1.1.3.1电子信息资源的概念电子信息资源是以数字化的形式,把文字、图形、图像、声音、动画等多种形式的信息存放在光、电、磁等非印刷型介质上,以电信号、光信号的形式传输,并通过网络通信、计算机或终端等方式再现出来