当前位置:首页 > 信息检索复习纲要(精)
第一章 信息检索基础知识
1. 信息、文献、资料的概念及其包含关系
1) 信息:物质存在方式和运动状态的反应,在发生源和吸收源之间,当发生源发出的信号被吸收源所理解,
信号就成为信息 。(信号被理解吸收即为信息) 2) 文献:
a) 定义:记录下来的知识,必须有知识和载体两部分。
b) 载体:文献的形态,如甲骨、纸介型 、胶片,磁带,磁盘,光盘等 c) 记录手段:文字、图像、公式、声频、视频和代码等
d) 物质形态:图书、期刊、专利说明书、录音带、缩微品、光盘等 3) 资料:
a) 定义:大凡人类的知识用文字、图形、符号、声频、视频的手段记录下来的东西,统统可称为文献。
也可以称为固化在一定载体上的知识。 b) 灵魂:知识 文献的内容
c) 载体:文献的形态,如甲骨、青铜器、纸介型 、胶片,磁带,磁盘,光盘等 d) 记录手段:文字、图像、公式、声频、视频和代码等
e) 物质形态:图书、期刊、专利说明书、录音带、缩微品、光盘等 4) 包含关系:文献〈资料〈信息
2. 信息的分类及特点
1) 按载体的出版编辑特点:分有十二大文献类型(及各自
特点)
? 图书:是对科研成果、生产技术和经验的总结性的概况
论述
A) 内容特点:系统性好、完整性好 B) 出版周期较长,报道速度相对较慢
C) 著录特征:著者、出版项(出版地、出版社名和出版年
份)、国际标准图书号(ISBN) ? 期刊 A) 期刊一般是指名称固定、定期或不定期连续出版物。 B) 特点:内容新颖 报道速度快 系统性差
C) 著录特征:ISSN、 CN、 年、卷、期(邮发代号内部准印证)
? 会议文献 :研究人员在各种学术会议上交流科研新成果、新进展、及发展趋势的讨论记录或论文(通
称会议论文)
A) 特点:传递信息及时、针对性强、内容新颖 B) 一部分科研成果就是通过学术会议首次发表的
C) 会议文献特征:有会议召开的地点、届次、时间,以及会议录的出版社、出版地、出版时间等。 ? 专利文献:是一种用法律形式来保护的文献,专利文献主要由专利说明书构成。它反映了当前最新的技术成果。专利说明书对于工程技术人员,特别是产品工艺设计人员来说,是一种重要情报源。 ? 发明专利:具有较高水平的发明,是在某个领域内具有独创性的发明
? 科技报告:是指国家政府部门或科研生产单位关于某项研究成果的总结报告,或是研究过程中的阶段进展报告。
A) 与期刊相比:在内容方面,报告比期刊论文专深、详尽、可靠。是一种不可多得的情报源。科技报告能
代表一个国家和专业的发展水平及动向。
B) 目前国际上较著名的科技报告是美国政府的四大报告,即
? 民用工程报告 ? 军用工程报告 ? 航空航天报告
能源报告。
? 学位论文:是著者为获得某种学位而撰写的科学论文。 A) 一般偏重于理论 B) 附有大量的参考文献
C) 借此可以看出有关专题的发展过程和方向
? 政府出版物:是各国政府部门及其所属机构颁布和出版的文件资料。 A) 内容主要分为
? 行政性文件(如政府法令、方针政策等) ? 科技文件(如科学技术白皮书 )。
B) 对了解一个国家的科技和经济政策及其演变情况有一定的参考价值。
? 标准文献:是对工农业产品和工程建设的质量、规格及其检验方法所做的技术规定。标准文献具有一定
的法律约束力。
A) 反映当时的技术工艺水平及技术政策
B) 国际标准化组织(ISO)和国际电工委员会(IEC)。 C) 标准文献的特点是:有标准号。
D) 标准号由三部分组成:标准颁布机构代码+顺序号+颁布年份
例如: GB 2683---98
? 产品资料:指产品目录、产品样本和产品说明书一类的厂商产品宣传和使用资料。产品技术资料一般向厂商直接索取。
? 技术档案:是指生产建设和科学技术部门在技术活动中形成的。
? 报纸、新闻稿:是指那些阐述问题面广,具有群众性与通俗性,对科技成果报道的不系统,可获得一些
重要消息的资料。
? 工作文稿:准备在期刊上发表或向学术会议提出的论文或研究报告的初稿,是一种短时效的文献,是一种很难全面收集的文献。 总结1:
A. 理论探讨性质——期刊、会议文献、学位论文 B. 了解某一个课题的历史现状及末来——图书 C. 工艺革新、发明创造——专利文献 D. 了解尖端技术——科技报告
E. 毕业设计、撰写毕业论文——学位论文 F. 国家政策——政府出版物
G. 产品设计、生产造型——标准文献、产品资料 总结2:
A. 国际标准图书号(ISBN)
a) 由10位数组成 7-5335-1519-6/TP64 b) 第一段:组号代表国家、地区、语种
c) 第二段:出版者号,由国家或地区ISBN中心分配; d) 第三段:书名号,由出版者按出版顺序所给 e) 第四段:校验位 B. 国际标准期刊号ISSN
a) 由8位数组成
b) 例如 <<电脑爱好者>> 的国际标准期刊号为:ISSN1005—0043,最后一位为检验码。 C. 国内统一刊号CN
CN 11 ― 3248 / TP 地区号 顺序号 分类号
D. 标准文献的特点是:有标准号(标准颁布机构代码+顺序号+颁布年份)
GB 2683 --- 98
?
标准颁布机构代码 顺序号 颁布年份 E. 专利号(见本资料第五章)
2) 信息按照信息载体的编辑特点分类——图书、期刊、特种文献 3) 按信息的加工层次分类:
a) 一次信息:原始文献
b) 二次信息:将分散的、无组织的一次信
息,按一定的原则加工、整理、简化、组织成为系统的、便于查找利用的信息。即(检索工具)——目录、题录、索引、文摘
c) 三次信息:在合理利用二次信息的基础
上,选用一次信息的内容,根据一定的需要、目的进行分析、综合或浓缩重组而得到的信息。即(参考性文献)——论文丛集、综述、年鉴
3) 信息与三次信息的区别:
A. 对象不同
a) 二次信息以“ 篇” 或“ 本” 为
单位进行加工
b) 三次信息则归纳了较多的一次信息内容 B. 用途不同
a) 二次信息为检索一次信息的工具 b) 三次信息能直接提供检索答案.
3. 信息检索包括三个方面: 数据检索 、事实检索 、文献检索 (三者中以文献检索为主) 4. 文献检索
1) 定义:
a) 检索系统的建立及检索工具的组织和积累 b) 文献查询 2) 类型:
a) 直接检索——是从通过阅读原始文献直接获取所需信息,快捷、方便、漏查率高
b) 间接检索——是通过二次文献(检索工具)的指导再查找原始文献而获取所需信息,系统、全面滞
后
5. 文献检索工具
1) 定义:检索工具是按一定的学科、主题等进行搜集整理并给予文献的标志,是及时报道的二次文献,具
有报道、存贮、检索的功能。
2) 类型:目录型检索工具、题录型检索工具、文摘型检索工具、索引型检索工具
a. 目录型检索工具
目录型检索工具是记录具体出版单位、收藏单位及其他外表特征的工具。目录著录的对象是单位出版物,一般著录文献的名称、著者、文献出处等。目录的种类很多,对于文献检索来说,国家书目、联合目录、馆藏目录等尤为重要。 b. 题录型检索工具
题录型检索工具是以单篇文献为基本著录单位来描述文献外表特征(如文献题名、著者姓名、文献出处等),题录的著录对象是单篇文献,是快速报道文献信息的一类检索工具。它与目录的主要区别是著录的对象不同。目录著录的对象是单位出版物,题录的著录对象是单篇文献。 c. 文摘型检索工具
文摘型检索工具是将大量分散的文献,选择重要的部分,以简炼的形式做成摘要,并按一定的方法组织
排列起来的检索工具。 d. 索引型检索工具
索引型检索工具是根据一定的需要,把特定范围内的某些重要文献中的有关款目或知识单元,如书名、刊名、人名、地名、语词等,按照一定的方法编排,并指明出处,为用户提供文献线索的一种检索工具。
第二章 网络资源
1. www资源的基本知识
1) TCP\\IP协议:TCP/IP是一个网络协议族,其中TCP协议、IP协议是最基本的协议,简称TCP/IP协议。
INTERNET是基于TCP\\IP协议协议进行数据传输的。
2) IP地址:Internet上的每一台计算机主机都必须有唯一的“地址”,以保证Internet上所有的计算
机和网络能够被互相传送信息而不被混淆,以数字表示,称为IP地址。IP地址由32位二进制数组成, 分四组(每组8位),用十进制表示,每位IP的范围从0到255。
3) 域名:具有实际含义的网址,比IP地址好记。域名的层次结构从右到左,子域名分别表示:国家或地区的名称、组织类型、组织名称、分组织名称、计算机名称等,如:http://www.lib.fzu.edu.cn/ ? www.sina.com.cn——国内域名 ? www.whitehouse.gov——国际域名 ? www.263.net——国际域名 ? www.fz.fj.cn——国内域名
? www.第一财经.com——中文域名,国际域名 ? http://清华大学.cn ——中文域名,国内域名
4) DNS:从事域名和IP地址之间的翻译工作
5) HTML:超文本标记语言,所有WWW的页面都是用HTML编写的超文本文件。
6) HTTP协议:超文本传输协议,HTTP是Web服务器和Web客户机进行通讯的语言。所有的Web服务器
及浏览器必须遵循这一协议,才能发送或接收超文本(超媒体)文件。Web服务器又称HTTP服务器。
2. 搜索引擎:
1) 搜索引擎是Internet网络上查找信息最常用的方法。 2) 工作原理:
a) 派出“ 网页搜索程序” 在网上搜寻所有信息,并将它们带回搜索引擎 ; b) 将信息进行分类整理,建立搜索引擎数据库 ;
c) 通过Web 服务器端软件,为用户提供浏览器 界面下的信息查询 3) 类型:分类目录式搜索引擎、全文搜索引擎、元搜索搜索引擎
a) 分类目录式搜索引擎——按目录分类的网站链接列表,提供相关类目的网站信息。如网址大全。
共分享92篇相关文档