当前位置:首页 > 信息管理学基础-考研笔记
证的。信息递减律表明:任何信息流过程中,信息都要发生衰减。信息流过程越长,信息减少越严重。除了物理空间的信息密度递减外,在精神空间中亦是如此。在知识信息传播时,学科内是最易传播的,其次是相邻学
科,学科的内在联系越少,距离越远,被传播的机会就越少。在时间轴上,知识也存在一种积淀过程,时间越长,那些被认为不重要的知识就越容易被剔除。被积淀下来的就是核心的,最重要的资料。“文献老化现象”和“时间压缩现象”就是信息传递密度递减律的一个极好实例。
十七、信息交流的实现机制
信息交流过程的核心是信息传递,但任何信息的传递都伴随着载体和符号的运动。载体具有变换与位移两种状态,变换是指信息从一种载体传递到另一种载体并引起记忆转换的过程,载体位移是指同一载体的空间运动或沿空间上的展延程度。在载体变换过程中,符号要发生转换,即信息要从一种载体中的符号形式转换成另一载体中的符号形式。在载体位移过程中,符号表现为保持状态。信息交流过程的时间和空间实际上表现为载体变换、载体位移、符号转换和符号保持四个方面。 人类信息系统传递经历了一个漫长的发展和演进过程。口语时期,人们的信息交流是即时的、小空间的;文字时期,人们的信息交流是长时间、大空间的; 到现代,信息技术又实现了超时间、超空间的信息交流,同时也继承了口语与文字时代的特点。如果说,口语促成了人类原始群落的形成,而纸和笔的结合促成了城邦和国家的产生,那么,现代信息技术则促成了全球村的形成,全球性信息资源共享,使人类进入了一个庞大的信息圈
十八、信息变异的障碍
1.信息失真:信息失真的衡量标准是S的表出信息,它是描述信息栈及R在收到S所传递的信息内容时,接
受到的信息与S表出信息的相似性的度量。包括以下三种形式:
A.物理失真:是指信息传递所依赖的物质系统(包括载体及符号)在传递信息时发生失真。
B.语义改变:指信息传递过程中,或多或少地都要经过几次语义转换。即使是面谈,也离不开语义转换。而转换就必定会发生信息的损失。
C.语用衰减:所谓语用是指信息对于接收者R的价值。对于R而言,只有其需求的信息才值得传递。随着R的信息需求实现,其客观价值也没有改变,但对R的语用价值却因为他已接受了其他信息而减低。此外,信息价值受时间的制约,具有时间有效范围。另外,同类信息的重复提供其价值会迅速减低。
2. 信息失真的原因:
A. 技术或通道障碍导致信息失真。
B. 信息栈过多导致失真。 C. 社会因素导致信息失真。信息交流从一产生就是被人类控制的主要领域,其传播的可靠性受社会条件的影响,根据当时统治阶级的需要,信息交流会受到加强或限制。
D. 自然因素导致信息失真:信息交流过程是一种复合过程,是自然、社会性过程的兼容。
3. 信息附加:与信息失真不同,附加信息是以R所接受的信息为标准的。任何信息交流过程都会有附加信息的生成与传递。这些追加信息有时是有用的,有时是无用的,甚至是有害的。
4. 造成信息附加的原因:
A.自然因素:信息交流即依赖于人的参与,也依赖于物质技术和条件。自然因素是指信息交流过程中由于物质间的相互作用而导致附加信息产生的因素。
B.技术因素:技术因素是半社会、半自然的影响因素,在交流中,它也可以造成信息附加。
C.社会因素:这是影响信息交流的最复杂多变的因素。如信息栈的影响,社会支持条件等,都会造成信息附加。 信息失真过程,主要是对S所发出的信息而言的,信息附加过程则是相对于R所应接收的S所发出信息而言的。
十九、信息无序的障碍
由于人类信息生产和利用目的的多样性和综合性,使得人类信息交流系统自产生以来就不断处在熵增过程中,趋向无序状态。其具体表现是:信息数量大,增长快,分散程度越来越大;内容交叉重复,载体及传播渠道多样化;新陈代谢加速,信息质量下降。尽管人类采用的技术越来越先进,能有效克服信息传播的空间障碍和时间障碍,但对于信息无序所导致的障碍,目前还是显得力不从心。
第 9 页 共 47 页
二十、信息传递的保真与冗余
1.信息保真:信息保真是人类信息交流的基本要求。所谓保真也就是守恒。
尽管信息交流受信息失真的影响而无法使S的信息全部准确传递到R,但S与R之间的信息分享应有一个基本标准。信息保真就是力求使信息交流能够达到或超过这一标准。因此,人类发明和采用一系列的技术方法和信息手段,从国家政策、社会条件等方面来改善信息环境,使社会信息交流渠道更畅通,信息传递更准确。 信息保真和信息失真是相对抗的,它既要避免信息失真,也要避免信息附加。信息失真和信息附加是一种自然过程,而信息保真却是人类主观努力的结果,是人类信息交流所追求的目标。
2.信息冗余:信息冗余是指在信息交流过程中,为了使信息准确地自S传递到R而使用的各种冗余方法来加强信息传递的准确性效果。
冗余原理的另一形式是多路传递。为了使信息更有道地传递到收信者R,我们可以采取多条路径。这种多渠道传
递消息的方法,也是冗余原理的一种应用。文献中心或信息系统对每份信息提供多途径检索正是冗余原理的最好应用。
与冗余原理相对抗,还有一种反冗余原理在起作用。这主要是为了控制某些特殊消息或信息的流传造成社会动荡或引起不良后果,从而严密封锁消息,只准少数人了解情况,而尽量避免消息外传。
二十一、信息产生与分布中的马太效应
1.马太效应的表现和作用形式
在社会信息流的产生、传递和利用过程中,我们发现信息及相关因素常常表现出明显的核心趋势和集中取向。这就是信息产生和分布中的马太效应。马太效应在人类社会生活中普遍存在,因而被广泛地引申和应用。它真实的概括了人类社会生活中的惯性,描述了优势和劣势的积累过程:一经存在有优势,这种优势局面就会不断加强,反之若处于劣势,则这种不利条件也会继续加剧。 为什么会出现这种信息分布的“富集”和“贫集”现象呢?这实际上是人类社会特有的选择机制支配的结果。在选择作用下,当一系列同类对象被选择时,有的经常被选择,有的不经常被选择,这种频度不均匀的选择结果,实际上表征着对象之间个体特性方面的差异,其本身又可以反过来作为再次选择的依据。 由马太效应引起的信息富集分布表现为核心趋势和集中取向。核心趋势如高产作者群体的形成等都是信息生产主体(行为者)的主动期望与采取实际步骤的结果。一般都是信息生产者努力造成的核心趋势,行为者的实践是主导因素。而集中取向则是社会选择和影响的结果。虽然与信息生产主体不能说无关,但大多数情况下,都不是信息生产者主动造成的,信息生产者基本上处于被动状态。核心趋势和集中取向的效果是一致的,仅仅是累积的程度不一样。前者可能是相乘的累积,后者是相加的累积;前者是主动的选择,后者是被动的接受;前者为自增生过程,后者倾向大变量分布过程。
2.马太效应的影响 1)马太效应的积极意义:它可以帮助我们突出重点,摒弃平均,为信息源的选择、获取、评价和利用提供依据,为降低信息管理成本,提高信息利用效益提供指导和方法。在理论上,马太效应描述的优劣可以帮助我们认识信息集中和分散的特征、趋势和规律,发现信息管理学的基础性定律。
2)马太效应的负面影响: A.马太效应描述信息对象的优势和劣势过度积累,容易使信息工作者按简单的优劣进行信息的选择、评价、传播和利用,走入极端,使信息工作者因循守旧、不思进取、不求变革创新,按经验和简单的规则从事复杂多变的信息管理工作
B.马太效应所形成的信息分布富集有时仅仅是表面的、外在的。有的优势积累过程带有突发性和受统计学因素的影响,使得信息价值失真。
C.核心信息源是马太效应优势积累的结果,由于其所含相关信息密度大,一直是信息服务机构选择和管理的重点对象。但如果过分注重核心信息源,就会忽略分布在其他信息源中有价值的信息。而且核心信息源如果不加以控制,任其在某一方面的优势过度积累,高度专门化,其所含的信息就会越来越单一,这对部分用户有利,但会失去更多的用户。
D.信息生产者的成长和数量无疑对信息的产生和分布具有较大影响,马太效应青睐名人、拒绝新人的习惯势力第 10 页 共 47 页
不利于新人的成长,限制了新思想、新知识和新信息的产生及传播。 3)因此,马太效应的积累要适度,不能任其发展,为保证信息的产生和分布比较科学合理,适当的干预是必需的。 3.马太效应的数学模拟 马太效应描述的实质上是成功和失败机会的累积过程及效果,这一过程及效果可以用数学语言进行描述和模拟。 1)普利亚分布:亦称单缸模型,在单缸模型中,红球和黑球的每一次出现,都将进一步增加这种出现的频率,成功的结果增大了进一步成功的机会,同样,失败也增加了再次失败的机会。
2)塔格分布:又称多缸模型,是对单缸模型的补充和修正。它能很好地模拟核心信息源的形成过程。 3)威布尔分布
二十二、信息生产者的分布规律
1.洛特卡定律:在论文数X和作者数Yx之间,存在着下列一种关系:XYx = C
此式中,Yx是发表了论文X篇的作者数,n和c是对应于这一典型数据集合而估计出来的两个常数,n的数值在2上下波动。指数n近似为2。则上式可改为:Yx = C / X所有生产一篇论文的著者的比例刚刚超过60%, 生产n篇论文的作者数量大约是生产1篇论文作者数量的1 / n2 。洛特卡定律是对两组数据统计的推广,是对信息生产的一般理论估计,而不是一个精确的统计分布,因而有其局限性。
2.普赖斯定律:即在某一特定领域中,全部论文的半数系由该领域中全部作者的平方根的那些人撰写的。“那些人”无疑是核心或高产作者。 不能将普赖斯定律绝对化,它仅是在洛特卡定律基础上提出的一种假说构思,洛特卡定律n≠2的情形同样影响着普赖斯定律。普赖斯定律对我们的价值在于,它简洁地描述了信息按生产者能力的分布。
2
n
二十三、信息离散分布规律
信息的离散分布是信息的重要属性,它表现为信息的内容单元以不同方式从不同角度分布于各种载体中,信息的离散分布具有复杂的机理,本质上是由信息的生产和利用决定的。信息的离散分布是人类所有信息活动的基础,也是对信息进行有效管理的基础。
1. 布拉德福定律:
某一学科领域中的相关论文在期刊中的分布是不均匀的,而且具有明显的集中与分散规律。
“如果将科学期刊按其刊载某个学科主题的论文数量,以递减顺序排列起来,就可以在所有这些期刊中区分出载文率最高的‘核心’部分和包含着与核心部分同等数量论文的随后几区,这时核心区和后继各区中所含的期刊数成1:a:a2的关系”这就是布拉德福定律的区域表述形式。
布拉德福定律有两个基本要点:一是频次等级排序,形成主体来源(期刊)的有序目录;二是确定相关论文在主体来源中的分布规律。
文献分散的原因是,在某一新的学科中,写第一批论文时,人们首先把它寄给最合适的杂志发表。这些杂志伴随着该学科的发展,刊载越来越多的这类文章。于是许多著者都希望把他们的文章发表在本专业的,以前发表了大量高质量论文的这类杂志上。投稿数量大大增加,使杂志选择性增大,因而对文章的质量要求提高,杂志的威信也日益提高,这就产生了一些带核心性质的杂志,这种现象就是文献分布中的“堆加”效应。同时,有关这一学科的文章也在其他杂志上发表,这就产生了集中与分散的现象。
布拉德福定律也存在一些问题,如公式繁多、立论各异、至今尚无统一的结论,理论与实际脱节等。这都说明该定律还不够成熟,经验色彩较浓。另外,布拉德福定律主要揭示的是宏观层次的信息(文献)离散分布,而对于微观层次的信息(内容单元)分布的研究则基本上是空白。
2. 齐夫定律:
如果将一篇较长文章(约5000字以上)中每个词按其出现频次递减排列起来(高频词在前,低频词在后),并用自然数给这些词编上等级序号,出现频次最高的为1级,其次为2级??这样一直到D级,如果用f表示词在文章中出现的频次,用r表示词的等级序号,则有:fr = c (齐夫定律) 式中c为常数。
齐夫定律的其他形式:因为齐夫定律是一个纯粹的经验定律,仅仅使用了一般的统计方法,其过于简单的形式
第 11 页 共 47 页
和结论对于出现频次特别高的词和特别低的词都不能完全满足。于是美国学者朱斯提出了双参数等级分布定律;曼德尔布罗则运用信息论原理和概率论方法来研究词频分布,用三参数修正了齐夫定律,使其更具有一般性和普遍意义。
齐夫定律是对自然语言词汇统计所得到的规律。但对于人工语言及人工语言语词构成的集合同样满足。也完全符合汉语语言词汇的分布。
齐夫定律具有广泛的应用,在信息系统建设、词表管理和控制、自动标引、信息存贮与检索方面都取得了许多应用成果。通过词频分布来提示信息的分布规律是齐夫定律在理论上的重要开拓。
二十四、信息对时间的分布规律
研究信息在时间轴上的动态分布规律可以提示信息的增长与老化,用科学高效的理论模型来刻画信息随时间的推移所表现出来的趋势,把握信息量的变化,对信息实施动态管理。
1. 指数增长率:
1)普赖斯曲线:如果用F(t) 表示时刻t的文献量,则指数定律可表示为:F(t) = ae 其中a是统计的初始时刻(t=0)的文献量;e = 2.718;b表示持续增长率
文献信息的指数增长规律在一定程度上正确反映了文献的实际增长情况。 文献信息(或者信息)指数增长的内在原因是由于社会信息流的传播和影响的结果。在一个健全的社会信息交流系统中,那些业已掌握新思想、新信息的成员,必然主动或被动地影响其他社会成员。人们接受新思想、新信息的概率会随着时间的推移而增大。因为这与掌握新思想的累积人数有关。这些掌握新思想和新信息的人数本身就是按指数增加的,他们必然要从事知识信息的生产和传播,这就必然引致信息量指数增长。
bt
文献信息的指数增长规律是对每一年的文献累积数而言的,并不是相对于每一年新发表的文献数量。每年文献信息的累积数,即该年可以利用的文献总量。
文献信息的增长律仅仅是一个理想模式,它没有考虑到许多复杂的因素对文献增长的限制。实际的统计发现,不同时期、不同级别、不同质量、不同学科领域的文献信息增长趋势是不一样的。
2)生长曲线:F(t) = k / 1 + ae-kbt 式中F(t) 表示时刻t的文献量,k为文献增长的最大值。
普赖斯指出,考虑物质的、经济的、智力的及时间的影响和限制,文献信息的增长更趋近于生物的生长曲线,即最初生长或繁殖很快,随着时间推移,其生长速度越来越慢,以致几乎不增加了。
生长曲线表明,在文献增长的初始阶段,它是符合指数增长规律的,但它不能始终保持指数增长的势头,当文献增至最大值的一半时,增长率开始变小,最后缓慢增长,最后到达极限。如果单独就某一具体学科领域内文献的增长而言,生长曲线极好地描述了它们的增长规律。
在不同的阶段科学文献增长的态势是不同的。学科处于诞生和发展阶段,文献量指数增长,文献的寿命较短。随着研究深入,学科进入相对成熟阶段,文献增长率变小,但文献寿命相对变长。同时,也意味着该知识领域正面临新的突破,将产出更新的分支领域,而内容上更新的文献又将进入一个新的急剧增长时期,然后又进入一个稳定时期。文献的增长往往会出现几个急剧增长时期和几个相对稳定时期,呈现出错综复杂的格局。 对不同的领域,描述其文献增长的生长曲线中各个常数是不相同的。如果能分别对各门具体学科文献增长状况作历史的、全面的统计分析,绘制出相应的生长曲线,则对评价该门学科所处的阶段,预测其未来的发展,估计该学科不同时期的文献寿命,以指导信息搜集和提供,是很有意义的。
生长曲线的局限性:生长曲线意味着某个年代之后,再也没有新的文献产生,这显然是不符合实际的。 3)利用指数曲线和生长曲线来研究文献增长、预测未来文献总量必然会有局限,这是因为:
A. 指数增长定律的产生,首先是普赖斯分析研究物理学文献数量的增长时提出的。把对文献某一方面、某一历史阶段的研究成果,推广到文献的全部领域,根据是不充分的。
B. 利用上述二曲线对文献增长所作的预测,依据的是预测学中的趋势外推法。文献作为传播信息这一复杂系统中的子系统,其增长规律受到许多因素的影响和制约,只有利用系统论的观点对其作系统分析,才能得到比较符合实际的结果。
2. 逐渐过时律
1)文献信息的老化一般指这样四种情形:文献中所含信息仍然有用,但现在已被包含在更新的其他论著中;文献中信息仍旧有用,但现在正处于一个人们对其兴趣下降的学科;文献中的信息仍旧有用,但为后来的著作
第 12 页 共 47 页
共分享92篇相关文档