当前位置:首页 > 第10章 分布式数据库系统习题解答
第10章 分布式数据库系统
习题解答
一. 简答题
1.叙述分布式数据库系统的定义、特点和优缺点。
分布式数据库定义:分布在计算机网络上的多个逻辑相关的数据集合。 特点:
网络透明性;数据冗余和冗余透明性;局部自治性;数据库的安全性和一致性 优点:
分布式控制;增强数据共享;系统可靠性;提高系统性能;可扩充性好。 缺点:
系统实现复杂;开销增大;
2.叙述分布式数据库系统的模式结构。
分布式数据库系统的模式结构从整体上可以分为两个部分:下部是集中式数据库系统的模式结构,上部是分布式数据库系统增加的模式级别。其中包括:
(1)全局外模式:它们是全局应用的用户视图,是全局概念模式的子集;
(2)全局概念模式:定义分布式数据库中数据的整体逻辑结构,使数据库没有分布一样; (3)分片模式:定义片断及全局关系到片断的映像; (4)分布模式:定义片断的存放结点。
3.试述分布透明性的内容。
分布透明性是指用户不必关心数据的逻辑分片,不必关心数据物理位置分配的细节,也不必关心各个场地上数据的数据模型。分布透明性可以归入物理独立性的范围,应包括三个层次:
分片透明性:分片透明性是分不透明性的最高层次,所谓分片透明性是指用户或应用程度完全只对全局关系进行操作而不必考虑关系的分片。
位置透明性:所谓位置透明性是指用户或应用程度不必了解片段的存储场地。
局部数据模型透明性:局部数据模性透明性是指用户或用户程序不必了解局部场地上使用的是哪种数据模型。
二. 问答题
1.根据下面给出条件,计算以下四种情况的通信时间T[i]。 ?
数据库,简化了的供应商和零件数据库:
45
S(Sno,City) 10个元组,存放在场地A; P(Pno,Color) 10个元组,存放在场地B;
251
SP(Sno,Pno) 10个元组,存放在场地A; 设每个关系的元组均为100字节长。 ?
查询:求供应红色零件的、北京的供应商号: SELECT S.Sno FROM S,P,SP
WHERE S.City=’北京’AND S.SNO=SP.SNO
AND SP.Pno=P.Pno AND P.Color=’红色’
?
估算值(某些中间结果的元组数):
5
6
红色零件数=10
北京供应商的装运单数=10 ?
对通信系统的假定:
4
数据传输速度=10字节/秒 传输延迟=1秒
(1) 把关系S,SP传到场地B,在B地执行查询处理。
总共需要传输的数据量为:(10+10)*100=1.01*10 总的传输时间为:1.01*10 /10+1=10101秒
(2) 在场地A站连接关系S和SP,选出城市为北京的元组(10个),然后对这些元组中每个元组
的Pno,询问场地B看此零件是否为红色。每做这样一次检查包括2次消息,共问和答2*10次。
每次询问场地B看此零件是否为红色的传输时间为:
4
5
5
8
44
6
8
(100/10+1)*2=2.02 那么全局传输时间为: 10*2.02=2.02*10秒
(3) 在B站选出红色零件的元组(10个),然后对每一个元组逐一检查A站,看北京供应商的装运
单中是否有这个零件的装运单(若有则选出S#),每做这样一次检查包括2次消息,共问和答2*10次。
对每个红色零件元组的传输时间为: (100/10+1)*2=2.02 那么全局传输时间为: 10*2.02=20.2秒
(4) 在A站选出北京供应商的装运单,把结果送到B站,在B站完成最终处理。
将北京供应商的装运单送到B站的传输时间为
5
44
5
5
10*100/10+1=1001秒
252
2. 查询处理和优化要解决的主要问题是什么? 径。
3. 查询优化的目标是什么?
分布查询可以分为两部分:存取策略的分布优化和局部优化。在分布式数据库中查询优化的首要目
标是:使该查询执行时其通信代价最省。
查询分解:将全局查询分解为若干子查询,目标是选择查询开销最省的那些物理片段 选择操作执行的次序:主要是确定连接和并操作的次序
选择执行操作的方法:包括将若干操作组合砸在数据库的一次存取中执行完毕;选择可用的存取路
253
共分享92篇相关文档