当前位置:首页 > 7563《数据挖掘与客户管理》期末考试卷A卷
试卷代号:7563 A卷
浙江广播电视大学2006年1月期末考试试题 《数据挖掘与客户管理》期末考试试卷
(试卷总分:100分,考试时间:120分钟) 题号 分数 一 二 三 四 总分 一、名词解释(每题4分,共20分)
1.数据挖掘:
2. 过度拟合:
3. 过抽样:
4.辛普森差异系数(基尼系数):
5.数据仓库:
共 4 页,第 1 页
二、填空题(每空2分,共30分)
1. 数据挖掘的三大支柱分别是 、 和 。
2. 互动循环过程有四个业务过程,这四个过程循环往复,分别是理解业务问题、将数据转换成可执行的决策、 和 。 3. 预测模型成功应用的三个假定分别是 、 和 。
4. 数据仓库的优点是 和 。
5. 数据仓库可由多个数据中心构成,数据仓库设计者们安排好这些数据中心的最主要挑战是要建立合适的 。
6. 使用无监督的数据挖掘方法必须 。
7. 为了确保输入数据早于输出结果,可以用 方法对数据时间元素进行处理。
8. 分段输入组合模型和模型分段组合模型的最大区别在于 。 9. 客户流失的原因,大致可以分为两类:自愿流失和 。
三、单项选择题(每题2分,共20分)
1. 企业所建立的预测模型的好坏取决于模型在( )上的表现效果。
A 得分集 B训练集 C测试集 D评价集
2. 客户在经济活动中具有多重身份,下面哪一种不是其身份之一( )。
A行为身份 B所有权身份 C学习身份 D决策身份 3. 下列四条描述中,正确的一条是( )。
A 企业实施数据挖掘,必须要有数据仓库。 B企业要实施数据挖掘最好的方式是请编外专家。
C企业购买现成数据挖掘模型的一个先决条件是:该企业的产品、客户、市场定位和所买来的现成模型设计之初的假设相吻合。 D 在建模的时侯,增益最高的模型就是最好的模型。
共 4 页,第 2 页
4. 数据挖掘算法以( )形式来组织数据。
A 行 B列 C 记录 D 表格
5. 企业要建立预测模型,需准备建模数据集,以下四条描述建模数据集正确的是( )。
A 数据越多越好。 B 尽可能多的适合的数据。 C得分集数据是建模集数据的一部分。 D 以上三条都正确。
6. K—均值类别侦测要求输入的数据类型必须是( )。
A整型 B数值型 C字符型 D逻辑型
7. 在决策树和累计增益图的关系转化过程图中,决策树上某一页节点的增益与累计增益图上的( )相对应。 A线段长度
B线段斜率 C 相对应的线段长度 D相对应的线段斜率
8. 企业为提升每个客户的价值,应实现( )最优化。
A 促销活动 B 预算最优化 C客户最优化 D三者都不是
9. 数据挖掘的经典案例“啤酒与尿布试验”最主要是应用了( )数据挖掘方法。
A 分类 B 预测 C 组合或关联法则 D聚类 10. 企业成功实施数据挖掘, 需要以下( )知识或技术
A 预先的规划 B 对商业文体的理解 C综合商业知识和技能 D 都需要
四、简答题(每题6分,共30分)
1. 数据挖掘的六种常用算法和技术分别是什么?
2. 实现数据挖掘技术在企业中专业化应用的四种有效途径?
共 4 页,第 3 页
3. 一般认为有哪几种方法可以提升客户的价值?
4. 数据挖掘中的数据需要采用哪些格式?
5. 预测模型的建立过程有哪些?
共 4 页,第 4 页
共分享92篇相关文档