云题海 - 专业文章范例文档资料分享平台

当前位置:首页 > 《数据挖掘技术与应用》实验指导书(排)

《数据挖掘技术与应用》实验指导书(排)

  • 62 次阅读
  • 3 次下载
  • 2026/4/23 14:52:11

《数据挖掘技术与应用》实验指导书

在每条数据流末端增加analysis,并指向它们。 (7)不同决策树设置下的数据及分析。

7

《数据挖掘技术与应用》实验指导书

1)决策树设置:1误判为0代价为10,0误判为1代价为1。非专家模型。该代价矩阵设置应该根据具体业务进行设置,其意指:误将ST公司当成正常公司投资将会造成10单位的损失,而误将正常公司判断成为ST公司的非投资行为将造成1单位的经济损失。这样设置的目的是让决策树模型尽可能的找出ST公司,其会导致模型的整体精确度下降,但在有预算的投资资金的情况下,投资者总能选择出最佳的正常公司进行投资,现实意义显著。这个设置也是决策树与其它模型有所区别的地方。

8

《数据挖掘技术与应用》实验指导书

2)决策树设置:1误判为0代价为100,0误判为1代价为1。非专家模型。

9

《数据挖掘技术与应用》实验指导书

3)决策树设置:1误判为0代价为10,0误判为1代价为1。专家模型。

实验2:连续型变量与离散型变量的模型建立 1. 打开320.xls,另存为320.csv

2.运用R软件编程,对数据进行离散化处理,删除无效属性(属性为单一值),并保存。由于离散数据占用计算机空间小,运算速度快,因此在数据挖掘过程中把连续性的数据分区离散化可以使得在不损失有用信息的情况下提升模型的计算速度,简化计算,并使得模型数据匹配各种模型(如:贝叶斯模型,对离散化的数据处理更为精确)。在本例中,除目标变量,其余财务指标均为连续性变量,我们将用成熟的离散化算法将其转化为离散化数据,并重复上述的各模型,并把结果进行对比。

10

  • 收藏
  • 违规举报
  • 版权认领
下载文档10.00 元 加入VIP免费下载
推荐下载
本文作者:...

共分享92篇相关文档

文档简介:

《数据挖掘技术与应用》实验指导书 在每条数据流末端增加analysis,并指向它们。 (7)不同决策树设置下的数据及分析。 7 《数据挖掘技术与应用》实验指导书 1)决策树设置:1误判为0代价为10,0误判为1代价为1。非专家模型。该代价矩阵设置应该根据具体业务进行设置,其意指:误将ST公司当成正常公司投资将会造成10单位的损失,而误将正常公司判断成为ST公司的非投资行为将造成1单位的经济损失。这样设置的目的是让决策树模型尽可能的找出ST公司,其会导致模型的整体精确度下降,但在有预算的投资资金的情况下,投资者总能选择出最佳的正常公司进行投资,现实意义显著。这个设置也是决策树与其它模型有所区别的地方。 8 《数据挖掘技术与应用》实验指

× 游客快捷下载通道(下载后可以自由复制和排版)
单篇付费下载
限时特价:10 元/份 原价:20元
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信:fanwen365 QQ:370150219
Copyright © 云题海 All Rights Reserved. 苏ICP备16052595号-3 网站地图 客服QQ:370150219 邮箱:370150219@qq.com