当前位置:首页 > 企业级门户网站和内容管理系统解决方案
信息资源电子文档库、信息资源数据交换共享和统一信息检索完整解决方案
4.1.3.3 信息资源安全检索
实现信息分类查询、全文检索和统一信息搜索服务。
1、实现一致的、可控制的分类原则,用户可按照分类原则进行浏览和检索。
2、用户可以进行任意词检索、多字段复合检索、二次检索、历史检索并对检索结果进 行统计和排序。
3、检索操作的平均响应时间不超过 5 秒,并且检全、检准率高。
4、检索根据权限进行,从而避免信息泄密。
5、通过统一信息搜索平台实现对各共享信息资源库的检索
4.1.3.4 知识库和信息挖掘
1、利用信息资源库提供强大的知识管理工具和信息挖掘工具,系统可对数据库数据进 行整理、抽取和转换,构建起知识库,并利用信息资源库基于内容的查询挖掘技术,综合各 个应用领域的需求,建立数据挖掘系统。
2、辅助领导决策支持。通过对信息资源库数据信息进行挖掘、综合分析,协同模型库 管理系统,进行人机交互式领导决策支持系统运作,为领导决策提供科学的决策依据。
4.1.3.5 信息资源库信息的共享交换
1、支持关系数据库数据及记录式数据以及文本格式数据等的手工及自动批量导入并转 换为信息库标准格式。
2、信息库数据支持按照 XML 格式的批量导出能力,基于 XML 标准交换协议,保证系统 具有良好的兼容性与开放性,便于与其它系统交换信息。
3、通过与标准的关系数据库接口,系统实现对 Lotus 和流行的关系数据库系统中非结 构化信息内容进行批量迁移与信息同步,实现对其他应用系统中异构数据库的统一查询和访 问,最终实现异构数据库之间的平滑接入。
4、通过 SOA 数据交换接口,查询信息资源库管理平台,获得共享信息资源库服务信息, 向信息资源库发出服务请求,获得信息资源库的信息
- 9 -
信息资源电子文档库、信息资源数据交换共享和统一信息检索完整解决方案
4.1.3.6 访问控制与授权
实现独立于操作系统的用户权限管理、用户操作审计、分析与统计等功能,能有效地保 证各类信息资源库的安全。
基于 CA 身份认证系统,实现访问安全认证;通过用户和授权管理系统实现基于角色的 信息资源访问控制,每个工作人员根据自己的职务和权限,访问不同的业务信息系统和电子 信息资源;通过安全审计跟踪用户操作。
4.1.4 系统功能设计
经过对需求进行分析,系统功能概括如下:
1. 集成统一用户:实现信息资源库系统集成统一用户管理功能。
2. 集成单点登录:在信息资源库系统上集成单点登录功能。
3. 集成全文检索:上载文件(密文,但要同时上传明文)时调用全文检索的接口创
建索引。进行全文检索时,调用全文检索的接口进行检索查询,返回检索结果。 4. 资源库的创建:按照系统提供的向导,实现用户自定义资源库的创建。包括资源
库的属性以及资源库的结构。
5. 资源库授权:根据资源库的用途和使用权限,对创建的资源库进行授权管理。
6. 页面展示:管理员对资源库的数据维护页面进行定制展示,使之满足资源库的业
务逻辑要求。
7. 目录授权:对资源库中所建各级目录进行授权维护和管理。
8. 元数据维护:根据访问的权限可以对元数据进行维护和管理。
9. 元数据权限:元数据维护过程中要根据人员、处室和角色指定进行授权。
10. 文件格式转换:对上传的带密级的文档转换为标准的 PDF 文件格式保存,便于借
阅控制。
11. 借阅权限:通过文档在服务器端的加密实现借阅权限的控制。
12. 全文检索:实现安全的、基于授权访问的全文检索和查看功能。
13. 日志审计:实现包括构建日志、编目日志、元数据管理日志、查询检索日志。
14. 统计分析:实现统计生成报表,并可进行分析。
15. 标准的导入接口:制定了标准的导入权限和导入数据的要求及接口说明。
- 10 -
信息资源电子文档库、信息资源数据交换共享和统一信息检索完整解决方案
16. 标准的导出接口:制定了标准的数据访问权限和接口说明以及数据导出接口标
准。
17. 文本挖掘:提供自动提取关键词,自动建立摘要和自动进行分类,生成统计分析
数据,为领导决策提供支持。
18. 信息推送服务:应用系统的信息和电子文档进行集中统一管理,信息资源库的信
息和电子文档推送到可信任的、需要使用该资源的系统中,如门户网站、各应用 系统。
19. 在统一的信息检索平台,进行共享信息的检索和信息资源库服务的查询,实现异
构信息资源库的信息共享和交换
4.1.5 系统特点
1. 集成能力强:根据标准的数据导入接口,并经信息资源库允许就可以将数据无缝
导入到信息资源库中。
2. 信息共享:由于信息唯一的存储在信息资源库中,在为其他应用系统提供信息服
务的同时,保证信息的唯一性。
3. 个性化服务:信息的属性是唯一存储。但为其他应用系统提供服务时,可根据各
应用系统的情况进行个性化管理并利用。
4. 完善的授权体系:从可以创建资源库到信息发布,所有的环节都进行授权管理和
访问,形成一套完善的、清晰的管理和访问授权体系。
5. 方便、快捷的创建资源库:系统默认必须的结构外,用户可以根据业务的特点,
自行定义该库的结构。
6. 分布式部署:可实现分布式部署的方式,最大可能的实现信息资源的共享。
4.2 互联网信息采集系统
4.2.1 概述
互联网信息采集系统需要集成网页搜索、内容智能提取与过滤、自动分类、自动去重等
- 11 -
信息资源电子文档库、信息资源数据交换共享和统一信息检索完整解决方案
技术,实现对互联网信息采集、过滤、提取的自动化与一体化,搭建成一个完善的网络信息 收集平台:获取大量的互联网上资料,充实资料库;收集与自身业务相关的文献资料,提升 办公与决策效率;快速获取行业宏观环境、政策动态。
4.2.2 系统构成
系统总体网络结构如下图所示:
4.2.3 系统功能设计
1. 支持各种标准格式信息资源的采集,如 HTML 页面、文本信息、表格、图片、声
音、视频等。
2. 配置管理可以指定要采集的起点 URL、包含或者不包含的关键字。
3. 能精确描述需要采集的网站范围,可以精确到整个网站、特定栏目、特定页面,
做到定时定点采集。
4. 可以实现对网页与内联图片的统一采集。
5. 支持繁体页面(BIG5 码)的采集,并自动转换为标准的简体码(GB 码),支持 Unicode
码集。
- 12 -
共分享92篇相关文档