云题海 - 专业文章范例文档资料分享平台

当前位置:首页 > 知识服务论文整理 - 图文

知识服务论文整理 - 图文

  • 62 次阅读
  • 3 次下载
  • 2025/12/10 23:20:17

第三篇 中文本体构建及可视化研究

本文概述:本文对现有本体构建工具进行了比较分析, 并对Protégé 的中文本体构建能力进行评估, 深入探讨了其构建中文本体过程中遇到的可视化问题, 提出了可行性解决方案。全面讨论了中文本体构建工具现存的问题, 指出了未来的研究方向。

中文本体构建环境:

本体构建工具概述:常用本体构建工具,如Protégé -2000、WebODE 、OilEd 、OntoEdit 、KAO等具有以下优点:

①提供了较为友好的图形化界面和一致性检查机制;

②这些工具独立于语言, 即用户不必了解本体描述语言的细节, 只需把精力集中在本体内容的组织上,避免了很多错误的发生,方便了本体的构建;

③提供了本体的编辑功能和推理功能, 用户可以输入和编辑每个概念的名字、约束、属性、实例等内容,

Protégé 中文本体构建能力评估:

较之其他工具而言, Protégé 在支持中文方面又具有如下的优势:

①基于UTF -8 编码。 ②开源的特性

③良好的可扩展结构。

对于中文本体的构建环境而言,文中认为Protégé存在以下缺陷:

①界面可读性差。 ②辅助功能不完善性 本体构建环境的中文可视化:

中文构建环境汉化结果示例

中文本体可视化:

中文本体可视化存在的问题:

①OWLVizT ab 无法对中文本体图示进行布局, 生成的图形堆叠在左上角; ②TGVizTab 可以正确显示中文类,无法正确显示中文属性, 显示为乱码; ③OntoVizT ab 无法生成中文图示。

这些问题究其本质原因, 在于Java 语言对中文处理存在的编码问题。作者通过修改和替换接口

模块解决了中文本体可视化问题。

问题解决:Java 中I/O 流分为字节流和字符流两种, 分别由四种抽象类表示:Input-Stream 、

OutputStream 、Reader 和Writer 。具体实现时字节流的输入输出分别使用FileInputStream 和FileOutputSt ream , 字符流使用FileReader 和FileWriter 。字节流转换成字符流可以用InputSteamReader 和OutputStreamWriter 。通过对输入输出流的转换, 以及指定输入输出流的编码, 解决中文可视化问题。

第四篇 基于概念图匹配的语义相似性算法研究

本文概述:本文提出一种基于概念图语义匹配的方法来计算两个本体中类之间的相似性,该模型首先将用户的查询信息转变为一个概念图, 然后和已有的资源概念图进行匹配计算语义的相似性以提高检索效率。

基本概念:概念图,语义网,语义匹配

基于概念图的语义匹配:

概念图的语义相似性计算:文献中阐述了通过WorldNet 中两个概念的语义距离得到类之间

的语义相似度, 然后将各个结点和关系的相似度按权值累加最后得出两个RDF 图之间的相似度。文献也用到了该方法来计算两个概念图之间的相似性。在这两篇文献中分别把本体看作一个RDF 图和一个概念图。为了避免计算时递归陷入无止尽的循环, 规定用户指定一个查询概念图的入口结点, 已有的被搜索的概念图也有一个入口结点, 仅仅比较在两个概念图中同等位置的概念的相似性。

上图公式及文献中提到的计算概念图的语义相似度的方法, SoG(nQ,nR)用来计算两个图之间的相似性, 其中nQ 表示查询概念图的入口结点, nR 表示资源概念图的入口结点。Simn(nQ,nR)表示两结点之间的相似性, 计算从节点nQ 和nR 出发的第j 个弧线之间的相似性, 其中表示一个结点出发的各个弧线和该结点的权值和为1, 并且各个弧线和结点的权值是相等的。

节点的相似性计算:在文献中计算结点的相似性时要通过查询WorldNet 中个本体结构包含的两个结点到它们共同的父母结点的距离来得到, 有时候一些词并不能在WorldNet 中找到, 比如一个类的特征这样的结点包含好多信息, 因此会导致本来相似性很高的两个概念图可能会得不到预期的结果。文献用概率论的思想来计算异构本体的实体类之间的相似性。它们将本体大概分为类、类的不同特征或类的功能以及类的不同组成部分, 而在这三种情况的类中都可能会包括部分的同义词, 所以通过计算各个部分的相似性最后按权值累加可以得到异构本体的类的相似性。

a ,b 表示两个类, Simn(a,b)用来表示两个类a, b 之间的相似性, A 和B 表示两个结点a 和b 中包含的词的集合, |A∩B|表示两个集合中共同包含的词的数目, |A/B|表示集合A 中包含的而集合B 中没有包含的词的数目, |B/A|表示集合B 中包含的而集合A 中没有包含的词的数目。depth(aP) 表示类a 中包含的一个结点p 在其所在的概念图中的深度信息, 也就是结点

p 到根结点的层次, 根结点的深度是0。 弧线的相似性计算:概念图中的弧线既可以用来表示本体中的关系也可以表示本体的属性等, 所以为了减少递归计算过程的复杂度, 本文在此利用文献[ 4] 中的弧线的相似性的计算方法, 定义两个弧线如果是相同的概念也即两个弧线如果是用同一个词表示的,那么它们的相似性就是1, 反之则为0。

算法的实验验证:

实例概念图

上表为fire engine和fire truck中找到的节点的相似性。

接下来计算两个概念图的相似性SoG(red, red)=1,对于两个概念图从各自的入口结点出发的分别有三个弧线, Sim r(color,color)=1, Sim r(part, part)=1, Sim r(memb, memb)=1。SoG(red, red)=1, SoG (fireman, fireman)=1, SoG (C, D)=0.45, SoG(equipment, equipment)=0.5*1+0.5*1*0.45=0.73。最终得到SoG (fire engine,fire

truck)=0.25*0.33+0.25*1+0.25*0.73+0.25*1=0.765, 可以看出该算法计算出两个概念图的相似性是很高的。

算法评价:本文的创新点是充分地利用了本体的资源, 并通过实例证明了该方法的可行性。这种方法不仅体现了两个概念之间的共同属性, 也体现了它们之间不同的特征, 因此可以有效地避免漏掉一些相关的信息, 同时也过滤了更多无关的信息, 对今后数据检索和信息合并中语义相似性的计算研究有重要的参考价值。随着数据量增大, 本文提出的算法计算复杂度会越来越大。为减小计算复杂度, 文中在计算相似性时仅仅考虑了在两个概念图中同等位置上的类的相似性, 并且规定了每个概念图的计算入口结点,这一方面仍需我们继续改进。

搜索更多关于: 知识服务论文整理 - 图文 的文档
  • 收藏
  • 违规举报
  • 版权认领
下载文档10.00 元 加入VIP免费下载
推荐下载
本文作者:...

共分享92篇相关文档

文档简介:

第三篇 中文本体构建及可视化研究 本文概述:本文对现有本体构建工具进行了比较分析, 并对Protégé 的中文本体构建能力进行评估, 深入探讨了其构建中文本体过程中遇到的可视化问题, 提出了可行性解决方案。全面讨论了中文本体构建工具现存的问题, 指出了未来的研究方向。 中文本体构建环境: 本体构建工具概述:常用本体构建工具,如Protégé -2000、WebODE 、OilEd 、OntoEdit 、KAO等具有以下优点: ①提供了较为友好的图形化界面和一致性检查机制; ②这些工具独立于语言, 即用户不必了解本体描述语言的细节, 只需把精力集中在本体内容的组织上,避免了很多错误的发生,方便了本体的构建; ③提供了本体的编辑功能和推理功能, 用户可以输入和编辑每个概念的名字、约束、属性

× 游客快捷下载通道(下载后可以自由复制和排版)
单篇付费下载
限时特价:10 元/份 原价:20元
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信:fanwen365 QQ:370150219
Copyright © 云题海 All Rights Reserved. 苏ICP备16052595号-3 网站地图 客服QQ:370150219 邮箱:370150219@qq.com