云题海 - 专业文章范例文档资料分享平台

当前位置:首页 > 基于本体的科学数据库语义集成若干关键技术研究

基于本体的科学数据库语义集成若干关键技术研究

  • 62 次阅读
  • 3 次下载
  • 2025/7/8 13:38:01

中国科学院研究生院硕士学位论文 第四章 科学数据库语义集成若干关键技术研究

Triple主表SubjectPredicateObject...........................Class-property附表ClassProperty.........

...

图4-1 静态语义数据库存储模式

如图4-1,其中Triple表是用于存储具体的语义数据,而Class-property表用于存储索引信息,其表示主表中存在哪些概念关于哪些属性的语义数据。相对于主表,Class-property表存储的数据量很少,因此适配器首先访问该表来判定静态语义数据库是否存在需要的语义数据。根据静态语义数据库建立的完备原则,不必对同一三元组(S?, P?, O?)查询请求重复检索,从而可大大提到适配器的语义检索效率。 4.2.2动态转化语义数据

动态转化语义数据的基本过程为:将查询代理的语义三元组(S?, P?, O?)查询

请求根据数据库和本体的语义映射关系转化为对SQL语句查询;将SQL查询结果以语义三元组(S, P, O)返回。下面对这两个过程做一个粗略的探讨,并提出一个优化策略。

1) SQL查询重写

由于三元组(S?, P?, O?)中的任意一个可以是检索的请求也可以是检索的条a) S?, P?都不是条件而是查询请求,而O?可以是检索请求也可以检索条

件,因此可以根据它们是否是条件分为两大类:

件,如(S?, P?, ―王平‖)是要寻找所有S?的所有断言P?,且其值为“王平”。对于此种情形,我们需要遍历语义映射关系中涉及到的所有概念和属性对应的数据库模式,并将它们翻译为相应的SQL查询,如对于概念csdb:Person及其属性涉及到的表4-1,(S?, P?, ―王平‖)翻译为相应的SQL语句为:

33

中国科学院研究生院硕士学位论文 第四章 科学数据库语义集成若干关键技术研究

如果?O不是查询条件,而是查询请求,那么将SQL语句的where部分去掉

即可,这对第二种情形也同样适用。可以发现,这种形式的检索效率比较低。 b) S?, P?至少有一个为条件,而其他的可以为条件也可以为检索请求,如(S?, csdb:name, ―王平‖)是要检索所有的对象,其有一个断言csdb:name, 且其值为“王平”。对于这种情形,我们首先要在语义映射关系中检索与csdb:name属性相关的概念以及它们对应的数据库模式,然后再进行相应的查询重写。例如在语义映射关系找到两个概念Person和Animal都具有csdb:name属性,且它们所对应的数据库表为person(ID, name)、AnimalInfo(ID,name),则转化为相应的SQL语句为:

可以看出此种形式的语义查询效率比第一种高很多。当S?为检索条件时,2) 查询结果重组

相对于查询语句重写,查询结果重组简单很多。只需记录查询结果所对应3) 查询优化策略

我们可以看到,对于每一个语义三元组(S?, P?, O?)检索请求都可以转化为一

需要在语义映射关系中搜寻与S?相关的所有属性,其他处理类似。

的查询请求项,并根据语义映射关系所对应的模式转化为相应的语义三元组。

个或者多个SQL请求。很多情况下,这些SQL请求是相近的,如上面SQL查询重写第一个例子中连续对person表各个列进行查询。此外,对于一些相近的语义三元组(S?, P?, O?)查询请求转化后的SQL语句也具有同样的现象。因此,如果能够将这些相近的SQL检索语句合并,将会大大提高检索性能。SQL语句合并的策略是以数据库表为中心:两个SQL语句只有所检索的列不同,其他条件都相同的情况下,可以将这两个SQL语句合并。 4.2.3混合式适配器算法

上面两节探讨了静态语义数据库和动态转化语义数据,这是混合式适配器核心的两个部分,根据前面的论述,整个混合式匹配器算法可归纳为图4-2,具体描述如下:

a) 查询代理请求语义三元组查询(S?, P?, O?);

b) 适配器判定S?, P?是否都为查询请求,如果为否则转d);

c) 适配器通过访问静态语义索引库(即前面提到的Class-property表),判定静态语义库中是否存在需要的语义数据,如果是,则转e), 否则转g);

34

中国科学院研究生院硕士学位论文 第四章 科学数据库语义集成若干关键技术研究

查询(S?, P?, O?)是S?, P?都为查询请求?否静态语义索引库是否存在此数据?是查询静态语义库查询静态语义库否是S?, P?都为查询条件?否查询动态语义数据返回(S,P,O)数据

图4-2 混合式适配器算法

d) 检索整个静态语义数据库是否有匹配的语义数据,然后转g); e) 根据搜索条件,检索静态语义数据库是否有匹配的语义数据;

f) 判定S?, P?是否都为查询条件,如果是,则不需要查询动态语义数据,转h);

g) 查询动态语义数据;

h) 返回查询得到的语义数据(S, P, O); 4.3 其他关键技术

前面两节对科学数据库语义集成中的“语义映射关系的建立”和“适配器的实现”进行了较详细的讨论,除这两部分之外,还有其他一些关键技术,本节扼要对它们进行阐述。

1) SPARQL解析和语义推理

SPARQL是W3C提出的RDF查询语言,虽然其目前还是W3C的Working Draft,但是现在已经有不少工具支持SPARQL语义查询和检索[49],因此我们可以利用现有工具实现对SPARQL查询的解析以及利用SPARQL访问RDF/OWL语义数据。

RDF/OWL语义推理是基于描述逻辑(Description Logic)[50],支持描述逻辑的

35

中国科学院研究生院硕士学位论文 第四章 科学数据库语义集成若干关键技术研究

推理机有FaCT和Racer,但是这些推理机大都是用Lisp语言实现,提供的使用接口比较复杂且没有考虑到RDF/OWL语言特性,因此有综合这些特点重新实现的推理机如Pellet[51],也有通过定义一套规则来集成原有推理机如DIG[52], 这些推理机至少支持OWL DL, 有些甚至支持OWL FULL。此外,一些语义万维网开发工具也支持一定程度的推理,像Jena就支持一些常见的RDF/OWL推理,如rdfs:subClassOf、rdfs:subPropertyOf,、rdf:type、owl:intersectionOf、 owl:FunctionalProperty等等。因此,我们可以根据具体情形选择不同的推理机达到要求。

2)本体图形化显示通用工具

本体一般都是以RDF/OWL格式存在,这样的格式虽然有利于应用程序读取和解析,但是不便于人们阅读和理解。因为本体是领域知识概念的规范化说明,所以良好的图形化显示本体能够帮助人们快速掌握该领域的知识概念。科学数据库语义集成框架需要支持多个本体,因此一个通用的本体图形化显示工具非常重要。

由于现有语义万维网开发工具支持本体解析,并提供一些本体基本操作接口,因此构建这个通用工具可以基于现有语义万维网开发工具之上。

3) 语义查询方式

根据第三章叙述,所有的语义查询请求都会转化为SPARQL请求然后提交给查询代理。但是对于具体用户来说,要求用户掌握SPARQL语言才能使用语义查询,显然过于苛刻。因此,我们必须提供基本的图形查询界面,然后将图形化的查询自动转化为SPARQL查询请求。

现有Web有两种基本的搜索方式:条件检索(或者关键词)和导航检索。条件检索是指用户输入一些条件(通常是关键词),然后搜索引擎会根据条件的匹配程度返回结果。导航检索将待检索的信息资源按照其结构和内容进行分类组织,这样用户在检索时就不需要显式的输入检索条件,只需按照信息的组织结构,逐步缩小信息的检索范围,最终找到所需信息。考虑到用户习惯,我们也需要同时支持类似的两种检索方式。一种检索方式是让用户输入关键词在较大的范围内检索;另外一种检索方式是用户通过浏览和了解本体中的概念和属性,让用户基于具体某一概念进行检索。当然,由于图形表达的局限而且要将它们转化为SPARQL检索,因此图形化检索能力具有一定的限制。 4.4 本章小结

本章分析和讨论了科学数据库语义集成中的若干关键技术,这些关键技术

对于实现科学数据库语义集成具有重要意义,为科学数据库语义集成原型系统的设计和开发提供了理论支持。

36

  • 收藏
  • 违规举报
  • 版权认领
下载文档10.00 元 加入VIP免费下载
推荐下载
本文作者:...

共分享92篇相关文档

文档简介:

中国科学院研究生院硕士学位论文 第四章 科学数据库语义集成若干关键技术研究 Triple主表SubjectPredicateObject...........................Class-property附表ClassProperty......... ... 图4-1 静态语义数据库存储模式 如图4-1,其中Triple表是用于存储具体的语义数据,而Class-property表用于存储索引信息,其表示主表中存在哪些概念关于哪些属性的语义数据。相对于主表,Class-property表存储的数据量很少,因此适配器首先访问该表来判定静态语义数据库是否存在需要的语义数据。根据静态语义数据库建立的完备原则,不必对同一三元组(S?, P?, O?)查询请求重复检索,从而可大大

× 游客快捷下载通道(下载后可以自由复制和排版)
单篇付费下载
限时特价:10 元/份 原价:20元
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信:fanwen365 QQ:370150219
Copyright © 云题海 All Rights Reserved. 苏ICP备16052595号-3 网站地图 客服QQ:370150219 邮箱:370150219@qq.com