海量语义数据处理
2012-10
高等教育出版社
黄智生 等编著
255
320000
无
语义万维网所面临的一个重大问题,就是如何处理海量语义数据,它一直被认为是制约语义技术发展的瓶颈。本书系统地介绍了海量语义数据处理的最新技术和进展,通过介绍LarKC项目所开发的海量语义处理平台及其应用,来阐述海量语义数据处理技术的基本原理、实现方法和应用开发等一系列关键问题。
《海量语义数据处理——平台技术与应用》由黄智生、钟宁著,全书共
13章,分为上、下篇。上篇为技术篇,内容包括海量语义数据处理基本原理、海量语义数据处理平台体系结构、识别与选择技术、抽象与学习技术、推理与决策技术及LarKC平台应用开发技术等。下篇为应用篇,内容涉及LarKC
平台开发的一系列应用系统,包括关联生命数据集、基于语义技术的医学文献检索、语义技术在生命科学中的应用、语义技术与城市计算以及语义技术在智能交通中的应用等。
《海量语义数据处理--平台技术与应用》不仅是一本介绍海量语义数据处理LarKC平台及其技术与应用的参考书,同时对语义数据处理技术问题的研究人员、语义数据处理平台实现的技术人员以及语义技术的应用开发人员均具有一定的参考价值。
北京市特聘专家(海聚工程特聘教授),北京工业大学国际WlC研究院学术带头人。日本东京大学博士,日本前桥工业大学研究生院及生命信息系教授,国际学术组织Web
Intelligence Coortium(WlC)主席,国际学术期刊Web Intelligence andAgent
Systems主编,IEEE计算智能学会脑信息学任务组主席。 黄智生(Zhisheng Huang)
荷兰阿姆斯特丹自由大学计算机系高级研究员,北京工业大学国际WIC研究院等多个大学兼职教授。主持欧盟第七研究框架重大语义技术研究项目LarKC中的推理工作组的研究。在国际期刊和会议上发表、交流学术论文百余篇。
担任近七十个国际学术会议组织委员会或程序委员会的委员或联合主席。
第1章 导论
1.1 语义技术概述
1.2 海量语义数据处理
1.3 LarKC概述
1.3.1.LarKC项目
1.3.2 LarKC技术概述
1.3.3 LarKC海量语义数据处理平台概述
1.3.4 LarKC应用技术开发概述
1.4 本章小结
参考文献
第一部分 技术篇
第2章 LarKC海量语义数据处理平台
2.1 LarKC体系结构
2.2 LarKC平台的安装与使用
2.2.1 获取LarKC
2.2.2 运行LarKC
2.2.3 一个简单工作流实例
2.3 工作流设计器
2.3.1 工作流设计器概览
2.3.2 安装及主要操作
2.4 LarKC插件概述
2.5 用户支持和版权信息
2.6 本章小结
参考文献
第3章 识别与选择
3.1 识别方法与识别插件
3.2 基于兴趣的选择方法与插件实现
3.2.1 基本原理与基本算法
3.2.2 方法的可扩展性与效率比较
3.2.3 基于兴趣的选择插件设计与实现
3.3 随机索引选择方法与插件实现
3.3.1 语义索引
3.3.2 基于随机索引与Lcene索引的检索比较
3.4 选择方法与选择插件的应用
3.4.1 基于兴趣的选择插件应用示例
3.4.2 随机索引选择插件应用示例
3.5 本章小结
附录 第3.3.2 节相关询问
参考文献
第4章 抽象与转换
4.1 机器学习
4.1.1 SUNS
4.1.2 机器学习插件
4.2 数据流
4.2.1 C-SPARQL
4.2.2 数据流插件
4.3 归纳与演绎结合的数据流推理
4.3.1 动机
4.3.2 数据流推理的结构框架
4.4 本章小结
参考文献
第5章 推理与决策
5.1 LarKC推理与决策插件
5.2 常规语义推理
5.2.1 OWLAPI推理机
5.2.2 SPARQLDL推理机
5.3 并行与分布式推理
5.3.1 采用MapReduce技术的海量分布性推理
5.3.2 采用WebPIE进行OWL分布性推理
5.4 基于规则的推理
5.5 本章小结
参考文献
第6章 非常规语义推理
6.1 不一致本体的推理
6.1.1 语义网与不一致性
6.1.2 基本方法
6.1.3 LarKC平台下的PION系统
6.2 转折推理
6.2.1 基本定义
6.2.2 计算方法和实现
6.2.3 转折推理插件
6.3 嘈杂语义数据的推理
6.3.1 基本定义
6.3.2 韩国首尔RSM系统示例
6.4 本章小结
参考文献
第7章 LarKC系统与应用开发
7.1 LarKC工作流开发
7.1.1 工作流图
7.1.2 工作流描述
7.1.3 更复杂的一个示例
7.2 LarKC插件开发
7.2.1 LarKCMaven原型的使用
7.2.2 插件代码编写
7.2.3 整合插件到LarKC平台
7.3 相关的开发工具
7.3.1 集成开发环境Eclipse
7.3.2 项目管理Maven
7.3.3 单元测试JUnit
7.3.4 版本控制SVN
7.4 本章小结
附录 复杂的工作流描述示例
参考文献
第二部分 应用篇
第8章 关联生命数据集
8.1 概况
8.2 关联生命数据组成
8.3 语义关联构造
8.4 关联生命数据集的使用
8.4.1 关联生命数据集关键词查询
8.4.2 关联生命数据集SPARQL语义查询
8.5 本章小结
参考文献
第9章 生物医学文献语义检索
9.1 需求分析
9.2 通过LLD进行医学文献检索
9.3 医学文献语义标注
9.4 LarKC医学文献语义检索插件
9.5 本章小结
参考文献
第10章 海量语义数据处理与基因研究
10.1 概述
10.2 基因研究与语义数据
10.3 LarKC海量语义数据处理平台用于GWAS研究
10.3.1 LarKC的GWAS插件
10.3.2 关键词扩展推理器
10.3.3 GWAS识别器
10.3.4 GWAS工作流
10.4 本章小结
参考文献
第11章 城市计算Ⅰ:交通与社交媒体
11.1 交通路线规划
11.1.1 框架结构
11.1.2 交通预测
11.1.3 语义交通路线规划
11.1.4 评价
11.1.5 小结
11.2 社交媒体分析
11.2.1 概况
11.2.2 框架结构
11.2.3 BOTTARI的LarKC工作流
11.3 本章小结
参考文献
第12章 城市计算Ⅱ:路标管理
12.1 基本思想
12.2 RSM数据集与数据整合
12.2.1 RSM数据集
12.2.2 数据整合
12.2.3 路标的有效性审核
12.3 RSM语义数据处理
12.3.1 系统结构
12.3.2.RSM工作流
12.3.3 :RSM查询与推理
12.4 RSM系统用户界面
12.5 本章小结
参考文献
第13章 海量语义数据处理技术展望
13.1 市场分析
13.1.1 语义技术的市场观察和潜力
13.1.2 市场分析的结论
13.2 LarKC海量语义数据平台应用展望
13.2.1 药物研发海量语义数据处理
13.2.2 语义技术用于政治文化分析
13.2.3 智能交通系统
13.2.4 基于语义技术的电子病历
13.3 海量语义数据处理研究展望
13.4 结束语
参考文献
版权页: 插图: LLD服务集成了主要的公共数据资源,涵盖了分子序列数据(蛋白质组学和基因组学数据)、系统生物学的资源(分子间的相互作用和路径)、化学化合物和药物的相关信息、临床和医学相关的资源及科学出版物等。LLD的数据集成模型可以用来提供详尽的疾病模型服务(即LLD作为DaaS)。这将为个性化治疗提供成功的技术基础。LLD平台将提供细化到非常具体的科学/医疗问题的专业知识的支持,以关注到一个特定的数据子集来使其信息服务功能。LLD的信息服务和数据服务(IaaS/DaaS)可以帮助有关研究人员,从而更好地在他们的研究项目中进行决策。 2.LarKC平台的开放性开发社区 LarKC平台将成为一个开放式平台以被持续开发, 这将是通过延续当前的开源开发的思想来实现的。这个开源开发的思想在LarKC项目的开发初期都已经确立下来了,有效地延长其组织结构框架并不完全依赖于现有的LarKC成员。虽然LarKC项目已经结束,LarKC团队成员已经致力于后LarKC的技术开发,这个努力被称为“让LarKC活着”。 13.1.2 市场分析的结论 在上述对LarKC的市场分析中,我们已经看到了主流IT企业介入海量语义数据处理领域的脚步。这以这些大公司收购语义技术和相关的海量语义数据处理的业务为主要特征。谷歌(Google)和Facebook都采用了语义技术和语义网服务,这将推动语义技术标准的发展,并降低采用语义技术的壁垒。语义技术可以作为一个子系统嵌入到他们现有的解决方案的基础设施之中。IT大公司和风险投资对于海量语义数据技术的介入,表明了这个技术在未来的市场的重大意义。 LarKC能为市场和未来的万维网贡献什么呢?我们的回答是:LarKC可以提供如下的两个最重要的功能: (1)LarKC平台是开放和免费的,但可提供进一步的收费服务。LarKC可以被看成是集成了许多小的插件的平台。每个人都可以通过它建立一个面向特定客户群而不是面向所有的客户的服务。LarKC的后续服务可以考虑对于每个后续开发系统提供一个简短的描述使之能够在较短的时间内就可以选择和组合。另一种方法是集成预先选定的一些工作流或者是插件提供组合应用系统。这一点类似于亚马逊(Amazon)公司的做法,它提供了两种方法:预先选定的“推荐”和无限制的自由文本搜索。
《海量语义数据处理:平台、技术与应用》不仅是一本介绍海量语义数据处理LarKC平台及其技术与应用的参考书,同时对语义数据处理技术问题的研究人员、语义数据处理平台实现的技术人员以及语义技术的应用开发人员均具有一定的参考价值。
无
讲的挺详细的,把语义网的发展,技术,LARKC平台的应用都涉及了
这本书是给老师买的,老师对我们现在做的信息检索是有用的
黄智生教授被誉为普及语义互联网的重量级人物,业界尊称其暑期免费培训课程为“黄普军校”。很喜欢这本书,还在仔细研读!