数据是企业重要的无形资产,由多主体产生,被不同组织及组织不同层级在数据价值链的不同环节使用。在数据协同治理中,数据使用者面临诸如数据从哪里来,企业有什么数据,数据之间有什么关系,谁能理解企业的数据等问题。本书立足于解决上述问题,提出将数据供给端与需求端,以及背后所蕴含的业务、组织、系统等的知识异构复杂性,通过语用情境融合的多义术语识别、概念扩展的数据模型协同,以及面向协同治理的实施方法,建立可操作、可持续,基于知识融合的数据共享服务方法。
本书适合高等院校师生、研究机构人员、企业数据治理人员阅读,通过方□□和企业案例帮助读者理解数据协同治理中的难题和解决方案。
1 绪论 1
1.1 数据协同治理 1
1.2 场景化数据互操作 3
1.3 研究框架与技术路线 4
2 国内外研究动态 7
2.1 基本概念及术语界定 7
2.1.1 数据元素 7
2.1.2 异质性 8
2.1.3 互操作 8
2.2 数据异质性分类综述 9
2.2.1 数据的上下文语义 9
2.2.2 数据异质性分类方式 11
2.3 数据互操作研究综述 14
2.3.1 基础研究综述 14
2.3.2 应用研究综述 21
2.4 现有研究存在的问题 24
3 场景化数据互操作概念及理论框架 26
3.1 基于协同治理的数据共享复杂性分析 26
3.1.1 协同治理 26
3.1.2 数据共享空间 29
3.1.3 产业互联 31
3.1.4 数据共享复杂性 32
3.2 场景化数据互操作概念及目标 35
3.2.1 场景化数据互操作概念 35
3.2.2 场景化数据互操作目标 37
3.3 场景化数据互操作理论框架 40
3.3.1 场景化数据互操作框架 40
3.3.2 异构术语知识库建模分析 43
3.3.3 数据模型知识库建模分析 46
3.4 本章小结 49
4 基于语用情境融合的多义术语识别 51
4.1 相关研究 51
4.1.1 术语构建研究 51
4.1.2 情境建模研究 54
4.2 面向专业用户的异构术语库构建 56
4.2.1 领域术语构建边界分析 56
4.2.2 领域术语构建框架 56
4.3 基于文本分析的异构术语分类关系建模 58
4.3.1 文本向量空间获取 58
4.3.2 术语分类关系定义 60
4.3.3 基于主题聚类识别多义术语 62
4.4 基于动态场景知识的领域术语非分类关系建模 67
4.4.1 共享环境内动态场景建模 68
4.4.2 基于动态场景知识的多义领域术语标注 70
4.4.3 术语语用情境标注实例分析 73
4.5 本章小结 78
5 概念扩展的数据模型协同研究 79
5.1 基础理论 79
5.1.1 数据模型 79
5.1.2 本体对齐 80
5.2 概念扩展的数据模型协同设计思路 81
5.2.1 协同所要解决的异构问题 82
5.2.2 概念扩展的数据模型协同框架 83
5.3 概念扩展的数据模型专有实例获取 85
5.3.1 概念扩展的数据模型元模型定义 86
5.3.2 基于实体关系图获取CDMM的专有实例 88
5.3.3 基于统计报表获取CDMM的专有实例 93
5.3.4 基于数据来源场景获取CDMM的专有实例 95
5.4 概念扩展的数据模型专有实例增量协同 97
5.4.1 基于本体对齐的CDMM专有实例映射 98
5.4.2 基于CDMM专有实例映射结果识别异构问题 102
5.4.3 基于CDMM核心要素消解异构问题 107
5.5 本章小结 117
6 协同治理下的场景化数据互操作实施方法及应用 119
6.1 场景化数据互操作方法 119
6.1.1 产业互联数据共享中的协同治理 119
6.1.2 场景化数据互操作实施方法 121
6.1.3 场景化数据互操作方法如何支持数据检索 122
6.1.4 场景化数据互操作方法如何响应动态场景需求 123
6.2 中铁智慧供应链协同生态案例 125
6.2.1 中铁供应链数字生态现状分析 125
6.2.2 中铁智慧供应链数据共享需求分析 127
6.2.3 场景化数据互操作语义来源确定 131
6.3 场景化数据互操作核心知识库构建与应用 132
6.3.1 基于主题分析和语用情境标注的多义术语识别 132
6.3.2 基于本体对齐的概念数据模型构建与协同 140
6.3.3 面向多场景的数据互操作知识使用情形示例 161
6.4 本章小结 170
7 结论与展望 172
7.1 结论 172
7.2 展望 175
参考文献 177