6元数据内容框架 卫生健康信息数据集元数据的全集,即参考元数据的内容规定了7个元数据子集,分别如下: a)元数据标识信息(子集):包含元数据本身的基本信息,如名称、维护方、创建日期等。 b)数据集标识信息(子集):包含元数据所描述的数据集的基本信息,包括名称、标识符、提交或发布方等。 c)内容信息(子集):内容信息提供数据内容特征的描述信息,包括摘要、特征数据元等。 d)分发信息(子集):分发信息包含有关资源分发者的信息以及用户获取资源的途径。 e)数据质量信息(子集):数据生产者有关数据集数据志信息的一般说明。 f)限制信息(子集):包含对数据集和元数据进行访问和使用的限制信息。 g)维护信息(子集):包含关于元数据或数据集的更新频率及更新范围的信息。, 参照UML类图中聚集关系与依赖关系的表示方法,概要描述了卫生健康信息数据集参考元数据的内容框架( 见图4)。 图4卫生健康信息参考元数据内容构成 7个子集是参考元数据这一整体的组成部分,在图4中标记出了各自的可出现次数。元数据标识信息(子集)、数据集标识信息(子集)、限制信息(子集)和维护信息(子集)中有元数据元素使用到了引用信息中由本标准定义的数据类型,所以它们对引用信息存在依赖关系。 7卫生健康信息数据集核心元数据 7.1概述 卫生健康信息核心元数据包括8个必选元数据元素或实体,10个可选元数据元素与实体。卫生健康信息数据集核心元数据内容见表3,其中的第四列“约束”是指该元数据元素或元数据实体是“必选(M)”,或者是“可选(0)”,第五列是说明核心元数据在参考元数据中的相应位置。 表3卫生健康信息数据集核心元数据内容
7.2摘要描述 7.2.1 数据集名称(必选) 定义:能够简要描述卫生健康信息数据集主题与内容的标题 英文名称: dataset
Title 数据类型:字符串 取值规则:自由文本 短名: data
Title 注解: 必选项;最大出现次数为1 7.2.2数据集标识符
(必选) 定义:卫生健康信息数据集的唯一标识符 英文名称: dataset
Identifier 数据类型:字符串 取值规则:按照“提交机构-编号-版本号”的命名规则进行赋值。提交机构使用机构标准名称,版本号用一位整数加两位小数的表示方式,例如“2.10” (版本)。 短名: dataID 注解:必选项;最大出现次数为1 7.2.3 数据集摘要(必选) 定义: 数据集内容的简单说明 英文名称: abstract 数据类型:字符串 取值规则:自由文本 短名: abstract 注解:必选项;最大出现次数为1 7.2.4 数据集提交或发布方(必选) 定义:提交或发布数据集,并对数据集的真实性、正确性负责的单位或部门 英文名称: dataset Contact 数据类型:复合型 取值规则:负责方<<数据类型>> (见本标准9.1.1) 短名: data Contact 注解:必选项;最大出现次数为N 7.2.5关键词说明
(必选) 定义: 关键词种类、类型和参考资料 英文名称: Descriptive Keywords 数据类型:复合型 短名: Desc Keys 子元素:关键词说明= 1{关键词}n + 0{词典名称}1 注解: 必选项;最大出现次数为N
|