卫生健康信息数据集元数据标准(WS/T 305—2023)

2024-4-4 16:45| 发布者: 享瑾美| 查看: 1289| 评论: 0

摘要: 本标准规定了数据集元数据内容框架、卫生健康信息数据集核心元数据、卫生健康信息数据集参考元数据、引用信息与代码表,适用于作为卫生健康信息数据集属性的统一规范化描述,也可用于卫生健康领域针对数据集制定专用 ...


5.3元数据的摘要描述

5.3.1元数 据的摘要描述符

主要采用摘要描述方法定义和描述卫生健康信息数据集的元数据内容。摘要描述的方法通过表1所列的描述符针对元数据的元素、实体与子集进行定义。“约束” 表示一个描述符是“必选”(M),还是“条件选”(C) 或者是“可选”(0) 摘要描述符见表1

1摘要描述符

描述符

约束

备注

中文名称

M

 

定义

M

 

英文名称

M

 

数据类型

M

 

取值规则

C

描述元数据元素时必选,描述元数据子集、实体时不选

短名

M

 

子元素

C

描述元数据子集、实体时必选,描述元数据元素时不选

注解

M

 

5.3.2中文名称

元数据子集、实体或元素的中文名称,即为核心元数据的元数据实体或元数据元素的中文名称。

5.3.3 定义

描述元数据子集、实体或元素的基本内容,是卫生健康信息数据集某个属性和特征的概念与说明。

5.3.4 英文名称

元数据子集、实体或元数据元素的英文名称,一般使用英文全称。

英文名称中,词汇均采用无缝连写。元数据子集与实体英文名称的每个词汇的首字母均为大写,元数据元素英文名称的首词汇全部小写,其余词汇的首字母采用大写。

5.3.5 数据类型

对元数据的有效值域和允许对该值域内的值进行有效操作的规定。

元数据实体与元数据子集的数据类型为复合型,元数据元素的数据类型包括为数值型、布尔型、字符串、日期型和复合型等。

当元数据元素的数据类型为复合型的时候,表明该元数据元素使用了引用信息中的引用数据类型。

引用数据类型是由- -组元素组成、能被重复引用的元素集合。例如,“ 数据集提交和发布方”和“元数据维护方”两个属性,要共同用到“单位名称”、“联系人”“联系电话”、“通讯地址”、“邮政编码”和“电子邮件地址”这一组子元素来表示,为了表达的方便,卫生健康信息元数据定义了一个叫做“负责方”的数据类型见本标准9.1.1条款,供“数据集提交和发布方”和“元数据维护方”进行引用。

5.3.6 取值规则

元数据子集、实体或元素取值方式的说明。

5.3.7短名

元数据元素、实体或子集的英文缩写名称,具体缩写规则如下:

a)短名在本标准范围内必须唯一。

b)对存在国际或行业惯用英文缩写词汇的元数据元素或元数据实体,采用惯用英文缩写作短名。

c) 对于根据英文名称或自定义的短名,在可以保证其(本标准范围中的所有短名范围内)唯一性的情况下取每个词汇的前3位字母作为其短名,当如此取词时发现不能够保证短名标识的唯一性时,应当延展取词的位数,通常增加1位。如果仍然不能满足唯一性要求,则照此顺延。

d) 元数据子集、元素和元数据实体的短名中,词汇均采用无缝连写。元数据子集与实体短名中每个词汇的首字母均为大写;元数据元素短名的首词汇全部小写,其余词汇的首字母采用大写。

5.3.8子元素

子元素是通过一定的表示规则以确定--个元数据实体中包含的下--级的元数据实体或元数据元素。表示规则为:“标识符 =表达式”。表达式中各符号的含义见表2

2表达式的符号含义

符号

含义

=

....替换、生成,...组成

+

|

(选择) ——在由“|”分开的两项之中选择其一

0{a}1

表示{}中的元数据元素a为可选/条件必选项,且最大出现次数为1;若为条件必选项,约束/条件参见其注解

0{a}n

表示{}中的元数据元素a为可选/条件必选项,且最大出现次数为N;若为条件比选项,约束/条件参见其注解表示元数据元素a为必选项,且最大出现次数为1

a

表示元数据元素a为必选项,且最大出现次数为1

1{a}n

表示{}中的元数据元素a为必选项,且最大出现次数为N

在子元素表示中,{} 均使用元数据元素或实体的中文名称。

例如:

子元素:关键词说明=

1{关键词n+

0{词典名称}1

5.3.9 注解

对元数据子集、实体或元素的含义的进- -步解释,包括该元数据的约束/条件(必选、可选或条件必选)和最大出现次数。当该元数据为条件必选时,应注明其约束条件。

5.3.9.1约束/条件

以“必选项”“可选项”、“条件可选”等文字说明元数据子集、实体或元素是“必须(M)”、“可选(0) 或者“条件可选(C)”。

可选元数据子集或元数据实体可以有必选元数据实体或元素。但这些必选的实体或元素只有当上一级的可选子集或实体被选用时才成为必选的:如果上一级的可选元数据子集或实体未被选用, 则其所包含的必选实体或元素也不选用。

5.3.9.2最大出现次数

说明元数据子集、实体或元素可以重复出现的次数。只允许出现- -次的用“1”表示,允许重复出现(但重复的次数不是固定值)的用“N”表示。不为1的固定出现次数用相应的数字表示,如“2”、“3”、 4 等。

 

5.4 适用功能

5.4.1数据集元数据著录

对具体的卫生健康信息数据集选择元数据内容进行描述时,以核心元数据作为著录(根据必选、可选等约束条件)的基础,然后根据需要可以选择参考元数据的内容进行著录,见图2: 

2直接作为著录标准的使用方式

用户针对卫生健康信息数据集进行元数据著录的示例,可参照本标准附录A(以只著录核心元数据内容为例)

5.4.2 制定专用标准的依据

在卫生健康领域内,以数据集为对象制定专用的元数据标准时,可依照本标准进行制定。

所制定的数据集专用元数据标准,必须包含核心元数据的内容,同时将参考元数据的内容作为扩展内容的参考,使用方式见图3: 

3作为制定专用标准依据时的使用方式

要在卫生健康信息参考元数据的基础.上继续进行元数据内容的扩展时,应当符合附录B的要求。

 



路过

雷人

握手

鲜花

鸡蛋


本站信息仅供参考,不能作为诊断医疗依据,所提供文字图片视频等信息旨在参考交流,如有转载引用涉及到侵犯知识产权等问题,请第一时间联系我们处理

在线客服|关于我们|移动客户端 | 手机版|电子书籍下载|中医启疾光网 (鄂ICP备20008850号 )

Powered by Discuz! X3.5 © 2001-2013 Comsenz Inc. Designed by zyqjg.com

版权

返回顶部