本部分规定了术语数据库(简称“术语库”)术语条目的结构、数据库的功能、扩充以及数据规范化的要求。
本部分适用于术语库的研究、开发、维护及其管理工作。其他涉及术语数据处理的工作也可参照使用。
下列文件中的条款通过本部分的引用而成为本部分的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本部分。
GB/T 3792.1 文献著录总则
GB/T 3860 文献叙词标引规则
GB/T 8566 信息技术 软件生存期过程
GB/T 13418 文字条目通用排序规则(neq ISO 7154-83)
GB/T 13725-xxxx 建立术语数据库的一般原则与方法
GB/T 13726-1992 术语与辞书条目和记录交换用磁带格式(neq ISO 6156-87)
GB/T 13745 学科分类与代码
GB/T 15387.1-xxxx 术语数据库开发文件编制指南
GB/T 15237 术语学基本词汇(eqv ISO 1087-90)
GB/T 16786-1997 术语工作 计算机应用 数据类目(eqv ISO/DIS 12620-1996)
GB/T 17532-1998 术语工作 计算机应用 词汇(eqv ISO/DIS 1087-2-2:96)
GB/T 15237.1-2000、GB/T 16786-1997、GB/T 17532-1998确立的术语和定义适用于本部分。为了便于使用,本部分重复了其中的部分术语和定义。
3.1 术语term
在特定专业领域中一般概念的词语指称。
[GB/T 15237.1—2000,3.4.3]
3.2 数据库 database
常期储存在计算机中,有组织、可共享的数据集合。
3.3 术语数据库terminological database
包含术语数据的数据库。
[GB/T 17532—1998,7.6]
3.4 记录 record
作为一个单位来对待的数据元的集合。
[GB/T 17532-1998,7.9]
3.5 数据元 data element
在一定的上下文中具有区别特征的数据单元。
[GB/T 17532—1998,7.11]
3.6 数据字段 data field
为特定的数据元而保存在一个记录中的变长或定长的部分。
[GB/T 17532—1998,7.12]
3.7 数据类目 data category
数据元类型 data element type
关于给定数据字段的类型说明。
[GB/T 17532—1998,7.14]
3.8 标识符 identifier
用于标识或命名一个数据类目的一个或多个字符
[GB/T 17532—1998,7.15]
3.9 术语条目 terminological entry
术语数据集合中所包含的关于一个概念的术语数据。
[GB/T 17532—1998,3.22]
在术语库中,根据不同的使用目的,每一条术语及其相关的一组数据元构成一个术语单位。每一数据元占用一个字段(或子字段),具有相同属性的一类数据元构成一个数据字段。
4.1 字段数目
应根据术语库应用的需求确定字段数目,既要按照规范化的要求,最大程度地满足用户需要,又要避免浪费。
4.2 字段名称
应使用易记、易识别的字符串。
例1 :
字段名称:序号(xuhao/number)
缩写:xh(汉语拼音)或Num (英语)
例2 :
字段名称:定义(dingyi/definition)
缩写:dy(汉语拼音)或def(英语缩写)
4.3 字段标识符
字段标识符可使用字母或数字,如果使用数字,应符合GB/T 13726-1992附录A的要求。字段标识符及其编制原则与方法,应在提供给用户的文件中注明。
4.4 字段数据类型
4.4.1 字符型
可以汉字、字母、数字、特殊符号等。术语、定义等应使用字符型字段。
4.4.2 数字型
可以是整数、小数、正数和负数等。序号应使用数字型字段。
4.4.3 日期型
日期型数据字段结构为:CCYYMMDD。
例:20010515 表示2001年5月15日。
术语源的生成日期(例如标准发布日期,辞书出版日期等)、术语记录的生成日期等应使用日期型字段。
4.4.4 其他
术语数据还可能涉及其他字段数据类型,例如逻辑数据类型等。
4.5 字段长
术语库应尽可能使用变长字段,使用定长字段时应考虑使用方便及节约存储空间等因素。
4.6 字段间关系
根据术语数据元之间关系的特点,字段间的关系可以是一对一(1:1)、一对多(1:N)或多对多关系(M:N)。
4.7 字段的强制级别
字段的强制级别应根据该术语库的工作目的而确定。
4.7.1 必选字段
当术语数据类目是构成术语条目所必需的最小信息时,使用此类字段。例如,面向概念的术语库中的“术语”“定义”;面向翻译的术语库中的“术语”“外文对应词”等。必选字段必须设立,不允许空缺。
4.7.2 应选字段
当术语数据类目是构成术语条目所必要的信息时,使用此类字段,但允许空缺。例如,面向翻译的术语库中的同义词、术语的缩略形式等。
4.7.3 可选字段
当术语数据类目是构成术语条目的可选信息时,使用此类字段。例如,语法信息、语境等。
4.8 字段的可重复性
当属于相同的术语数据类目的术语数据元(如同义词)需要在一个记录中出现几次时,可重复使用同一字段。
4.9 字段的组合性
几乎所有术语数据类目的数据元(字段)均可以与一个或若干术语数据类目的数据元(字段)组合,构成一个新的术语条目。
4.10 子字段
当确定的某一字段可能存在几个值,或一个字段需反映几项内容时,可使用子字段。
a) 一条术语可能有若干个同义词,可根据使用状态进一步划分子字段,例如首选、许用、拒用。
b) 同义性(程度)字段需划分子字段,例如恒等于(≡)、大于(>)、小于等于(<=)、交叉(×)、近义(≈)、反义(←→)等。
4.11 相互参照
不同记录之间(如一条术语参照另一条术语);不同的文件之间(如主文件与倒排文件);不同数据库之间(如图形数据库与文本数据库之间,不同语种数据库之间)均存在相互参照。
5.1 用户界面
应能提供良好的汉字处理环境和友好的用户界面。
设计的屏幕应具备以下功能:
a) 人机对话。
使用者通过键盘或其他输入设备向机器输入提问或其他有关信息,机器通过显示屏幕或其他输出设备给使用者提供解答、提示或其他有关信息。
b) 选单驱动。
应根据需要设置系统管理和用户查询使用的不同选单,应设计一个选单系统为用户显示多重选择,根据需要可设计多级选单。
例如:
一级选单:主功能选择,例如数据输入、数据维护与更新、数据检索、排序和打印等;
二级选单:子功能选择,单项功能中的子项,条件等,例如数据检索功能中的浏览、设定检索式、显示检索结果等;
三级选单:需要设计的下一层细化功能选择。
c) 提示功能。
例如:
出错提示:指示错误的性质和类型,以至于如何改正;
拒绝接收提示:指示、告警无效或错误的操作;
操作步骤提示。
d) 求助功能。
例如:
正确操作的具体、详细的说明;
有关内容的资料,包括语种代码、学科代码、源机构代码、责任者代码等常用代码及其含义说明;
有关屏幕显示内容的解释,参数值的含义与范围,命令或功能选择描述。
求助功能可使用窗口技术或调用辅助库、辅助屏予以实现,此状态应易于进入和退出、返回原操作状态。
e) 用户需要的其他功能。
例如:浏览、窗口等。
5.2 数据检索
术语库除应能检索单一术语及相应信息(定义、外文对应词等)外,还应根据需要设计以下几种类型的检索。
a) 内部属性检索。
根据分类语言、叙词语言进行检索。分类语言检索得出的是适合某一分类的某一领域内成体系的全部术语;叙词语言检索出的是某一术语可能涉及的所有术语,包括其他领域内的相关术语。
b) 外部属性检索。
例如:
按术语源书目编目数据检索出该文献所包含的所有术语;
按源机构(或责任者)检索出该机构所编纂(制定)的所有术语;
按年代检索出术语编纂的年度变化情况。
c) 组合属性检索。
同属性或不同属性的组合检索。
检索技术应满足GB/T 13725-xxxx中8.2的各项要求。
5.3 查重与数据校验
应设计查重功能,数据校验功能应根据GB/T 13725-xxxx中8.1.2的要求设计。
5.4 术语库重组与重构
a) 根据需要,设计数据库重组功能,自动的回收已删除记录所占的存储空间,并重新加以利用。
b) 当需要时,可改变存取控制、硬件配置、数据库分布以及修改数据结构等。
5.5 恢复、备份和重新启动
应支持术语库的恢复、备份和重新启动。由于误操作、程序出错或其他意外原因(例如掉电)需要重新启动时,使用备份;
由于人为或意外原因造成术语库的破坏时,应能:
a) 查明错误的原因;
b) 查明错误的影响;
c) 纠正错误;
d) 纠正后继续工作。
5.6 定义默认值
应按照GB/T 13725-xxxx 中8.1.3的要求,根据需要定义默认值,便于字段内容的自动或半自动生成与修改。
5.7 数值处理
应根据需要设计数值处理功能,例如术语和定义的平均长度,某一长度的术语数量及百分比,年术语生成量、使用量、某一用户使用术语库的情况,某一机构编纂术语的情况等。
5.8 排序和打印
字顺排序应符合GB/T 13418的规定。
根据需要设计排序和打印功能以满足下列要求。
a) 应能生成和打印按概念体系排序的术语词汇或词典;
b) 应能生成和打印按外文字母顺序或汉语拼音排序的英—汉、汉—英对照词汇或词典,或其他外语与汉语对照词汇或词典;
c) 应能生成和打印同义(近义)词汇或词典;
d) 应能生成和打印反义词汇或词典;
e) 如果需要,还应能生成语料的有关信息,例如按术语使用频率排序、按术语与其他术语组配频率排序等。
f) 其他功能。
5.9 程序设计语言接口
应能提供某种常用程序设计语言的接口,允许使用该程序设计语言编写自己的应用程序,开发某些特殊功能。
5.10 网络支持
应能实现网络查询、数据搜索和数据下载等网络应用的基本功能
5.11 其他
a) 数据输入应符合GB/T 13725-xxxx中8.1的要求;
b) 数据显示应符合GB/T 13725-xxxx中8.3的要求;
c) 数据安全性和保密应符合GB/T 13725-xxxx中6.1.7和8.6的要求;
d) 数据传递和数据交换应符合GB/T 13725-xxxx中7.7和第10章的要求;