• 读者文摘
  • 美文摘抄
  • 短文摘抄
  • 日记大全
  • 散文精选
  • 感恩亲情
  • 人生感悟
  • 智慧人生
  • 感悟爱情
  • 心灵鸡汤
  • 实用文档
  • 名人名言
  • 伤感文章
  • 当前位置: 蜗牛文摘网 > 心灵鸡汤 > 对图书编目系统DC元数据与MARC格式数据的探讨 文献编目元数据

    对图书编目系统DC元数据与MARC格式数据的探讨 文献编目元数据

    时间:2019-01-28 17:50:56 来源:千叶帆 本文已影响

         随着网络的发展,越来越多的文献以电子资源的形式出现,网络资源的组织、整理、检索等问题日益突出。如何将网络信息资源纳入馆藏进行管理和利用。实现信息资源利用的最大化,这是图书馆编目人员面临的新课题。为了解决数字资源的有序化,元数据这一概念应运而生。元数据是数据集合,主要用来描述数据的特征和属性,进而达到网络资源的组织、分类、索引等目的。元数据的发展呈多元化的格局,DC和MARC两种元数据发展比较成熟,在图书馆界得到广泛的认可;两者并存互补是图书馆信息资源组织的发展趋势。
      一、DC元数据与MARC格式的产生
      (一)DC元数据。1995年3月,由OCLC和NCSA(美国国家超级计算应用中心)联合在美国俄亥俄州的都柏林镇召开的第一届元数据研讨会上,产生了一个精简的元数据集――都柏林核心元数据集,简称DC。围绕如何用一个简单的元数据记录来描述种类繁多的电子信息,使非图书馆专业人员也能够了解和使用这种著录格式,达到有效地描述和检索网上资源。此项工作在OCLC等机构的参与下有条不紊地进行着,到2000年底共召开了8次DC元数据研讨会,并进行了补充和修订。第8次会议由加拿大国家图书馆主持的元数据研讨会,在加拿大的渥太华召开。会上总结了在DC修饰词、DC标准化、DC作为元数据的语法、应用属性等方面工作的进展情况,并对元数据的结构问题、应用属性、都柏林核心注册,特殊领域的元数据作为重点议题进行了研究。DC元数据被确定是一套包含15个基本元素和44个限定词的元素集。这15个元素依据其所描述内容的类别和范围分为3个广义认可的大类:资源内容描述类元素部分(题名项、主题词项、描述项、语言项、来源项、关联项、覆盖范围项);知识产权描述类部分(著者项、出版者项、合作者项、权限项);外部属性描述类部分(日期项、类型项、识别符项、格式项)。44个限定词又分为元素精确描述和元素编码描述两种。2001年10月在日本东京召开了DC元数据应用国际会议,使DC元数据进入了应用阶段。美国数字图书馆目录、美国医学元数据项目、美国教育资料网、欧洲图书馆及电子资源中的数字资料EVLER、法国国家数字预出版物和论文项目、德国元数据项目等。中国数字图书馆工程及上海数字图书馆的元数据解决议案均基于都柏林核心元素集。
      (二)MARC格式数据。MARC格式最初是由美国国会图书馆以阿芙拉姆夫人为首的一个小组于1965年研制的一个选进计划。其目的是探索以机读形式产生目录数据的可行性。为了使各国MARC之间能够对应,国际标准化组织于1973年制定了《磁带上文献目录信息交换格式》指出,一条MARC记录必须由一些具有字段指示符的变长字段组成。该记录由四个部分构成:记录头标区、记录目次区、记录数字区和记录分割区符。为了防止失控和方便国际交换,国际图联于1977年研制出“Universal MARC Format”,简称UNMARC。作为一套用于描述、存储、交换、控制和检索著录数据的机读书目数据标准,MARC经过近50年的发展,它具有严格的语义规则和完整的信息描述手段,尤其是对检索点的选取,能够确保其数据元素组成具有统一性。可以说是目前系统最完善、结构最复杂、标准最严谨的元数据格式,已成为世界上流行最广的书目数据标准;运用MARC著录的信息,具有可靠性、完整性、精确性等。在经过不断的进化与扩充后,MARC已能够被用来描述及存取网络资源,通过856字段(电子文件地址与检索),MARC记录与电子文档建立超链接,成为一个网络信息资源发现与检索的可行标准。我国中文采用CNMARC、西文采用USMARC两种标准;CNMARC是我国书目记录的主流格式,为社会各界广泛采用,CIP(在版编目)中心目前也是以CNMARC格式散发CIP数据。由于不同国家的需求,欧洲采用的是UNMARC,英国采用的是UKMARC,美国采用的是USMARC等。
      二、DC与MARC特点
      DC与MARC都是元数据的一种,在对信息资源的组织方面,印刷型文献的著录和标引采用的是MARC格式;而数字化资源、网络化资源则是采用DC元数据格式。因此,我们可以看到DC与MARC的相似之处与区别。它们的目的相同,都是对信息资源本身的特征和属性进行描述。通过对信息资源特征的描述与揭示,帮助读者在茫茫的书海中尽快地找到所需文献,以帮助用户对网络信息实现有效、快捷、准确的查找。但由于两者产生的信息环境、描述对象不同,所以又有诸多差异,各具特点。
      (一)DC与MARC的特点。(1)DC的特点:简单灵活,DC只有15个元素,元素的含义易学易记,非编目人员也能很快学会使用,为网页制作者提供了一种网络信息的著录格式。它可以用于规范的资源描述领域(如图书情报),也可以用于非专业领域(如网页),它规定所有元素都可以重复使用,解决了多著者和多版本等重复因素的著录问题。互操作性,网络信息资源涉及的学科领域广泛,每个学科都有自己的专业术语以及用语特点,DC只选用了最重要的15个基本著录项目,在各种语言中都保持不变,使不同学科和语言的资料产生了语义上的相互可操作性,大大提高了网络资源的可利用率。(2)MARC的特点:它是用于描述、存储、交换、控制和检索著录数据的一套机读书目数据标准。是目前系统最完善、结构最复杂、标准最严密的元数据格式;有严格的语义规则和完善的信息描述字段,能够精确地描述信息资源,特别是对检索点的选取能够确保其数据元素组成具有统一性和著录信息的可靠性及完整性。
      (二)DC与MARC的区别。(1)创建者不同。DC产生的最初动机是为网络资源的作者自己描述其资源而提供的一种格式,因此DC的制作者的范围比较广泛,包括内容提供者、作者、出版发行者等,而这些人员不需要经过专业培训。而MARC的制作者则是经过专门培训的图书馆编目人员。⑵可靠程度不同。MARC运用版本的概念来提高用户识别和选择所需资源的能力,对原始数据进行了增值处理。而DC元数据没有建立规则和过程来控制数据元素的内容,所有元素都是可选的,因此DC的可靠性低于MARC。⑶知识检索有效度不同。DC整体框架简洁明了,由15个核心元素构成,只能大略反映资源状况。而MARC一直追求著录完整、详尽,对著录源的描述更为丰富。因此MARC的知识检索有效度比DC高。⑷适应对象不同。DC是用来描述网络信息资源的,是分布式的,它们并不存储于同一个地方,而是分布在不同的数据服务器上,具有严格的格式化特征。而MARC则是基于传统的印刷型文献,不适合对一般网络信息资源描述。⑸标准化程度不同。DC标准仍处在不断发展研究之中,而MARC的标准化发展已相对成熟,已成为世界上流行最广的书目数据标准。
      三、DC与MARC同时使用共存互补
      (一)虽然DC元数据简单易用,适应性强,但因为迄今CNMARC是我国书目记录的主流格式,为社会各界广泛采用,CIP中心目前也以CNMARC格式散发CIP数据。“自动编目”所产生的书目记录必须与其一致,否则就没有使用价值。而DC元数据格式,虽有不少人主张以其代替MARC格式,但并未见以DC编制的书目记录;所以只有从中文图书自动编目的具体应用出发,对CNMARC进行调整,在调整后的字段、子字段表中,列出与每一子字段相对应的DC元数据核心元素名称及修饰词。从历史发展进程看,MARC格式是传统编目工作的延续。而正是其对保存文化遗产的贡献,在计算机系统采用定长字段,MARC格式是一个创举,LCMARC是最早用计算机存储书目信息的一个成功范例,是系统最完善、字段最复杂、标准最严密的书目格式。面向数字化未来前景,在信息资源处理中使用DC是发展的方向。但DC元数据便于数字信息资源的自动处理,且偏重信息检索;将其应用于非数字信息资源处理,特别是目前的图书馆业务管理,就有其不完善之处,所以在DC元数据的应用与CNMARC发生矛盾时,这就需要我们不断加以改进做出妥协,才能使人类延续数千年的文化遗产能够继续发展,并不断取得新的突破。
      (二)尽管数字化浪潮的冲击改变了社会的发展进程与人们的生活方式,但数字化社会的进程是渐进的,数字与非数字的生活方式将长期共存。在这一社会背景下,也就不可能有纯粹的数字图书馆。作为社会收藏,组织、利用信息资源的图书馆,其数字化进程必然也是渐进的,也就要具有同时处理数字与非数字信息资源的能力,因此出现了“复合型图书馆”的概念。在这样一个数字与非数字共存的“转型期”,不可能以某一种元数据格式处理所有的信息资源,在制定统一处理数字与非数字信息资源的元数据方案时,同时采用DC和MARC等多种元数据格式,发挥各自的长处是必要的。尤其是实现中文图书自动编目的“复合型出版系统”,本身就要同时处理印刷版与数字版两种载体,必须兼用DC元数据与CNMARC之间的互操作就非常重要。
      (三)当前,图书馆正处在纸质文献资源与数字信息资源共存的“复合型图书馆”时代,它是当前和今后较长时期内图书馆的实际运行状态。大多数图书馆都存有数以万计的MARC格式的书目数据。DC元数据的出现并不是为了取代描述模式更加丰富的MARC,而是为了给编目人员和非编目人员提供一种更加简单的资源描述格式。而MARC格式在网络环境下也在不断完善和修改,今后的发展趋势是各种规范的元数据都能够根据一定的原则共存于一个平台上,共存共荣,相互补充。数字图书馆在迅速发展,传统图书馆的职能将继续发挥,将传统资源及其服务与数字资源及其服务有机整合成为统一的“复合型图书馆”模式,为不同类型、不同需求的用户提供机会平等的服务,发挥各种资源的最佳效益,不断完善信息资源的描述。针对MARC与DC元数据的不同特点,取长补短,发挥各自特长,应当成为现阶段和今后一个时期图书馆建设与发展的现实目标。
      
      参考文献:
      [1]罗少芳.DC元数据的发展前景分析[J].广东技术师范学院学报,2006,(4):9―12.
      [2]曹咏梅.DC元数据与MARC的分析比较[J].情报杂志,2004,(3):105―106.
      
      (作者简介:赵英,青海大学图书馆采编部主任,研究馆员。研究方向为信息资源编目。)
      

    相关热词搜索:编目数据探讨格式

    • 名人名言
    • 伤感文章
    • 短文摘抄
    • 散文
    • 亲情
    • 感悟
    • 心灵鸡汤