FOLIO的元数据管理和编目业务.pdf
《FOLIO的元数据管理和编目业务.pdf》由会员分享,可在线阅读,更多相关《FOLIO的元数据管理和编目业务.pdf(12页珍藏版)》请在咨信网上搜索。
1、工作探索FOLIO的元数据管理和编目业务*宋琳琳,蔡思妍*本文系国家社科基金项目“图书馆编目数据化的理论与实践研究”(项目编号:20btq017)研究成果。0前言我国图书馆正步入关键转型期,在关于推进实施国家文化数字化战略的意见指导下,新一代图书馆系统需要实现跨层级、跨地域、跨系统的数据流通和协同治理,推动不同层级、平台和主体间的文化数据分享1。元数据作为资源组织、整合与服务的基础,是过渡到新一代图书馆系统的关键。元数据建设从专业本位转变为社会分享,“元数据就是服务”,它聚焦“实体”的多元呈现,采用先进适用技术和现代分享手段,利用“下一代元数据”(Next Generationof Metad
2、ata)框架改善信息检索方式2。下一代元数据在元数据模型上要求开发的关联数据模型灵活、可扩展;在元数据管理上强调不同格式、位置和环境中元数据的应用;在元数据发展上强调探索和尝试使多领域专家有效协作的元数据工作环境;在元数据迭代上要求图书馆学习适用BIBFRAME,同时进行传统的书目控制3。新一代图书馆系统FOLIO在元数据管理方面的创新体现为Codex的建立和编目工作的变革。Codex由FOLIO数据模型工作组负责,资源管理特殊兴趣小组和元数据管理特殊兴趣小组参与建设4。Codex应用轻量级(简化)的元数据模型来描述资源,可以映射到大多数现有的元数据模型,从而提供一个共同的词汇表。Codex提
3、供规范化的描述,消除编码和格式上的差异以及管理方式的差别,为所有资源提供一个单一的表摘要文章从概念模型和数据模型两方面分析Codex的实体及其关系,比较Codex与BIBFRAME的异同。在此基础上,揭示Codex在FOLIO中发挥的分层次描述、解决数据纠缠、协同EMA管理实体和元数据管理等功能;从编目规则、编目工具和流程两大方面系统梳理FOLIO的编目方案及Codex的作用。关键词FOLIOCodex编目元数据引用本文格式宋琳琳,蔡思妍.FOLIO的元数据管理和编目业务J.图书馆论坛,2023,43(10):96-107.FOLIOs Metadata Management and Cata
4、loging ServicesSONG Linlin&CAI SiyanAbstractThis article analyzes the entities of Codex and their relationships in terms of conceptual and datamodels,and compares the similarities and differences between Codex and BIBFRAME.On this basis,it identifiesthe functions offered by Codex in FOLIO,such as hi
5、erarchical description,data entanglement solution,collaborative entity management with EMA and metadata management.It systematically examines the catalogingscheme of FOLIO and the role of Codex in two aspects:cataloging rules,cataloging tools and processes.KeywordsFOLIO;Codex;catalogue;metadata96202
6、3年第10期工作探索述,由此实现规范化。此外,Codex跨越存储位置建立资源管理的虚拟化层,保障FOLIO整合各种元数据,允许不同资源使用一个共同的词汇和描述,由此实现虚拟化。1文献综述新一代图书馆系统既与传统图书馆系统兼容,又灵活支持图书馆的各项创新。美国国会图书馆已于2022年宣布采用FOLIO平台。国内学者的研究介绍了Codex元数据模型和实体的基本情况:许磊等研究Codex与不同书目格式间的映射5、Codex元数据管理方案和FOLIO的实体管理6;周纲等介绍Codex的查询和管理资源关系的功能7;王文清等分析Codex元数据模型及其实体的特点8。较少研究从宏观视角分析FOLIO平台的元
7、数据管理流程,尤其缺少FOLIO编目业务的探究。国外学者研究主题包括但不限于Codex方案和FOLIO编目功能。Peter介绍Codex理念9;Natascha等以典藏应用程序(InventoryApp,典藏)为核心,辅以FOLIO编目框架介绍FOLIO编目功能10;Kristen介绍Codex元数据模型、Codex记录来源及其编辑方式、Codex简要的工作流程11;Lynn等以编目为切入点概述Codex与其他域的交互,介绍Codex的实体及对应元数据元素12;Charlotte从数据导入、原始编目、复制编目和数据清洗 4 个方面系统介绍FOLIO编目功能13。笔者以FOLIO的元数据管理为核
8、心,系统梳理FOLIO元数据管理中数据的流转与应用,从规范控制和实体管理的角度研究FOLIO的编目创新,更好地发挥元数据在资源服务中的作用。2Codex元数据模型Codex元数据模型基于“图书馆参考模型”(IFLA Library Reference Model,IFLA-LRM),受BIBFRAME2.0的启发,在参考相关书目格式、复用通用元数据的基础上设计而成。Codex与IFLA-LRM连结,与书目世界的其他编目规则和书目格式关联。作为数据模型,Codex模型简易轻便、跨越存储位置,提供资源的单一表示和保障映射。2.1Codex七大实体Codex元数据模型14包括七大实体(见图1),方框
9、的实例(Instance)、单件/馆藏(Item/Hold-ings)、资源包(Container)、馆藏地(Location)和收录范围(Coverage)是模型已有的实体;圆框的作品(Work)和主题(Subject)是待添加到模型的实体。除Codex,FOLIO其他资源管理应用程序也有专用数据模型和实体,如典藏数据模型及以Codex格式编码和存储的实体15,可与Codex对应实体高效联通。与此同时,FOLIO实体管理应用程序(Entities Management Application,EMA)中已设置作品(Works)和主题(Subjects)两类实体,而现有Codex模型却未补充作
10、品和主题实体。由于EMA注重规范控制13,因此Codex后续完善模型是必要的。作品连接连接包含连接包含资源包实例主题单件/馆藏单件/馆藏有有收录范围馆藏地包含图1Codex元数据模型14(1)单件/馆藏。虽然单件和馆藏含义不同,但从数据建模角度看,描述二者的元数据元素集存在大范围重叠,因此Codex使用同一实体表达两个概念14。单件是实例特定材质的副本,包含识别和追溯单篇文献的信息(如条码)。通过数据共享,单件从父级实例继承诸多字段。父级实例字段的变化会同步到单件。FOLIO支持在单件级别编辑继承字段。馆藏用于描述图书馆与单件的关系,以便图书馆管理。97工作探索(2)资源包。资源包是为了使Co
11、dex在资源包的层次上封装、调控资源。这种个性化定制使图书馆能够不受数据商捆绑机制限制,自定义分组资源,掌握配置资源的自主权。(3)馆藏地和收录范围。考虑到FOLIO可能需要复用馆藏地和收录范围,为说明二者的可重用性,馆藏地和收录范围被提取为实体14。二者还可以作为字段嵌套在更高级别的实体中,如资源包的元数据元素集中有可被调用的收录范围14,因此二者具有双重身份。2.2Codex元数据元素受DC最小化原则启发,Codex筛除或扩展DC的15个内容元素,形成一套通用且量少的元数据元素集。表1中的通用元素支持资源管理应用程序中各类资源的描述,既包括常用元素contributor、title 和 d
12、escription 等,也包括为满足特定功能而设计的 Instance:id,Item:isCustomized 和 Location:parking 等。因此,Codex不仅在揭示和描述资源上具有简单高效和统一管理跨媒体资源的特点,还有与其他元数据模型进行语义互操作的可能。2.2.1特有元素与功用(1)实例的元素:source是返回到源记录的链接,允许图书馆从源记录中提取更多描述性元数据,表明Codex的目标并非提供资源的完整描述,而是提取支持图书馆正常运作的关键元素。identifier为图书馆提供可自定义的类型和值,使Codex资源描述更灵活。(2)单件/馆藏的元素:isCustomi
13、zed用于指示单件继承父级实例的状态,允许单件覆盖父级实例所赋值。这在外部知识库更新时十分必要;在FOLIO外部编目时,为防止图书馆无法编辑相关实例字段,覆盖操作是图书馆在单件级别控制相关内容的有力措施。(3)馆藏地的元素:parking提供可由图书馆自定义的类型和值(如Name=LC Call Number,Value=PN2001.R2502022),用于定位馆藏。2.2.2元素来源Codex元数据元素来源广泛,有的由系统自动匹配,如Instance:id是用于区别平台多来源元数据的特定编号;有的源于DC,与DC中的对应元素基本一致,如Instance:contributor;有的继承父级
14、实例,强调元素的复用和跨层实体的数据共享,如Item:title;有的直接调用别的实体,被调用的实体作为一个数据对象发挥效用,如Container:coverage。2.3与IFLA-LRM的联系在元数据模型构建中,Codex基于IFLA-LRM层次结构,在EMA作品实体辅助下,通过“集群作品-作品-实例-单件/馆藏”细分实体类型,与IFLA-LRM建立连结(见表2)。EMA作品实体中包含LC Hubs和Share-VDE Opus一类的集群作品(Clustered Work),能够聚合和配置关联作品。IFLA-LRM的“资源(Res)”表示为所有作品的“超类”,同样位于实体的顶层,二Code
15、x实体Instance实例Item/Holdings单件/馆藏元数据元素idtitlealtTitleseriescontributorpublisherdatetypeformatidentifiersourcelanguagerightsversionlastModifiedidinstanceiddescriptiontitlealtTitleseriescontributor(s)publisherdatetypeformatidentifier(s)language(s)rightscopyNumberbarcodeCodex实体Items/Holdings单件/馆藏Containe
16、r资源包Location馆藏地Coverage收录范围元数据元素vendorPackagecoveragelocationitemStatusisSelectedisCustomizedididentifiernamedescriptiontypevendoridvendorplatformitemsitemCountselectedCountcoverageisSelectedidinstitutioncampuslibraryparkingplatformuriidrangestatementembargo表1Codex已实现的实体及其部分元数据元素14982023年第10期工作探索者表现
17、出良好的对应性。此外,IFLA-LRM的“命名(Nomen)”表示实体与指称该实体的名称间的关系,与EMA的主题呼应。Codex数据模型中,实例混合FRBR的内容表达和载体表现,因此可与IFLA-LRM进行对应处理。实例代表一些相对具体的东西,如资源类型(电子读物、印刷读物、有声读物等);不同实例可能汇聚于发现层中。而作品是图书馆将实例聚集在一起的一种方式,支持查找相关实例。虽然Codex与IFLA-LRM层次结构并不完全一致,但彼此的对应为Codex与各种元数据模型的兼容提供保障。在EMA的辅助下,Codex元数据管理更加立体、系统,有助于全面揭示和充分表达资源间的关系,实现资源的互操作和开
18、放共享。表2IFLA-LRM与Codex、EMA间的实体关系IFLA-LRMRes资源Work作品Expression内容表达Manifestation载体表现Item单件Nomen命名CodexWork作品Instance17实例Item/Holdings单件/馆藏EMAWorks(LCHubs,Share-VDEOpusetc.)16作品(含LCHubs,Share-VDEOpus等)Subjects主题2.4Codex与BIBFRAME2.0Codex和BIBFRAME2.0均注重表达实体关系 和 实 现 关 联 数 据 功 能。Codex 受 到BIBFRAME2.0的启发,二者在模型
19、架构和实体设 置 上 具 有 较 高 的 相 似 性。Codex 对BIBFRAME2.0的借鉴主要有以下考虑:一是未来一段时期内,MARC 仍会存在于图书馆,Codex需要满足图书馆既坚守MARC,也拥抱BIBFRAME的需求;二是BIBFRAME2.0支持聚合不同来源的记录以提供资源管理的完整视图,这与Codex集成FOLIO中任何资源以提供单一表示的愿景不谋而合17;三是其他书目格式致力于与BIBFRAME2.0兼容发展,这使得Codex在与这些书目格式映射时具有一定的原生优势。为实现Codex在FOLIO中的中介与虚拟作用,Codex并不严格遵循BIBFRAME2.0,二者间的差异主要
20、体现在:一是Codex中的资源包强调在该层次上对资源的个性化分组,凸显了Codex 对 资 源 管 理 的 支 持。二 是 相 比 于BIBFRAME2.0,Codex元数据模型并没有提供区别作品和内容表达的方法,但从聚合资源角度,为避免混淆作品和内容表达的概念、更契合IFLA-LRM模型,Codex在现有基础上新增集群作品较为可行。三是Codex在类、属性和元素的设计方面具有特点。FOLIO决定资源类型大致对应RDA内容类型,支持图书馆从RDA中取值,也允许图书馆添加额外的词汇表并自定义本地资源类型值。目前 FOLIO 外部编辑工具兼容BIBFRAME等格式;图书馆还可调用应用程序编程 接
21、口(Application Programming Interface,API)实现实体映射,并在实体管理工具的作用下进行规范控制。3基于Codex的FOLIO资源管理3.1分层描述体系域、模块和应用程序是FOLIO资源管理的核心概念。域是模块或应用程序的组合,如Codex 域包含应用程序 Codex Search、模块mod-codex-mux和mod-codex-ekb等。一个应用程序通常包含多个模块18,如典藏包含模块 mod-inventory 和 mod-inv-storage。不过,模块的定义更为广泛和宽松,有时也会代表FOLIO的微服务19。FOLIO的核心是资源管理,对各域资源
22、描述的广度和深度不做同一化要求。比如,采购域关注所购资源的价格,而编目域不会注重采集与存储同资金交易相关的信息18。FOLIO根据资源描述的细节深度和服务目的将其分为不同层次,形成分层描述体系,见图2。在 分 层 描 述 体 系 中,从 统 一 记 录 层(Unifying Records)到 业 务 记 录 层(WorkingRecords),再到正式记录层(Formal Records),资源描述的广度依次下降而精度逐层提升,见表3。在实际应用中,位于顶层的 Codex 借助99工作探索Codex Search,深入到业务记录层(如典藏)再到正式记录层,无须顾虑资源编码和格式差异,搜索与定
23、位平台所有资源。比如,馆员想要查看西游记的详细编目记录,首先使用CodexSearch锁定典藏,随后基于业务记录层和正式记录层间的连接,查看 西游记 的底层编目记录。3.2解决应用程序间的纠缠问题在FOLIO中,理论上模块只需关注与保障自身功能的交付,但在实践中域总是作为整体发挥作用,域内模块间存在必要的交互以保障域的高效运作。在交互时,模块可以保留其他模块的接口信息,以自我为中心建立多重连接,但这必然与其他模块产生依赖,导致模块纠缠,降低平台灵活性。FOLIO通过Codex实现模块间的交互。Codex充当代理的角色,集成各模块,将繁杂的交互关系转化为线性依赖,进而使平台成为立体架构。模块无需
24、管理自身与其他模块的关系,只需与Codex集成18。实际应用中,图书馆为确保用户访问资源,可能在多个系统上重复购买电子书。Codex的引入为资源管理提供了统一完整的视图,使得图书馆可以从顶层出发访问不同域的资源,确保图书馆不会迷失在不同域中而重复购买资源,节省成本。在微服务理念的指导下,FOLIO通过Codex联系各个部分以支持彼此交互,将待处理问题由大化小。Codex的代理角色被认为是FOLIO有别于传统集成图书馆系统的一大亮点。3.3协同EMA管理实体FOLIO中各域基于实体完成本域的既定任务,并依赖实体在不同域间构建的关联实现域间协调运作,由此可见实体及其有效管理在FOLIO中十分重要2
25、0。Codex的实体通常会与EMA的实体整合应用。考虑到FOLIO大型管理任务或工作区域一般配有相应程序以提供专门功能,实体管理工作组将EMA作为其工作区域单独的应用程序13。EMA 是 FOLIO 集成内外部实体的桥梁,是 FOLIO 管理受控实体的中心。对于FOLIO内的实体,EMA为本地定义的实体提供持久的 URI 创建、维护、发布和存储。对于FOLIO 外的实体,当其被导入到 FOLIO 时,EMA会发现和报告,并与导入实体匹配。EMA与Codex的区别在于:Codex是一种规范极简的元数据模式,旨在处理FOLIO的描述性元数据,包含FOLIO所有应用程序必须理解的高级子集,侧重于管理
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- FOLIO 数据管理 编目 业务
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。