从档案学视角看网站文件的归档.docx
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 档案学 视角 网站 文件 归档
- 资源描述:
-
从档案学视角看网站文件的归档 随着电子商务和电子政务的兴起,政府和企业以及其他机构纷纷建立自己的门户网站,将现实机构虚拟化,通过网站发布信息,提供服务,实现其管理和服务职能,极大地提高了办公效率,增强了办公的透明度。网站已经成为机构在网络空间开展业务活动的主要平台,网站开展业务活动的过程中形成许多具有原始记录性的电子文件,这些网站文件对于组织机构和人类社会来说都具有重大的意义。 网站文件是指组织机构在处理业务活动过程中,通过网站形成的、具有原始记录性的电子文件,包括网页、后台数据库文件、程序文件等。网站文件能够真实地反映出组织机构通过网站进行的业务活动的轨迹,具有凭证价值和情报价值。 一、网站文件归档的必要性 网站文件是社会活动中直接形成的原始性信息记录。对于组织机构来说,网站文件是组织机构在进行业务活动的过程中直接形成的原始记录,属于组织机构活动的证明。对于整个社会来说,网站文件是构成社会记忆的重要组成部分,是沟通历史的桥梁,具有历史性。但网站文件具有更新快、寿命短以及惟一性的特点,这就使得网站文件的保存必须要及时、可靠。 二、网站文件归档的可行性 就世界范围来看,由图书馆来承担的网页收集项目对网页的捕获、归档、存储都进行了研究,并在实践中取得了可喜的成绩,但是鉴定的角度不同,图书馆更加关注的是网页的文化价值,而忽视了其原始记录性,对于元数据捕获也没有给予足够的重视。笔者认为,网站文件归档的任务应当由档案部门来承担,档案学理论可以借鉴到网站文件归档中来。 1、电子文件管理对网站文件归档的借鉴意义。网站文件本身就属于电子文件的范畴,可以按照电子文件的管理方法进行管理,网站文件的生成、发布、捕获、归档、利用是一个完整的运动过程,应当对其全程控制,不仅保存网站文件本身,还要连同元数据、变化日志、插件程序等一起保存,才能保证网站文件的真实性和完整性。 2、来源原则对网站文件归档的借鉴意义。面对浩如烟海的网站文件,最好的方式就是以网站为单位进行保存,同一个网站的所有网站文件保存在一起构成该网站的“全宗”。网页与网页之间的链接关系和网页与程序文件的依附关系也不能被破坏。目前美国的互联网档案馆已经体现了“来源原则”。 3、档案鉴定理论对网站文件归档的指导作用。早在20世纪80年代,法国档案学者罗尔德·瑙格勒提出了电子文件的“双重鉴定论”①,一方面要判断电子文件信息的有用程度,另一方面要判断电子文件有用程度实现的可能。网站上的信息以多种格式存在,并且具有多种表现形式,需要从技术上判断其有用程度实现的可行性。对于网站文件内容上的鉴定,可以借鉴加拿大档案学者特里·库克的“宏观鉴定战略”,从能否反映该机构的职能,能否反映当时的社会环境,能否满足人们的社会期望等角度进行鉴定。 4、档案部门理应承担网站文件归档的责任,由机构档案室对本机构网站包括内联网和外联网上的网站文件进行归档,公共档案馆对所有的公共网站上有价值的文件进行保存。 三、网站文件的归档策略 1、网站文件归档范围的确定 并非所有的文件都成为档案,同样,并非所有的网站文件都具有长期保存的价值,因而需要制定一个策略决定哪些需要归档,需要保存多长时间。 从内容上来看,有两种基本的收集方法:广泛收集法和选择收集法。广泛收集法是通过自动捕获软件收集网络上的一切资源。②选择收集法由人工进行鉴别有价值的文档然后再进行收集。③。 从技术上来看,应当归档的文件包括:系统软件、自动化软件的结构文件、日志、cookies、索引、图形、文本、出版物、图像、音频、视频。 2、网站文件的捕获策略 捕获策略取决于网站的类型和复杂程度,最常用的两种捕获方式是:对象驱动法和事件驱动法④。适合于由HTML文件构成、不能实现交互功能的网站。事件驱动法主要是捕获网站和用户之间发生的事件或事务,适用于数据库驱动的动态网站。两种方法的最大不同就是着眼点不同,对象驱动法关注的是构成网站文件的对象,而事件驱动法关注的是网站和用户之间的单独的一个事件。 以上两种方法讲的是什么元素需要捕获,并没有说明捕获时间。捕获的时间取决于网站变化的范围和频率。网站更新存在以下四种情况:经常更新,更新间隔的时间是三个月以内;不经常更新,更新间隔的时间是三个月以上;有规律地更新,按照计划有规律地进行变化;不规律地更新,没有按照计划进行更新,更新时间比较随意,更新间隔的时间也是不确定的。按照以上四种变化情况,网站可以分成以下四种类型:规律且经常更新的网站、规律但不常更新的网站、不规律但经常更新的网站、既不规律也不经常更新的网站。捕获网站文件的时间是由网站的变化情况来决定的,跟踪不规律但经常更新的网站难度很大。 3、网站文件的保存策略 由于计算机软件和硬件的不断更新,今天还存在的电子文件十几年或几十年后未必能够读取。除了HTML文本文件属于非专利的形式外,网站上包含许多专利格式,例如,Java程序、ActiveX程序、.jpg格式文件、gif格式文件、.tiff格式文件等都是网站的构成要素,所以仅保存HTML文本文件是远远不够的。网站的内容、结构、背景都要保存,脚本程序和插件程序也需要保存,对于网站文件来说,元数据和数据同样重要。 网站文件的保存方法主要有数据考古、仿真法(Emulation strategy)和迁移法。数据考古是由格拉斯哥大学的Seamus Ross 提出的一种方法,也叫数字考古⑤,是将在当前软件下生成的且以当前格式保存的电子文件移动到电子文件管理系统中,直到将来利用的时候才将其转移到新技术环境下。仿真法是指用一个计算机复制另一个计算机的运行活动的过程,仿真计算机能够逼真地模拟原始计算机,并将其取代⑥。迁移法指的是把数据从一种过时的数据格式移动到当前使用平台,例如将word97格式保存的文件移动到office2007软件平台中。与数据考古和仿真法相比,迁移法在实际中的应用更为广泛。数据考古只能作为一种短期战略,并非长久之计,而仿真法仍然处于理论探索阶段,并且对技术具有很强的依赖性。所以,迁移法是目前惟一的长久保存方法。⑦ 四、网站文件归档存在的问题 虽然网站文件归档的项目已经展开,人们对网站文件的关注程度逐步上升,但是目前网站文件归档尚处于探索阶段,仍然存在许多问题,尤其是国内网站文件归档的有关研究还是相对滞后的。 1、动态网页的捕获问题 动态网页一般都有后台数据库做支持,具有很强的交互性,网页会根据用户的要求和选择而动态改变和响应,用户的客户可以在网站上留言发表疑问、建议和意见等。动态网页的组成要素都是通过数据库自动生成新的页面,无须手动更新,例如在线采购系统、商务交流系统中的订单都是自动生成的。 2、网站文件管理流程该如何设定的问题 文件的流程管理属于业务活动的特殊流程,负责管理组织机构所有业务流程中形成的文件。网站文件与一般的文件管理流程也有所不同,因为网站文件的生成、控制、传播和保存的责任相对比较分散,给网站文件的管理流程设计加大了难度。 3、网站文件的长久保存问题 网站文件长久保存包括软硬件更新对网站文件的再现,网站文件保存体系的构建,备份和容灾系统的建立等。在数字保存方面,OAIS参考模型已经成为公认的标准,网站文件的保存也可以借鉴OAIS参考模型,实现长久保存和利用。另外,也有人提出了建立软件和硬件博物馆来实现数字文件的长久保存。 4、相关的法律问题 比如,着作权问题,网站文件的作者是无法明确的,有些还是匿名的;编辑权问题,包括URL链接的相对变更、文字编码转化、信息单元表现形式的变更⑧;采集权问题,档案部门是否有权对网页进行下载、复制、备份;长期保存权问题,保存机构是否可以无限期拥有作为国家文化遗产的网站;公布权问题,保存机构捕获网站文件之后是否具有公布权;隐私权问题,在对网站的利用过程中是否侵犯了网站形成者的隐私权。这些都是迫切需要解决的法律问题。 谢伦伯格曾经说过,“电话是掠夺历史的盗窃者”,在人们享受网络带来的便利的同时,有没有意识到网络带走了历史呢? 注 释: ①哈德罗·瑙格勒:《机读文件的档案鉴定:一份“文件与档案管理规划”纲要性研究报告》,联合国教科文组织,1984年。 ②http:/// ③http:/// ④Dollar Consulting. ARCHIVAL PRESERVATION OF SMITHSONIAN WEB RESOURCES: STRATEGIES, PRINCIPLES, AND BEST PRACTICES. http:///pdf/dollar_ ⑤Seamus Ross and Ann Rescue of Digital Material. ⑥Jeff Emulation to Preserve Digital Documents,原文:”Emulation as a process in which one computer is used to reproduce the behavior of another computer with such fidelity that the emulation can be used in place of the original computer” ⑦David and Chimeras in the Preservation of Electronic Records. ⑧钟常青、杨道玲:《Web资源保存中的法律问题探讨》,《情报理论与实践》2006年第3期。展开阅读全文
咨信网温馨提示:1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。




从档案学视角看网站文件的归档.docx



实名认证













自信AI助手
















微信客服
客服QQ
发送邮件
意见反馈



链接地址:https://www.zixin.com.cn/doc/687094.html