档案数字化光盘标识规范
档案数字标准化是实现互联互通、资源共享、业务协同的基石,档案数字化建设同样需要坚持标准化原则。
我国 1998 年提出了信息化建设的二十四字方针(统筹规划、国家主导、统一标准、联合建设、互联互通、资源共享),其中第三条就是统一标准,由此可见标准化对于档案数字化建设的重要作用和意义。
档案数字化一般分两块,一部分是纸质的“老档案”,这部分档案是过去计算机技术未大面积普及的情况下,手工书写、纸质化保存、库房存储。
采用人工方法进行查阅无需计算机就可以直接查看的纸质档案形式。
一部分是现在不断生成的“新档案”,这部分档案是在当前计算机技术、通信技术、网络技术、数据库技术以及多媒体技术等新技术日益普及的情况下。
由计算机生成、各种存储介质保管存储、采用数据库+专用档案管理软件进行日常管理,只有在计算机条件下才可以查看的电子档案形式。
对于“老档案”而言,我们是通过扫描、拍照等方式,转换成为计算机可以识别的图片文件,再对其建立电子目录来实现传统档案的数字化,故要对其生产的扫描型电子文件进行统一。
而对于“新档案”而言,由于文件的生成阶段就是电子文件信息,就要对其文字型电子文件、视频和多媒体电子文件、音频电子文件等文件格式进行统一。
所以说但不管是纸质的“老档案”还是当前的电子文件形的“新档案”,都应该坚持标准化原则,制定相应的标准和规范,按照统一的规范、标准,使传统介质档案数字化,电子文件归档,数字化档案的保管、传递、利用等工作都实现有序化、标准化和规范化,避免出现各自为政,互不兼容,重复建设等现象。
信息化建设必须有标准化的支持,尤其要发挥标准化的导向作用,以确保其技术上的协调一致和整体效能的实现。
档案数字化外包安全管理规范
档案数字化外包安全管理规范
1.总则1.1 为加强档案数字化外包安全管理,确保档案数字化过程中档案实体与信息安全,根据国家有关规定和标准,制定本《规范》。1.2 各级各类档案馆、室等档案部门(以下简称“档案部门”)开展档案数字化外包工作,具有独立法人身份的档案数字化加工服务机构(以下简称“数字化服务机构”)承担档案数字化外包服务,应遵循本《规范》开展安全管理工作。档案部门自行开展档案数字化时,可参照本《规范》实施安全管理。
1.3 本《规范》所称数字化外包档案指非涉密档案,涉密档案数字化按国家有关规定执行。1.4 档案数字化外包安全管理应按照“安全第一、预防为主”的原则,采取科学有效的安全管理措施,应用确保档案安全的技术手段,建立权责明确、覆盖档案数字化全过程的岗位责任制,对档案数字化全过程实行严格监督和管理,确保档案实体与信息安全。2.档案部门的安全管理2.1 成立由主要领导或分管领导同志参加的档案数字化外包管理组织,明确档案数字化管理的部门、人员及其职责。2.2 根据档案数字化总体规划,确定数字化外包档案的范围,提出档案数字化外包安全管理要求和技术指标。2.3 提出档案数字化外包招标文件中有关安全管理的要求,协助制定招标文件,审定合同。2.4 对数字化服务机构的相关资质、业绩、人员、设备和加工软件等进行考察,并了解是否存在违约行为、安全事故等不良记录。在同等条件下,应优先选用具有与数字化加工相关涉密资质的数字化服务机构。2.5 建立档案数字化安全保密制度,与数字化服务机构签订安全保密协议,并对档案数字化加工人员进行安全保密教育。2.6 制订档案实体交接、数字化加工过程管理、数字化成果验收与交接、存储介质管理、档案实体保护等操作规程或规章制度。2.7 建立档案数字化外包项目管理档案,记录档案部门和数字化服务机构实施档案数字化外包项目的全过程。2.8 建立监管机制,对数字化服务机构的保密、安全措施落实情况进行监督、检查,防止档案实体受损、丢失,杜绝数字化服务机构擅自复制、留存、使用档案信息的行为。
3.数字化服务机构的安全管理
3.1 数字化服务机构必须具有工商管理部门核发的有效营业执照,业务范围必须包括档案数字化加工或数据处理类项目。3.2 数字化服务机构的法人必须是中华人民共和国境内注册的企业法人或事业单位法人,股东及工作人员必须为中华人民共和国境内公民,国家另有规定的除外。3.3 数字化服务机构的工作人员必须提供本人身份证明和公安部门提供的无犯罪记录证明,必要时提供政审材料。3.4 数字化服务机构必须与其工作人员签订符合国家劳动法律法规要求的劳动合同。3.5 数字化服务机构的人员数量与素质、技术与管理水平、设施与设备状况能够满足拟承担项目的要求。3.6 数字化服务机构必须制订并执行数字化安全保密制度,制订并执行档案实体交接、数字化加工过程管理、数字化成果验收与交接、存储介质管理、档案实体保护等操作规范和管理制度。3.7 数字化服务机构应建立安全岗位责任制,配备专人负责安全保密工作。3.8 数字化服务机构应对工作人员进行安全保密教育和必要的上岗培训,并与工作人员签订保密协议,明确规定工作人员不得阅读、摘抄、外泄档案内容和其他安全保密责任、义务。安全保密协议应报送档案部门备案。3.9 数字化服务机构必须积极支持、配合档案行政管理部门的安全保密检查。4.数字化场所的安全管理4.1 数字化加工场所一般设在档案部门独立、可封闭的建筑内。4.2 数字化加工场所应符合防盗、防火、防尘、防水、防潮、防高温、防日光及紫外线照射、防有害生物、防污染等安全管理要求。4.3 数字化加工场所应配备满足安全管理需要的视频监控设备,确保档案暂存处、数字化加工工位、服务器、数据导出端及门窗等无监控死角;视频监控系统应由档案部门专人负责,数字化加工场所设于档案部门之外的,档案部门应定期检查视频监控系统,数字化服务机构应将视频监控数据移交档案部门保存;视频监控数据自产生之日起保存不少于6个月;档案部门应定期对视频监控数据进行回放检查,在删除视频监控数据之前,要留存视频回放安全检查记录。4.4 数字化加工场所应配备符合国家标准并满足工作需要的档案装具,用于分别存放待数字化处理和已数字化处理的档案。4.5 数字化加工场所须封断所有档案数字化加工设备的无线网络功能,并定期进行相关检测。4.6 数字化工作人员存放随身物品要有专用储物箱柜,并与档案装具分区放置;数字化加工场所不得有非工作需要的私人物品,包括照相机、摄像机、手机、录音机、笔记本电脑、平板电脑等各类电子设备和各类移动存储介质;严禁擅自将数字化加工场所内的物品带离现场。4.7 工作人员要挂牌上岗,接受身份核查登记和安全检查,严禁无关人员进入数字化加工场所。4.8 工作人员不得在数字化加工场所内从事与数字化无关的活动,严禁在数字化加工区内喝水、进食、吸烟等,严禁携带火种进入数字化加工场所。4.9 档案部门和数字化服务机构应指定有关人员经常对数字化加工场所进行巡查,确保有关数字化加工和管理的各项规章制度和操作规范得到切实贯彻和执行。5.数字化加工设备、网络环境与数据载体的安全管理
5.1 档案数字化加工过程中建议使用档案部门提供的相关设备,使用数字化服务机构设备的,档案部门应当对其进行必要的安全检查。5.2 档案数字化加工使用的计算机、扫描仪等设备,必须采用技术手段或专业物理设备封闭所有不必要的信息输出装置或端口,如USB接口、红外线、蓝牙、SCSI接口、光驱接口等,封闭的装置或端口要定期进行检查。5.3 档案数字化加工过程中推荐使用国产设备并使用正版软件。数据安全与网络监控软硬件必须使用通过国家安全认证的国产品牌产品。除必要的操作系统、杀毒软件、加工软件和第三方安全管理软件外,档案数字化加工计算机不允许安装任何与加工无关的软件。5.4 档案数字化加工网络要与其他网络物理隔离,禁止使用无线网卡、无线键盘、无线鼠标等设备。5.5 档案数字化加工网络环境中应配备具有权限管理、设备管理、端口管理、日志管理和安全审计等功能的数字化加工安全保护系统,准确记录授权用户的访问行为、设备接入和电子档案信息流向等信息。5.6 档案数字化加工系统应具备流程定义、任务分配、过程跟踪、质量检测、成品制作、数据验收、数据备份管理等功能,并分别设置管理员、保密员、审计员,实行“三员分离”。5.7 档案数字化加工过程中建议由档案部门提供计算机等设备的硬盘、移动存储介质以及无法确保数据可靠清除的设备,并逐一进行检查、登记。数字化工作完成后,这些设备必须交由档案部门统一保管或销毁,严禁擅自带走。5.8 用于档案数字化加工的设备和存储介质严禁与其他设备和存储介质交叉使用,非数字化专用的设备和存储介质严禁带入数字化加工场所。5.9 档案数字化过程中使用的移动存储介质和刻录设备应由档案部门指定专人保管,并对使用情况进行记录。档案数字化成果的拷贝和刻录应相对集中。档案部门应指定专人负责移动存储介质数量的清点,数字化服务机构完成拷贝或刻录的数据介质(包括损坏的数据介质)应及时交接给档案部门指定的人员,并办理交接手续。5.10 档案数字化设备和存储介质不得擅自送外维修,必须送外维修的应办理书面审批手续,并由档案部门人员现场监督。5.11 处理尚未开放档案的信息设备的管理和使用应符合国家有关秘密载体管理和使用的相关规定。
6.档案实体的安全管理6.1 档案部门要对拟数字化的档案进行涉密性、完整性、有序性及档案实体与目录的一致性检查。涉密档案要予以筛除,档案实体破损、残缺的要进行登记与处理,档案实体与文件目录不对应的要进行必要的记录或标示。6.2 档案部门人员应按照工作计划分批调档,并与数字化服务机构的档案接收人员进行清点、核对,双方确认准确无误后填写档案交接清单一式两份,注明交接档案的内容、数量、状况、交接时间和经办人等。6.3 档案数字化加工不得损毁档案,出现档案损毁的,需按有关规定进行处罚,并进行修复和登记。需要拆装档案时,应尽可能地保持档案原貌。6.4 档案数字化过程中要建立档案流程单,流程单包括档号、加工工序、设备编号、数量、经手人、加工时间等,数字化加工过程中档案流程单应与档案实体同步流转。6.5 档案数字化过程中发现有涉密标识且无解密标识的档案,数字化外包服务机构应停止该档案的数字化加工,在登记目录后立即将档案移交档案部门。6.6 正在进行数字化加工的档案必须每天入库(柜),不得在加工工位上留存过夜。6.7 数字化档案要专人专柜保管,数字化加工完毕的档案要及时归还入库。对于离库时间较长或有虫霉隐患的档案,应进行消毒杀虫处理。7.档案数字化成果移交接收与设备处理的安全管理
7.1 档案数字化任务完成后,档案部门应组织专业人员按照本《规范》的要求,对向档案部门移交的数字化加工介质(如存储介质、移动介质、备份介质等)、加工监控视频回放安全检查记录、档案实体出入库交接记录、加工人员变更记录等进行安全保密专项验收;凡未开展安全保密专项验收或验收不合格的,不得对项目进行总体验收。7.2 档案数字化成果必须通过完整性、准确性、可用性和安全性检测,检测合格后双方办理数据交接手续。7.3 档案数字化任务完成后,数字化服务机构应会同档案部门拆除其自带加工设备中的硬盘等存储介质,并将其与数字化过程中使用过的其他移动存储介质一起移交给档案部门,并办理相关移交手续。7.4 档案数字化任务完成后,档案部门必须组织专业人员对数字化服务机构所用的设备进行检查,以确保其设备中无信息留存。凡存有信息的,必须作清除信息的安全处理。7.5 数字化服务机构应将档案数字化过程中形成的日志、记录等原始记录材料移交档案部门,作为项目档案内容进行管理。
档案数字化应遵循哪些基本原则
1、基本原则:
纸质档案数字化的基本原则是使档案信息资源准确、方便、快捷地提供利用,使可以公开的档案信息资源得到共享,以满足社会对档案利用的需求。
2、数字化对象的确定原则:
应当对所要进行数字化的对象按照一定的原则和利用方法进行确认,只有符合一定要求的纸质档案文献才能进行数字化。
3、符合国家法律法规的原则:
纸质档案的数字化,必须符合国家档案开放规定以及有关规定。
4、价值性原则:
属于归档范围且应永久或长期保存的、社会利用价值高的档案可列入数字化加工的范围。
5、安全保密管理原则:
确保档案原件和数字化档案信息的安全。
6、完整性原则:
纸质档案数字化的各个环节均应进行详细的登记,并及时整理、汇总,装订成册,在数字化工作完成的同时建立起完整、规范的记录。
扩展资料:
档案整理的步骤:
1、目录数据准备:
按照《档案著录规则》(DA/T18)等的要求,规范档案中的目录内容。包括确定档案目录的著录项、字段长度和内容要求。如有错误或不规范的案卷题名、文件名、贾任者、起止页号和页数等,应进行修改。
2、拆除装订:
在不去除装订物情况下,影响扫描工作进行的档案,应拆除装订物。拆除装订物时应注意保护档案不受损害。
3、区分扫描件和非扫描件:
按要求把同一案卷中的扫描件和非扫描件区分开。普发性文件区分的原则是:无关的重份的文件要剔除,有正或件的文件可以不扫描原稿。
4、页面修整:
破损严重、无法直接进行扫描的档案,应先进行技术修复,折皱不平影响扫描质量的原件应先进行相应处理(压平或烫平等)后再进行扫描。
5、 档案整理登记:
制作并填写纸质档案数字化加工过程交接登记表单,详细记录档案整理后每份文件的起始页号和页数。
6、装订:
扫描工作完成后,拆除过装订物的档案应按档案保管的要求重新装订。恢复装订时,应注意保持档案的排列顺序不变,做到安全、准确、无遗漏。
参考资料来源:安乡县档案局-中华人民共国行业标准纸质档案数字化技术规范
档案级光盘的档案级光盘
为什么要选择档案级光盘做为电子文件归档光盘?1、 档案级光盘在选择材料加工、工艺、和出厂质量检测都有严格的技术指标,从原材料的选择上保证光盘质量。2、 档案光盘首先选择能够在国内大陆进行生产制造的、质量稳定可靠的产品类型,因此目前只能提供2类档案光盘: CD-R/52X/700MB; & DVD±R/8X/4.7GB。 DVD选择8X倍速而不是16X倍速,是因为8X刻录质量更稳定、更可靠,在刻录时间上与16X比也仅多1/3左右,是一个目前最佳的选择。3、 档案光盘与其它光盘产品的区别在于: 注重刻录数据的“可保存性”而非“易刻录性”,因此其品质要求比普通光盘更为严格; 产品厂商必须是中国大陆注册,可对产品质量承担责任,具有可追溯性; 产品有第三方独立权威机构出具批次检测报告; 档案光盘的应用是一个持续的检验过程,与其内的数据寿命等量齐观。4、 档案光盘为国家重要文献资料的数字化保护和存储提供高品质要求的可记录光盘产品,不仅要提出“档案光盘”本身质量的适合档案存储的高标准技术要求,还要建立“档案光盘”使用、保存和数据监测、迁移的规范要求,使相关部门在使用“档案光盘”时做到有章可循、有法可依。为防止假冒伪劣产品,“国家档案局档案科学研究所”和“清华大学光盘国家工程研究中心”于2009年7月共同组建了“光盘保护技术联合实验室”,为档案光盘的产品质量认定和检测提供了技术保证。对每批次的档案光盘,“光盘保护技术联合实验室”将提供第三方独立检测报告,使客户能够放心使用这样的高端可录光盘产品。5、 CD-R和DVD±R档案级光盘的技术指标在达到相应行业标准要求(参见中华人民共和国新闻出版总署 发布:《可录类光盘CD-R 常规检测参数》CY、T38-2007/《可录类光盘DVD-R/DVD+R 常规检测参数》CY/T 41—2007)的基础标准而且高于标准,应该应满足下列指标要求。 1) CD-R档案级光盘记录前,TE ≤0.45,FE ≤0.5;记录后,BLER < 50,E32=0, -0.15< Sym <0.15;光盘温湿度耐候试验,在温度80℃、相对湿度85%的环境条件下,放置96小时,BLER < 150,E32=0。 2) DVD±R档案级光盘记录前,TE ≤0.45,FE ≤0.5;记录后,PIE < 80,POF = 0,-0.05< Asym <0.15, DC Jitter < 9光盘温湿度耐候试验,在温度80℃、相对湿度85%的环境条件下,放置96小时,PIE< 180,POF = 0。
档案录入工作规范
纸质档案数字化技术规范DA/T31-2005
1 范围
本标准规定了纸质档案数字化的主要技术要求。
本标准适用于用扫描仪对各种纸质档案的数字化加工处理。
2 规范性引用文件
下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。
GB/T 17235.1 连续色调静态图像的数字压缩编码
GB/T 17235.2 连续色调静态图像的数字压缩编码
GB/T 18894?2002 电子文件归档与管理规范
ITU(CCITT)G3 二值图像压缩算法
ITU(CCITT)G4 二值图像压缩算法
DA/T18?1999 档案著录规则
档案管理软件功能要求暂行规定国家档案局档发[2001]6号
3 术语和定义
下列术语和定义适用于本标准。
3.1
数字化 Digitization
用计算机技术将模拟图像转换为数字图像的处理过程。
3.2
纸质档案数字 化Digitization of Paper?Based Records
对普通(黑色字迹清晰)的油印、铅印、胶印等印刷件或复印件纸质档案进行数字化及应用的过程。
3.3
数字图像 Digital Image
表示景物图像的整数阵列。一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。在矩阵(或其他)网络上采样一连续函数,并在采样点上将值最小化后的阵列。
3.4
黑白二值图像 Binary Image
只有黑白两级灰度的数字图像。它对应于黑和白的两种状态文字稿、线条图、指纹图等。
3.5
连续色调静态图像 Continuous?tone Still Image
以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字
图像。
3.6
失真度 Distortion Measure
对档案原件进行数字化转换后,在同等测试环境下,数字图像与档案原
件色彩、几何、压缩算法等差值。
3.7
可懂度 intelligibility
表示数字图像向人或机器提供信息的能力。
3.8
清除图像冗余或对图像近似的任一种过程,其目的是对图像以更紧凑的形式表现。
3. 9
分辨率 Resolution
指单位长度内图像包含的点数或像素数。
3.10
TIFF Tagged Tmage File Format
标记图像文件格式。一种基于标记的无损(不丢失信息)压缩格式,用于在应用程序之间和计算机平台之间交换文件。因为它存储图像细微层次的信息非常多,图像的质量也得以提高,故而非常有利于原件为黑白档案的复制储存。
3.11
JPEG Joint photographic Experts Group
联合照片专家组。一种丢失少量信息的压缩格式,尤其适用于屏幕和打印显示,支持所有主要计算机平台和Web浏览器。JPEG格式文件小,影像质量多数情况下均可接受。考虑储存空间及传输效率,原件为彩色的档案可迁此格式复制储存。
4 数字化基本流程
纸质档案数字化的基本流程主要包括案卷整理、目录建库、批量扫描、数据处理、信息存储、检索利用等工序。
4.1 案卷整理
对需要扫描的案卷进行适当整理,做出标识。
4.2 目录建库
为数字化的档案检索而建立必要的目录数据库。
4.3 批量扫描
按照档案数字化具体任务的整体安排按计划分批次进行扫描。
4.4 数据处理
4.4.1 对扫描图像进行校对,确保图像完整无误,并视需要对有问题的扫描图像进行纠偏、去污、拼接等技术处理。
4.4.2 对裸数据进行验收前的相应处理,包括文件的格式转换、逻辑分盘处理、添加说明性文件,以及数据的挂接、检验、上载、质量检查和备份。
4.5 信息存储
根据不同的扫描图像选择适当数据格式、编码方式和存储介质对信息进行保存。
4.6 检索利用
按用户需求提供检索利用。
5 案卷整理
在批量扫描之前,按下述步骤对案卷进行整理,确保档案数字化质量。
5.1 分件
5.1.1 把同一案卷中的扫描件和非扫描件分开。
5.1.2 在扫描件中将大图、照片插入指示页,便于扫描工序批量扫描,实际图像放在图像处理时进行重扫,替换指示页。
5.1.3 填写《数据加工过程处理单》(见附录A),对需要特殊处理的页,标识清楚。
5.2 分页
对批量扫描前的档案进行页号、件号的标注。如在标注中与原档案中的件数、页号不一致,应以此为准。
5.3 拆卷
去除档案中原来的装订物,以便后续扫描工作的进行。
5.4 装卷
按档案保管要求恢复原装订。
6 建目录库
6.1 目录著录
根据DA/T18确定档案著录项,并进行著录。
6.2 数据格式选择
所选定的数据格式通用,应能直接或间接与DBF文件格式或通过XML文
档进行数据交换。
6.3 目录输入
将著录好的目录输入计算机内,建立机读目录数据库。
7 批量扫描
7.1 扫描方式
纸质档案扫描可采用黑白二值图像和连续色调图像两种方式。
7.1.1 页面为单色文字的纸质档案,宜采用黑白二值图像扫描;页面为多色文字图像的档案文件,可采用连续色调图像扫描。
7.1.2 字迹清晰、不带图片的档案材料,采用黑白二值图像扫描;清晰度较差或带有图片的档案材料,可采用连续色调图像扫描。
7.2 分辨率选择
7.2.1 单色页面档案文件,扫描分辨率一般建议选择100~200dpi。
7.2.2 彩色页面档案文件,扫描分辨率可选择100dpi以上参数值进行。
7.2.3 大幅面档案文件,如工程图纸、报纸等尺寸超过A3的,可选用大幅面图像扫描仪(如A0)、大幅面数码平台、缩微照像后胶片数字转换,也可以采用小幅面扫描后的图像拼接。扫描分辨率应选择1OOdpi以上。
7.2.4 需要时可根据原件的清晰度适当调整扫描分辨率。如原件质量较差且尺寸较小,可适当提高分辨率;反之也可相应减少分辨率,增减的多少以扫描后图像按原尺寸显示后是否清晰为准。
7.3 特殊页面的扫描
7.3.1 粘贴页与表格
对于粘贴折页,可用大幅面扫描仪扫描,或先分部扫描后拼接;对部分字体很小、字迹密集的情况,可适当提高扫描分辨率,选择灰度扫描或彩色扫描,采用局部深化技术解决;对字迹与表格颜色深度不同的,采用局部淡化技术解决
7.3.2 一般文本流程图
采用适当的分辨率扫描及局部深化技术,确保文本流程图清晰。同时采用不同设备满足文本流程图的扫描工作。
7.3.3 插图
采用高分辨率灰度或彩色扫描技术将插图与文字一起扫描,保证原来的页面布局和插图清晰。
7.3. 4照片
对于页面中有黑白或彩色照片的文件,采用JPEG格式扫描,确保照片清晰度,同时可避免图像存储空间过大。
7.4 文件命名方式
7.4.1 建立文件夹
扫描时文件夹的建立应按档案实体分级建立,其中的每一份文件也需要单独建立文件夹。
7.4.2 文件夹命名方法,以档案实体中的档号命名,一般为3位数,不足3
位数的左边补“0”。
8 数据处理
8.1 图像处理
8.1.1 纠偏
对扫描过程中出现的偏斜图像进行整体纠正,保证数字图像的偏斜角度小于1度。(图像偏斜不超过页面内半个文字)。
8.1.2 去污
去除数字图像中影响可懂度的杂质。档案数字化图像的去污,应遵循在不影响可懂度的前提下展现原貌的原则。
8.1.2.1 局部去污,如去除黑边、污点。
8.1.2.2 整体去污,可一次性去除页面上的污渍。
8.1.3 拼接
为保证档案数字化图像的整体性,对幅面分离的数字图像进行拼接。
8.1.4 校对
8.1.4.1 一次校对,检查扫描完的图像质量情况,对不合格的图像进行标记退回重新扫描。
8.1.4.2 纠错处理,根据一次校对中提出的诸如污渍、黑边、偏斜、图像质
量等问题,结合《数据加工过程处理单》(见附录A)情况,对每份图像进行相应的处理。
8.1.4.3 二次校对,对一次校对及数据处理后的数字图像再次进行检查,并
标记图像处理过程中不清晰的页面。不合格的退回重新处理。
8.2 数据质量检查
8.2.1 文字录入质量
对录入域清单上所标明的各著录项的文字录入进行正确率控制,保证错误率低于3‰。
8.2.2 图像质量
对纸质文件扫描后形成的图像文件进行清晰度、污渍、黑边、偏斜等问题的控制,以达到要求的图像质量。
保证扫描后的数字图像清晰,便于清楚阅读,适应各种纸张和手写、印刷字的情况。
8.3 数据挂接
档案条目数据与图像文件的对应准确程度的控制。
在生成裸数据光盘之前,根据资料整理信息、扫描前的标引信息及卷内文件页号信息核查图像文件总数是否与实际文件数相等,如不相等则不能生成裸数据光盘,可打印出清单,回退给图像处理人员补扫。
8.4 数据检验
8.4.1 将裸数据进行验收前的相应处理,包括文件的格式转换、逻辑分盘处理、添加说明性文件。
8.4.2 对数据进行检验,给出合格或不合格结论。
8.4.3 将数字加工后的数据转换为裸数据光盘格式,拷贝到活动硬盘上。
8.4.4 系统应自动记录检验进度。
8.5 数据上载
档案数字化各工序的数据通过网络及时上载到数据服务器端汇总,其中数字图像自动搜索对应的目录数据,加入对应的电子地址数字图像文件名,建立起一一对应的关系。
8.6 数据备份
定期对服务器的各类数据进行备份,防止数据丢失。
9 信息存储
以JPEG数字压缩编码或TIFF国际通用标准格式。采用国际标准的传真文档压缩格式压缩后,分别按页编号后分页存储。
数字图像的存储管理应保持原纸质档案的保管模式对应存储。
9.1 压缩存储格式
档案数字图像格式采用TIFF和JPEG数字压缩编码。
9.1.1 黑白二值图像
黑白二值扫描图像文件采用TIFF(CCITT G3)格式二值图像压缩算法,压缩率就绪(Cr)为15:1。也可采用TIFF(CCIFF G4)格式二值图像压缩算法,压缩率(Cr)为3 O:1。
9.1.2 连续色调静态图像
连续色调静态图像采用JPEG数字压缩编码,平均压缩率(cr)为15:1。
9.2 编码方式
应尽是采用实时操作性强的编码方式。失真度编码,用较少的比特率获得较好的图像质量;无失真编码,以低压缩保持信息的不失真。一般情况下
宜采用国际通用编解码算法。
9.3 存储方式与载体
可选用在线和离线、不同载体进行存储。
10 检索利用
10.1 检索利用方式
档案数字图像检索利用可采用单机、局域网和互联网三种方式。
局域网中传输利用,应保证数据在内部局域网10Base?T带宽下,平均1秒内显示响应完成。互联网中传输利用,互联网56Kbit/s带宽下,平均5秒内显示响应完成。为此要求一般每页档案数字图像的存储容量为50K以内。
10.2 检索软件配置
检索软件应符合国家档案局制定的《档案管理软件功能要求暂行规定》的各项要求。检索软件应具备目录检索与档案数字图像方便调阅的基本功能。
档案数字化流程大概是怎样的?
一、术语和定义1、数字化用计算机技术将模拟信号转换为数字信号的处理过程。2、纸质档案数字化采用扫描仪或数码相机等数码设备对纸质档案进行数字加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。3、数字图像表示实物图像的整数阵列。一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。在矩阵(或其他)网络上采样——连续函数,并在采样点上将值最小化后的阵列。4、黑白二值图像只有黑白两级灰度的数字图像。它对应于黑白两种状态的文字稿、线条图等。5、连续色调静态图像以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像。在纸质档案数字化过程中,通常表现为灰度扫描和彩色扫描两种模式。6、分辨率单位长度内图像包含的点数或像素数,一般用每英时点数(dpi)表示。7、失真度对档案进行数字化转换后,数字图像与档案原件在色彩、几何等方面的偏离程度。8、可懂度数字图像向人或机器提供信息的能力。9、图像压缩清除图像冗余或图像近似的任一种过程,其目的是对图像以更紧凑的形式表示。二、纸质档案数字化基本要求1、基本原则纸质档案数字化的基本原则是使档案信息资源准确方便快捷地提供利用,使可以公开的档案信息资源得到共享,以满足社会对档案利用的需求。2、数字化对像的确定原则应当对所要进行数字化的对象按照一定的原则和方法进行确认,只有符合一定要求的纸质档案文献才能进行数字化。1)符合国家法律法规的原则纸质档案的数字化,必须符合国家档案开放规定以及有关规定。2)价值性原则属于归档范围且应永久或长期保存的、社会利用价值高的档案可列入数字化加工的范围。3、基本环节纸质档案数字化的基本环节主要包括:档案整理、目录建库、档案扫描、图像处理、图像存储、数据质检、数据挂接、数据验收、数据备份、成果管理等。4、 过程管理1)应加强纸质档案数字化各环节的安全保密管理机制,确保档案原件和数字化档案信息的安全.2 )纸质档案数字化的各个环节均应进行详细的登记,并及时整理、汇总,装订成册,在数字化工作完成的同时建立起完整、规范的记录。三、档案整理在扫描之前,根据档案管理情况,按下述步骤对档案进行适当整理,并视需要作出标识,确保档案数字化质量。1 目录数据准备2 拆除装订3 区分扫描件和非扫描件4 页面修整5 档案整理登记6 装订四、档案扫描1、扫描方式1)根据档案幅面的大小(A4、A3、A0等)选择相应规格的扫描仪或专业扫描仪(如工程图纸可采用0号图纸扫描仪)进行扫描。大幅面档案可采用大幅面数码平台,或者缩微拍摄后的胶片数字化转换设备等进行扫描,也可以采用小幅面扫描后的图像拼接方式处理。2)纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案可采用高速扫描方式以提高工作效率。2、扫描色彩模式1)扫描色彩模式一般有黑白二值、灰度、彩色等。通常采用黑白二值。2)页面为黑白两色,并且字迹清晰、不带插图的档案,可采用黑白二值模式进行扫描。3)页面为黑白两色,但字迹清晰度差或带有插图的档案,以及页面为多色文字的档案,可采用灰度模式扫描。4)页面中有红头、印章或插有黑白照片、彩色照片、彩色插图的档案,可视需要采用彩色模式进行扫描。3 、扫描分辨率1)扫描分辨率参数大小的选择,原则上以扫描后的图像清晰、完整、不影响图像的利用效果为准。2)采用黑白二值、灰度、彩色几种模式对档案进行扫描时,其分辨率一般均建议选择≥100dpi。特殊情况下,如文字偏小、密集、清晰度较差等,可适当提高分辨率。3)需要进行OCR汉字识别的档案,扫描分辨率建议选择≥200dpi。4、扫描登登记认真填写纸质档案数字化转换过程交接登记表单,登记扫描的页数,核对每份文件的实际扫描页数与档案整理量填写的文件页数是否一致,不一致时应注明具体原因和处理方法。五、图像处理1 、图像数据质量检查1)对图像偏斜度、清晰度、失真度进行检查。发现不符合图像质量要求时,应重新进行图像的处理。2)由于操作不当,造成扫描的图像文件不完整或无法清晰识别时,应重新扫描。3)发现文件漏扫时,应及时补扫并正确插入图像。4)发现扫描图像的排列顺序与档案原件不一致时,应及时进行调整。5)认真填写相关表单,记录质检结果和处理意见。2、纠偏对出现偏斜的图像应进行纠偏处理,以达到视觉上基本不感觉偏斜为准。对方向不正确的图像应进行旋转还原,以符合阅读习惯。3、去污对图像页面中出现的影响图像质量的杂质如黑点、黑线、黑框、黑边等应进行去污处理。处理过程中应遵循在不影响可懂度的前提下展现档案原貌的原则。4、图像拼接对大幅面档案进行分区扫描形成的多幅图像,应进行拼接处理,合并为一个完整的图像,以保证档案数字化图像的整体性。5、裁边处理采用彩色模式扫描的图像应进行裁边处理,去除多余的白边,以有效缩小图像文件的容量,节省存储空间。六、图像存储1、存储格式1)采用黑白二值模式扫描的图像文件,一般采用TIFF(G4)格式存储。采用灰度模式和彩色模式扫描的文件,一般采用JPEG格式存储。存储时的压缩率的选择,应以保证扫描的图像清晰可读的前提下,尽量减小存储容量为准则。2)提供网络查询的扫描图像,也可存储为CEB、PDF或其他格式。2、图像文件的命名1)纸质档案目录数据库中的每一份文件,都有一个与之相对应的唯一档号,以该档号为这份文件扫描后的图像文件命名。2)多页文件可采用该档号建立相应文件夹,按页码顺序对图像文件命名。七、目录建库1、数据格式选择目录建库应选择通用的数据格式。所选定的数据格式应能直接或间接通过XML文档进行数据交换。2、档案著录按照《档案著录规则》(DA/T18)的要求进行著录,建立档案目录数据库。3、目录数据质量检查采用人工校对或软件自动校对的方式,对目录数据库的建库质量进行检查。核对著录项目是否完整、著录内容是否规范、准确,发现不合格的数据应要求进行修改或重录。八、数据挂接1、汇总挂接档案数字化转换过程中形成的目录数据库与图像数据库,通过质检环节确认为“合格”后,通过网络及时加载到数据服务器端汇总。通过编制程序或借助相应软件,可实现目录数据对相关联的数字图象的自动搜索、加入对应的电子地址信息等,实现批量、快速挂接。2、数据关联以纸质档案目录数据库为依据,将每一份纸质档案文件扫描所得的一个或多个图像存储为一份图像文件。将图像文件存储到相应文件夹时,要认真核查每一份图象文件的名称与档案目录数据库中该份文件的档号是否相同,图像文件的页数与档案目录数据库中该份文件的页数是否一致,图像文件的总数与目录数据库中文件的总数是否相同等。通过每一份图像文件的文件名与档案目录数据库中该份文件的档号的一致性和唯一性,建立起一一对应的关联关系,为实现档案目录数据库与图像文件的批量挂接提供条件。3、认真填写纸质档案数字化转换过程交接登记表单,记录数据关联后的页数,核对每一份文件关联后的页数与档案整理、扫描时填写的页数是否一致,不一致时应注明具体原因和处理办法。九、数据验收1、数据抽检1)以抽检的方式检查已完成数字化转换的所有数据,包括目录数据库、图像文件及数据挂接的总体质量。2)一个全宗的档案,数据验收时抽检的比率不得低于5%。2、验收指标1)目录数据库与图像文件挂接错误码,或目录数据库、图像文件之一出现不完整、不清晰、有错误等质量问题时,抽检标记为“不合格”。2)一个全宗的档案,数字化转换质量抽检的合格率达到95%以上(含95%)时,给予以验收“通过”。合格率:抽检合格的文件数/抽检文件总数×100%3、验收审核验收“通过”的结论,必须经分管领导审核、签字后方有效。4、验收登记认真填写纸质档案数字化验收登记表单。十、数据备份1、备份范围经验收合格的完整数据应及时进行备份。2、备份方式为保证数据安全,备份载体的选择应多样化,可采用在线、离线相结合的方式实现多套备份,并注意异地保存。3、数据检验备份数据也应进行检验。备份数据的检验的内容主要包括备份数据能否打开、数据信息是否完整、文件数量是否准确等。4、备份标签数据备份后应相应的备份介质上做好标签,以便查找和管理。5、备份登记填写纸质档案数字化备份管理登记表单。十一、数字化成果管理1、应加强对纸质档案数字化成果的管理,确保其安全、完整和长期可用。2、纸质档案数字化成果提供网上检索利用时,应有制作单位的电子标识,并根据具体情况分别采用可下载或不可下载的数据格式。