南昌档案数字化加工
王月霞
(江西省核工业地质调查院,南昌330038)
摘要 文章分析了以地质资料清理为契机,加快推进铀矿地质资料的数字化建设的必要性,并从数字化的前期准备阶段、数字化实施阶段、数字化成果的管理与应用阶段三方面提出了实施数字化工作中要注意把握的几个问题。
关键词 核工业;铀矿地质;档案资料;数字化
2007年,为充分发挥现有铀矿地质档案资料的作用,促进更多地质档案资料开发利用和社会化服务,我局在江西省国土资源厅的统一安排部署下,对馆藏地质成果档案资料进行了清理登记,对涉密资料的密级、涉密种类、涉密事项进行了认定,对破损档案进行了调查摸底,并初步建立了成果地质资料目录数据库。通过此次资料清理,进一步规范了我局档案资料的管理,摸清了家底,为促进数字化的实施奠定了基础。为此,我局酝酿多年的地质资料图文数字化项目已于2008年年初拉开了帷幕,并计划用三年时间完成馆藏所有地质资料档案的数字化工作,建立全文数据库,完善目录数据库,让馆藏档案资料以最广泛、最快捷的方式提供利用服务,使可以公开的档案信息得到互联互通共享,以满足铀资源管理和地质调查与评价的需要,为我国国防与国民经济建设、和谐社会建设发挥更加广泛地作用。
1 铀矿地质档案资料数字化建设的必要性
1.1 数字化是时代的要求和社会发展的大势所趋
随着人类进入信息社会及现代电子计算机技术广泛应用与迅速发展,档案资料数字化加工与存储,计算机检索与阅读、网络化传输与流动是势在必行。我局铀矿地质科技档案按其专业划分为地质勘查、物化探、水文工程地质、测绘、实验测试、探矿工程、资源预测评价监督、科学技术研究、基本建设、民品生产等13个类目。面对如此海量的档案信息,其加工、整理、利用与传输如果还停留在手工管理阶段水平,必将被历史所淘汰。因此加快推进铀矿地质档案资料数字化建设,关系到我们铀矿地质档案资料馆在未来信息时代的地位和作用。
1.2 数字化有利于地质档案资料的科学保护
部分铀矿地质档案资料由于年代已久或使用频繁,一部分档案纸质较差,纸张发黄变脆、字迹洇化褪色、聚酯图件粘连、注记脱落,图件皱折、破损情况严重,有些已不能提供利用。我局在去年对馆藏地质资料进行清理登记的同时,对档案保管状况进行了摸底调查,共登记破损档案八百多份,图件千余张。因此尽快抢救、修复或复制,并保护好这些档案也成为地勘单位另一个十分紧迫的任务。而实施数字化则是对破损档案最佳、最彻底的修复方案,能有效地保护档案原件。
1.3 数字化成果有利于铀矿地质资料进一步研究与开发利用
为缓解我国铀资源紧缺的矛盾,核工业地质局提出我国南方近期找矿目标是扩大现有铀矿田的资源储量,重点普查扩大现有矿区深部500~1000m的“第二富集带”和外围的铀资源远景。要实现此目标必须利用新理论、新技术、新方法对馆藏地、物、化、钻探等基础性资料进行综合分析、综合研究,提取有价值的信息,归纳总结控矿因素及成矿规律,以筛选出新的找矿靶区、靶位和勘查基地。而数字化成果更具有利于方便,快捷、高效、全面地获取、整合、优化、分析、处理档案信息数据的优势,进而大大提高地质勘查工作程度,节约投资,缩短工期,以减少找矿盲目性,实现地质找铀新的重大突破。
1.4 数字化能够解决传统档案管理本身无法解决的问题和矛盾
由于地质行业的特殊性,长期野外作业基地分散,交通不便,纸质载体不便于远距离快速查询、调用,信息采集、存储、传输和资源共享,时效性越来越低,已远不能适应或满足野外地质工作需求。而且纸质报告、图件制作成本越来越高,占用库存空间越来越大。而数字化档案的最大特点是彻底改变纸质档案的利用方式,冲破档案利用的限制,资料借阅和管理不受时空,地理位置限制,能够通过网络远程异地查询、全文检索,资料传输、快捷方便,进而提高工作效率、降低成本。而且数字化成果载体是硬盘、光盘等,容量高、成本低、体积小,容易携带保存,有利于野外作业环境管理。
2 数字化实施过程中要注意把握的几个问题
2.1 前期准备阶段
一是认真实践科学发展观,做好数字化前地质资料的价值鉴定,落实数字化的范围和实施方案。馆藏档案全部数字化,是理论上最彻底的数字化方案没有必要将庞杂纷繁的馆藏档案全部数字化,而应选择重要铀矿区、矿床矿点档案资料先行数字化。二是加强学习培训与考察调研。由于数字化对核地勘单位而言是一项全新的任务,缺乏实践经验,因此数字化前的学习培训、考察调研极为重要。通过学习培训强化提高对数字化的质量要求和技术标准规范;通过考察调研可借鉴其他行业开展数字化工作的成熟方法和先进经验,以少走弯路。三是规范、统一全局性档案数字化、信息化的技术系统、技术标准与规范。使电子文件在通用标准、环境下能被正常浏览、使用和转换,以期达到互通兼容、统一维护、统一升级、信息共享的目标。四是地质局档案馆要加强对下属地勘单位数字化工作的指导、监督,对已汇交的成果地质资料的数字化要统筹规划,具体分工与合作,避免重复工作造成浪费。
2.2 数字化具体实施阶段
由于铀矿地质档案资料涉及核工业国家秘密,而数字化又是一项长期、复杂的系统工程,资金投入多,任务重、工作量大,因此在数字化实施过程中要特别注意对档案实体、档案信息、数据的安全、保密和质量管理。一是强化所有参与数字化工作人员的安全保密意识,从思想上筑牢安全防线;制定数字化安全保密工作制度,从源头上堵塞安全漏洞;采取数字化加工网络与外网物理隔绝、安装干扰器和防火墙、加装密码设备等安全措施,从硬件设备上切断泄密途径。二是要建立责任机制,落实岗位职责,严格操作规范。对档案实体在整理、扫描、录入、识别、校对、图像处理、目录建库、数据验收、数据备份等各个作业环节和流程中要进行详细的交接登记,实施全过程的有效监控,确保档案资料原件与信息数据的绝对安全。三是保证质量。数字化过程中任何一个工作环节质量直接影响着档案信息资源建设的质量。比如前处理要数据准确、标识清楚;扫描要维护档案原貌,所记载的信息内容要与纸质档案原件保一致,齐全完整,图件清晰真实有效符合质量标准;光盘刻录要格式正确、内容完整,能够独立浏览和检索,以保证数字化成果真实性、可用性、完整性,对折卷扫描的案卷要及时装订,恢复原貌。
2.3 数字化后电子档案的保管与应用阶段
地质资料数字化后,面对新型存储载体电子档案如何规范整理、安全保管及有效利用是档案人员面临急需解决的一大问题。首先应做好数字化成果的入库检查验收。对每一件电子文档都要进行全面检查,看其能否正常打开读取、浏览和使用;文本部分与附图类的编排顺序、编制格式、文件命名及组织方式、目录文件的制作是否符合规范要求;光盘表面是否有物理变形,有无划痕、斑点、霉变或携带病毒,发现不合格应重新制作,确保光盘所存数据的有效读取。二是认真研究实践、不断提高数字化成果的保管与利用水平。电子档案的保管、利用需要依据其特性和软硬件平台在一定的技术环境和采取一系列技术保障措施下进行,涉及许多方法、技术、标准的建立,因此除建立铀矿地质本行业、本系统、本单位电子档案的管理制度外,还应进一步加强、完善基础设施建设,在规范整理,安全保管、定期检测维护、安全有效提供利用上做好做足文章。三是尽快改善档案管理队伍人才、知识结构,提高档案人员综合素质。地质资料数字化后,对数字化成果电子档案的保管、查询检索、计算机及其相关管理软件的操作应用以及数据库建设的维护更新,都对现有档案人员的思想观念、专业技能等综合素质提出了较高的要求。而当前地勘单位档案员队伍中极少有既会档案管理、又懂计算机应用的复合型人才,急需培养档案信息化管理人才及有计划地加强对现有人员相关基准的强化培训,迅速提高他们掌握电子档案管理的基本知识技能和计算机技术应用水平,做好传统档案管理向数字化管理的转型工作,为核工业新一轮地质找矿提供坚实的地质数据信息资源服务与保障。
档案数字化加工是什么工作
档案数字化加工人员是扫描、录入的专业人员,组织电脑信息录入、文档资料扫描、文档图形图像处理、档案装钉整理等,是档案数字化的专业人员。
主要负责对文件、图书资料进行整理、扫描、图像处理以及目录制作,工作区域是在办公室。
档案数字化,就是用现代的数字技术来管理各类档案,流程是这样的:档案接收—档案扫描—扫描图片的处理—将扫描好的电子图片导入档案管理软件。
档案数字化加工具体怎么做?
档案数字化加工具体过程
前期档案整理档案借出
从档案室接件,填写档案移交清册,一式两份。拿到档案后,开始核对档案数量,数量核对无误后签字确认,将档案拿回加工现场。
目录数据准备
按照各类档案整理规定的要求,在档案管理系统着录目录数据。如有错误或不规范的案卷题名、文件名、责任者、日期、起止页号等,应进行修改。
拆除装订
在不去除装订物情况下,会影响扫描工作进行的档案,应拆除装订物。拆除装订物时应注意保护档案不受损害。
页面修整
破损严重、无法直接进行扫描的档案,应先进行技术修复,折皱不平影响扫描质量的原件应先进行相应处理(压平或熨平等)后再进行扫描。
档案扫描
扫描方式
(1)根据档案幅面的大小(A4、A3、A0等)选择相应规格的扫描仪或专业扫描仪(如工程图纸可采用0号图纸扫描仪)进行扫描。大幅面档案可采用大幅面数码平台,或者缩微拍摄后的胶片数字化转换设备等进行扫描。
(2)纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案,可采用高速扫描方式以提高工作效率。
扫描色彩模式
(1)扫描色彩模式一般有黑白二值、灰度、彩色等。通常采用彩色。
(2)页面为黑白两色,并且字迹清晰、不带插图的档案,可采用黑白二值模式进行扫描。
(3)页面为黑白两色,但字迹清晰度差或带有插图的档案,以及页面为多色文字的档案,可采用灰度模式扫描。
(4)页面中有红头、印章或插有黑白照片、彩色照片、彩色插图的档案,可采用彩色模式进行扫描。
扫描分辨率
(1)扫描分辨率参数大小的选择,原则上以扫描后的图像清晰、完整、不影响图像的利用效果为准。
(2)采用黑白二值、灰度、彩色几种模式对档案进行扫描时,其分辨率一般应设为200-300dpi。特殊情况下,如文字偏小、密集、清晰度较差等,可适当提高分辨率。
图像处理
图像数据质量检查
(1)对图像偏斜度、清晰度、失真度等进行检查。发现不符合图像质量要求时,应重新进行图像的处理。
(2)由于操作不当,造成扫描的图像文件不完整或无法清晰识别时,应重新扫描。
(3)发现文件漏扫时,应及时补扫并正确插入图像。
(4)发现扫描图像的排列顺序与档案原件不一致时,应及时进行调整。
纠偏、去污、图像拼接、裁边处理
(1)对出现偏斜的图像应进行纠偏处理,以达到视觉上基本不感觉偏斜为准。对方向不正确的图像应进行旋转还原,以符合阅读习惯。
(2)对图像页面中出现的影响图像质量的杂质,如黑点、黑线、黑框、黑边等应进行去污处理。处理过程中应遵循在不影响可懂度的前提下展现档案原貌的原则。
(3)对大幅面档案进行分区扫描形成的多幅图像,应进行拼接处理,合并为一个完整的图像,以保证档案数字化图像的整体性。
(4)采用彩色模式扫描的图像应进行裁边处理,去除多余的白边,以有效缩小图像文件的容量,节省存储空间。
图像存储
存储格式
(1)采用黑白二值模式扫描的图像文件,一般采用PDF格式存储。
(2)采用灰度模式和彩色模式扫描的文件,一般采用PDF格式存储。
图像文件命名
(1)纸质档案目录数据库中的每一份文件,都有一个与之相对应的档号,以该档号为这份文件扫描后的图像文件命名。如图像文件较大,不便于网络浏览,可拆分为多个图像文件,文件名后增加A、B、C等区别。
(2)分别建立文件夹,以文件档号命名,并存储对应图像文件。
数据挂接
将每一份纸质档案扫描所得的图像存储到相应档号的文件夹后,认真核查每一份图像文件的名称与档案目录数据库中该份文件的档号是否相同,图像文件的页数与档案目录数据库中文件的总页数是否相同等。通过每一份图像文件所在文件夹的名称与档案目录数据库中该份文件的档号的一致性,建立起一一对应的关联关系,为实现档案目录数据库与图像文件的批量挂接提供条件。
户籍档案保存年限
“民警同志,我今年80岁了,想开一张我父母的户籍证明。”“我爸爸前两年过世的,我要查他60年代户口迁出的记录,好像是住过南昌路还是襄阳路那里的,我不确定。”“你看,这些60年代的户口登记簿内页都发黄、发脆了,还能撑多久真不好说。”这些纸质户籍档案带来的困扰,要如何破解?
纸质档案越存越多,查找、保存却存在诸多不便,在城市数字化转型和加强软实力建设的今天,纸质户籍档案数字化无疑势在必行。今年以来,徐汇公安分局在市局人口办、智慧公安办的大力指导下,深入调查研究、倒排时间节点、逐项攻克难题,全速推进纸质户籍档案数字化加工,于6月底保质保量完成了全区13家派出所25万卷、2000余万页户籍档案数字化加工任务,并研发基于公安网的信息交互、网上调档实战应用系统,在实现派出所“综合窗口”全域入驻街镇社区事务受理中心的基础上,打通徐汇公安政务服务与群众的“最后一公里”,使户籍档案资源更好地服务于公安实战和社会公众,为上海建立符合现代化档案管理要求的档案体系开展积极探索。
查阅、保护历史户籍档案,数字化应用优势明显
由于辖区内解放前兴建的旧式里弄、花园洋房众多,户籍人口迁移变化大,新旧居民出于房产、征信、政审等各种用途前来办理业务,使得徐汇公安分局湖南路派出所的历史户籍查档量一直居高不下。“传统纸质档案查询时,需要居民提供详细地址和准确姓名,还需要人工费时翻阅查找,像我们辖区很多老房子,同一个地址下往往有好几家甚至是十几家人家,翻阅查找难度就更大了。”公安综合窗口民警严晓韫说。一旦家庭成员在几个地址间多次迁移的,居民要开具家人迁出证明,民警只能随着他的户口迁移轨迹逐本翻阅。尤其对于年代久远,被查询人已经过世,后代又不甚了解详细地址的情况,光通过一个姓名,要查询到信息更是难上加难。
而电子档案是通过前期扫描纸质档案,产生高清像素图片,存入存储设备。用户查询时输入需求,后台算法通过对存储电子档案进行识别,得出针对性的查询结果。电子档案的应用减轻了窗口工作人员需要离开工位、手工检索查找等负担,大大缩短了居民等待的时间,加快了窗口的办事效率。
不仅如此,纸质档案因保存年代久远后,不可避免会出现发黄、变脆、破损、甚至装订散架等情况,而在每次翻阅查找过程中,又极易造成新的、不可逆的损坏。纸质档案的保存还需要一定的温度、湿度,保存条件较为严苛。电子档案并不会随着时间流逝而发生物理变化,保存更加完整持久,反复查阅不会受损。纸质档案量只会越存越多,对保存的空间要求也会越来越大,不仅如此,还要安排专门的人员保管。而电子档案对空间的要求极小,在电脑设置密码等有效的方法下,可以妥善地保证电子档案的安全性和保密性。
贴近实战研发数据检索系统,放大内部“放管服”效能
徐汇公安分局全流程把控数据录入质量,严守安全底线,优先选择有涉密资质的加工单位并签订保密协议,通过“双机著录、一机校验”全面确保数据录入准确性。而无纸化只是数字化的第一步,能够随时调取这2000余万页信息的平台才是决定工作成败和服务成效的关键。徐汇公安分局专门研发了B/S网络版数据检索系统,提供档案检索、图像调阅、库藏统计、数据导出、用户管理等功能服务,实现对原始户籍档案的电子调档查询。
电子档案查询软件共设置了户口簿册、迁移证存根、迁入户口证、移入户口证、死亡证存根、出生证、户口审批材料等7个档案类别,在查询类别不详的情况下,也可通过综合栏查询所有档案类别;设置了档号、姓名、身份证、详细地址、死亡时间、出生日期、年代7项查询条件,可通过其中一项条件查询或多项条件组合查询。
针对1984年以后的户籍档案都是个人页的问题,电子档案查询系统中还添加了显示前后各5页的功能,能够尽最大可能显示一家人家的户籍档案,方便查询。如遇到档案页面原始字迹模糊,还可放大缩小进行辨认,并增加了打印功能,大大方便了工作人员和民警随时查档调阅。
通过姓名、身份证、同住人等多种维度查档,切实解决了居民因年代久远、记忆模糊导致的来回往返查询旧档案的老大难问题;同时也消除了派出所综合窗口入驻街道服务中心,档案室与窗口分离、民警调档不便的困扰,放大了内部“放管服”效能,市民满意度和民警工作效率成倍提升。
提升群众服务体验感受,助力城市数字化转型目前,徐汇公安分局应群众申请开具户籍证明查档日均350余次,核查户籍相关材料查档日均200余次,查询用时从原先10至20分钟缩短至5分钟以内,大大提升了工作效率。
五年前,一位年迈的阿姨来湖南路派出所开其祖父母的户籍证明,她小时候只听她父母提起过祖父母的姓名,并不知道其它信息。当时,户籍窗口民警严晓韫翻了大半天档案,结果还是一无所获。心怀歉意的小严在工作日志上记上了一笔。2020年,湖南路派出所率先启用电子档案后,民警又联系到了阿姨。结果,根据阿姨提供的姓名,民警用了5分钟不到就查到了她祖父母的户籍档案。“谢谢,谢谢,太好了,一桩心事总算落地了。”困扰多年的问题终于解决了,阿姨开心地连连道谢。
李女士来到湖南路街道社区事务受理服务中心,想要办理过世母亲的历史户籍证明,综合窗口工作人员小张通过系统查询,几乎是立刻查询到了相关信息,并为李女士打印出了相关证明。“以前我记得在老派出所的时候,我要开老房子户籍证明,民警同志要进去翻半天;现在搬到这里,感觉所有东西都升级了,怎么会那么快?方便,真方便!”李女士感叹道。
除了到场办理外,“一网通办”的红利也延伸到了手机端。市民任先生在手机随申办内提交了一个开具户籍证明的申请,要求证明“60年代武康路某弄某号内,自己报出生日期以及与父母的亲属关系”。工作人员在工位电脑上收到申请后,通过姓名和地址,迅速查出60年代的户口登记表,摘抄相关信息填报上传系统。这样,任先生在手机端就能收到一张带有公安盖章的电子版户籍证明,可以永久留存,更方便随身携带、打印。
什么叫档案数字化加工服务外包
档案的收集、整理、保管、鉴定、统计和提供利用的活动。匡易档案包括:档案收集、档案整理、档案录入、档案数字化、档案系统、档案软件定制、档案价值鉴定、档案保管、档案编目和档案检索、档案统计、档案编辑和研究(见档案文献编纂)、档案提供利用、档案销毁。
这些工作的划分只是相对稳定而不是绝对的,也有分为 8个环节的,也有分为基础工作和利用工作两大部分的。由于现代档案管理工作已成为复杂的系统,故也有按多层次进行划分的方法。其第一层次分档案实体管理和档案信息开发两个子系统,各子系统又下分若干层次小系统。
档案实体管理分收集、整理、鉴定、保管、统计等工作环节;档案信息开发又分信息加工和信息输出两部分,信息加工由编制目录、编辑文献汇编和编写参考资料构成,信息输出由提供阅览、复制、咨询、函调、外借以及出版、展览等多项服务活动构成。
什么是档案数字化?
什么是档案数字化?
档案数字化是随着计算机技术、扫描技术、扫描矩阵CCD技术、OCR技术、数字摄影技术(录音、录像)、数据库技术、多媒体技术、存储技术的发展而产生的一种新型档案信息形态。
它把各种载体的档案资源转化为数字化的档案信息,以数字化的形式存储,网络化的形式互相连接,利用计算机系统进行管理,形成一个有序结构的档案信息库,及时提供利用,实现资源共享。
主要负责对文件、图书资料进行整理、扫描、图像处理以及目录制作,工作区域是在办公室。档案数字化加工人员是扫描、录入的专业人员,组织电脑信息录入、文档资料扫描、文档图形图像处理、档案装订整理等,是档案数字化的专业人员。
数字档案可以有效地解决这些实际档案工作中的痛点。首先,数字档案可实现档案管理的数字化和自动化,便于检索和借阅,有效的提高工作效率。其次,数字档案可以联通档案孤岛,进行整合,实现资源联通共享。再者,数字档案可以使档案管理流程更加顺畅,系统可为档案的完整、准确、安全提供有力保障。
档案数字化可以提高档案信息化管理水平,有利于提高档案馆工作效率和现代化水平,有利于确保数字档案永久保存和安全保管,有利于促进公共档案服务能力拓展和实现档案信息资源的社会共享。