辽宁省在长久的发展中留存了大量珍贵档案。从沈阳故宫的宫廷文献,到鞍山钢铁厂的建设记录;从抚顺煤矿的开采档案,到大连造船厂的技术图纸,每一份档案都是辽宁发展历程的见证。然而,随着时代发展,传统纸质档案管理面临存储空间紧张、查阅效率低下、保存风险高等难题,难以满足政府决策、企业运营、学术研究等多样化需求。在此背景下,辽宁数字化扫描档案工作全面推进,以科技赋能档案管理,将海量纸质档案转化为数字资源,开启了档案管理的全新篇章,为辽宁社会经济发展注入新的活力。
在档案数字化扫描过程中,扫描过后的后期处理工作同样重要。扫描辽宁数字化扫描档案的后期处理工作具体涵盖了:
1.图像存储。
(1)存储格式:批量扫描后形成的图像文件在存储时一般应进行压缩。图像压缩指消除图像冗余或对图像近似的任一种过程,其目的是对图像以更紧凑的形式表示。纸质档案数字化过程中,较常见的有TIFF(G4)、JPEG等压缩格式。采用黑白二值模式扫描的图像文件,一般采用TIFF(G4)格式存储。采用灰模式和彩色模式扫描的文件,一般采用JPEG 格式存储。存储时压缩率的选择,应以保证扫描的图像清晰可读的前提下,尽量减小存储容量为准则。②提供网络查询的扫描图像,也可存储为 CEB、PDF 或其他格式。
(2)图像文件的命名:①纸质档案目录数据库中的每一份文件,都有一个与之相对应的唯一档号,以该档号为这份文件扫描后的图像文件命名。②多页文件可采用该档号建立相应文件夹,按页码顺序对图像文件命名。
2.目录建库。
(1)数据格式选择:目录建库选择通用的数据格式。所选定的数据格式应能直接或间接通过XML文档进行数据交换。
(2)档案著录:按照《档案著录规则》(DA/T18)的要求进行著录,建立档案目录数据库。
(3)目录数据质量检查:采用人工校对或软件自动校对的方式,对目录数据库的建库质量进行检查。核对著录项目是否完整、著录内容是否规范、准确,发现不合格的数据应要求进行修改或重录。
3.数据挂接。
(1)汇总挂接:档案数字化转换过程中形成的目录数据库与图像数据库,通过质检环节确认为“合格”后,通过网络及时加载到数据服务器端汇总。通过编制程序或借助相应软件,可实现目录数据对相关联的数字图像的自动搜索、加入对应的电子地址信息等,实现批量、快速挂接。
(2)数据关联:以纸质档案目录数据库为依据,将每一份纸质档案文件扫描所得的一个或多个图像存储为一份图像文件。将图像文件存储到相应文件夹时,要认真核查每一份图像文件的名称与档案目录数据库中该份文件的档号是否相同,图像文件的页数与档案目录数据库中该份文件的页数是否一致,图像文件的总数与目录数据库中文件的总数是否相同等。通过每一份图像文件的文件名与档案目录数据库中该份文件的档号的一致性和唯一性,建立起一一对应的关联关系,确保文件目录与案卷目录准确关联;确保每件档案的图像文件与该档案在数据库中的文件目录准确挂接;确保图像文件的内容、数量和排列顺序与档案原件一致,为实现档案目录数据库与图像文件的批量挂接提供条件。
(3)认真填写纸质档案数字化转换过程交接登记表单,记录数据关联后的页数,核对每一份文件关联后的页数与档案整理、扫描时填写的页数是否一致,不一致时应注明具体原因和处理办法。
4.档案还原装订。
扫描工作完成后,拆除过装订物的档案应按档案保管的要求重新装订。恢复装订时,应注意保持档案的排列顺序不变,做到安全、准确、无遗漏。档案装订分为整卷装订和按件装订两种。通常采用三孔一线方法装订;文件很薄时,也可采用缝纫机扎线装订,但线脚不宜过密,以免出现折断档案现象。
5.数据验收。
以全宗的一个或多个目录为单元,随机抽查 5%以上的数据,对条目数量及其著录项目内容的准确性进行逐条检查。其中,档号的合格率要求达到100%,其他项目抽检合格率要求达到 95%以上(含95%)。合格率=抽检合格文件数/抽检文件总数x100%。