山西省,因居太行山之西而得名,简称“晋”,位于中国华北地区西部,东隔太行山脉与河北省相邻。山西作为华夏文明起源地之一,历史十分悠久,文化底蕴深厚。山西省现存有国家级重点文物保护单位531处,位居全国第一。与此同时,山西是中国重要的能源基地,也是能源革命综合改革试点省,电力市场化改革位居中国前列。在此背景下,山西省留存了十分丰富且多样化的档案资源。为了更好地保存珍贵档案资源,山西省各个企事业单位积极开展纸质档案整理扫描工作。
山西纸质档案整理扫描的方法主要有两种:
第一,直接扫描法。
所谓直接扫描法,是采用扫描仪对纸质档案原件进行光学扫描,将图像信息传送到光电转换器中变为模拟电信号,又将模拟电信号转变为数字电信号,再通过计算机接口传输至计算机存储器中。
直接扫描分为两种方式:
(1)扫描纸质档案后再运用字符识别(OCR)软件进行识别,最终生成文本文件。这种数字化文件的优点是:占据的空间小,便于计算机全文检索,便于档案利用时进行摘录和编辑。
其缺点是:不能保持档案原件的排版格式,以及签名印章等原始信息;有时OCR字符识别的准确率较低,核对修改较为困难,数字化效率很低,且实际上已经破坏了档案原稿的真实性。
(2)扫描纸质档案后形成数字图像文件。这种图像文件的优点是:能保持档案的内容和排版的原貌,数字化速度快。缺点是:不能进行全文检索,不能编辑文字内容,且占据存储空间大。
以上两种方法的优缺点正好互补,现在有一种方法能将两者的优点融合在一个档案中,即制作双层PDF。其制作方法是:将纸质档案原件扫描成数字化图像文件后再转换成文本文件,然后将这两个内容一样的文件置入同一个 PDF 文件将图像文件置于文本文件的上层,图像文件下层隐藏文本文件。查询该文件时我们既能看到上层保持原貌的图像文件,同时也能对隐藏的文本文件进行全文检索。
第二,缩微转换法。
所谓缩微转换法,是针对已经缩微复制的档案,采用专用扫描设备(即缩微胶片扫描仪)将缩微胶片上的模拟影像转换成数字影像的方法。与直接扫描法相比,缩微扫描法更经济、简便、高效。然而这种方法必须建立在已经对纸质档案进行缩微加工的基础上。
值得注意的是,在对缩微胶片进行扫描加工后,原缩微胶片应与纸质档案并保存,不能擅自销毁。由此,该档案形成“三套制”保存状态。虽然缩微胶片不如数字化档案容易保存、复制、查询、传播,但是作为模拟信息,缩微档案具有人工可读、稳定性好等数字化档案不具备的优势,又具有体积小等纸质档案不具备的优势,应当成为档案信息资源的重要补充形式。
山西纸质档案整理扫描的工具选择:
1. 扫描仪。适用场景:适用于大批量、高质量的纸质档案数字化。
优点:扫描速度快,分辨率高,能够清晰还原档案细节。支持多种文件格式输出(如PDF、JPEG等)。适合处理各种类型的纸质档案,包括书籍、图纸、照片等。
缺点:设备成本较高,尤其是高速扫描仪。对纸张平整度要求较高,老旧档案可能需手动处理。
2. 拍照。适用场景:适用于少量档案或无法使用扫描仪的场合(如装订成册的书籍)。
优点:设备成本低,普通相机或手机即可完成。操作灵活,适合处理特殊尺寸或装订档案。缺点:图像质量受拍摄环境影响(如光线、角度等)。后期处理工作量大,需裁剪、校正等操作。
3. 高拍仪。适用场景:适用于中小型档案的快速数字化。
优点:操作简单,一键拍摄,适合非专业人员使用。设备便携,占用空间小。支持自动校正和裁剪功能。缺点:图像质量略低于扫描仪,不适合高精度需求。处理速度较慢,不适合大批量档案。
4. 缩微胶片。适用场景:适用于已有缩微胶片的档案数字化。
优点:缩微胶片本身具有高密度存储和长期保存的优势。数字化后可实现快速检索和共享。缺点:需要专用设备进行胶片扫描,成本较高。