武汉云典档案整理咨询有限公司

数字化扫描加工
上一页 1 下一页
档案数字化

数字化加工服务

(一)、档案数字化概述

档案是人类活动的真实记录,是人们认识和把握客观规律的要依据。借助档案,我们能够更好地了解过去、把握现在、预见未来。档案事业是党和国家事业发展的一个不可缺少的方面,是一项崇高的事业。
   档案是一项记录历史、传承文明、积累知识和经验的事业, 涉及各个领域和行业,是各项建设事业发展的重要基础之一。
   随着大数据时代的来临,大数据拥有者将大放异彩。
   处在大数据时代的档案事业, 将朝社会化、多元化、开放性和先进性发展,帮助人们洞察大数据带来的大价值。档案大数据,其特点表现在一方面可以提供政府企业运行的依据,支持核心生产力与应用,另一方面档案仍对合规、电子取证、安全、诊断以及其他支持性应用程序有相当大的价值。将成为机关事业单位、学校、金融等行业的无形资产。

云典档案长期从事档案数字化工作,目前,已经拥有一批专门的档案整理人员,都经过了专业档案管理者的细致培训,也在实践中得到过充分锻炼,文化水平较高,思路清晰,逻辑性强,有一定的提炼和总结能力;完全能达到档案数字化工作安全性、完整性、正确性、复杂性、权威性的要求。

(二)档案数字化内

档案数字化、信息化就是利用计算机扫描技术,采用专业的扫描仪、高拍仪和数码相机等数码设备对纸质档案进行数字化加工,将纸质、缩微胶片、底片等载体上的档案信息作数字化处理,生成数字影像文件进行存贮,并将档案检索信息输入计算机,采用计算机档案管理系统进行管理和开发 利用档案数字化的主要内容:

1、档案目录信息的数字化,建立档案目录数据库;

2、各种载体档案的数字化,如纸质档案、档案缩微品、照片档案及录音录像档案等的数字化,建立档案图像数据库或多媒体数据库;
   3、各类档案专题信息的采集与建库。

(三)档案数字化的作用

目前,档案室保存的档案信息形态主要以纸质、缩微胶片和底片等载体形式存在,只适应于传统的管理与传播方式,即实施手工管理和以点到点的传播,即便是经过编研等初步加工,编辑印发档案资料,实现以点到面的传播,其覆盖面也还是太小,很难达到社会化程度。档案信息资源的经济价值和社会价值也难以充分实现,更难适应当代“数字化生存” 的形势。档案数字化以后,对档案的现代化管理、使用和传播等都具有很重要的作用。

1、档案数字化能有效地保护档案原件代替原件使用,把原件妥善地保存起来,便可以有效地延长原件的保存时间。
   2数字化副本分地保存。对那些需要长期或永久保存的重要档案,可以用数据备份的方法制成多份数字化副本的备份分地保存。
   3恢复档案材料模糊褪变的字迹。有些档案材料由于纸张、字迹和保管条件等因素,字迹出现了模糊扩散或褪变。这种档案可以经过计算机扫描技术生成数字影像,再利用计算机图像处理技术就可以恢复模糊褪变字迹,其次,档案数字化能改善档案的利用方式档案的数字化副本以其积极的、动态的特性改变了长久以来的档案利用方式
   1、不再受“孤本”的限制。
   2异地调阅,数字影像文件可以通过计算机局域网或者广域网进行异地传输,使异地调阅利用成为可能。扩大了档案的利用空间,让更多的人们来了解档案,利用档案。
   3“时间”不再是限制,利用者可以随时使用自己需要的文件。数字化以后,将已开放的档案上网,这样所有利用者就可以在任何时间上网利用档案信息资源。

(四)档案数字化流程及细节
1资料移

首先要将资料从档案室移交到加工现场的临时库房。在转之前,双方共同在资料室完成资料的逐册清点工作,并登记承接时间、总册数,并有双方负责人在清单上签字。清点交接工作必须认真仔细,逐笔核对,不允许出现任何差错。这些信息作为资料归还时检查的参考依据。本步骤完成后,将会形成《移交清单》。
   2、资料拆分
   资料的整理和拆分时,资料拆分人员按照《资料拆分工作说明书》的要求进行资料拆分工作,并填写移交清单(此移交清单是资料拆分人员和项目经理共同填写)签字后领取并进行资料拆分。
   3、资料扫描
   原件的扫描与存储格式完全按照国家档案管理的统一标准要求扫描。资料扫描设置专业岗位和补扫岗位;补扫岗位主要负责改正图像质检发现的问题。通过扫描,纸质资料数字化为电子资料。本步骤是资料数字化的核心和基础,直接影响对于纸质资料获取数字化信息的好坏。扫描过程对扫描后的文件质量影响主要参数是:扫描分辨率(DPI)、色彩(黑白、灰度、彩色)、存储格式(JPG、TIFF、PDF)、明暗度和对比度。
   按照技术指标,扫描时应根据资料纸张的质地,底色,薄厚程度,可拆或不可拆制定扫描方案,确保在扫描图像质量清晰的情况下,使原件完好无损。
   4、图像处理
   扫描后的原始图像需要进行优化处理,使得成品图像清晰、端正。根据扫描后的具体情况,图像要进行如下处理:图像旋转、校正还原,以符合阅读习惯;图像去原始信息外脏点、斑点去除,如去黑点、黑线、黑框、黑边等。处理过程中应遵循保持原貌的原则。
    5、插图页面处理
   资料中有插图的要在扫描时对扫描阀值做相应调整,如黑插图用灰度扫描不清楚时,应该用其他色彩扫描,在保持原始页面信息的同时使图像清晰可辩。
   6、图像质检
   图像质检设置岗位由项目经理兼任,负责每天抽检比例不低于图像处理总量的10%;图像质检也是对扫描工序的第二次校验(二校),主要对两方面的情况进行检查:
   图像数量:对处理的图像数量是否同原书数量一致、   图像是否存在重扫、漏扫的情况。
   图像质量:对图像是否清晰、可阅读,是否字迹断连、字迹过深,是否达到扫描要求的分辨率。
   对文本域录入与文本录入域的标引、文件的页号及页数进行对比,对扫描前的图像页的标引与扫描后的图像页的编号与页数进行对比,发现不合格的登记清单并退回上一流程重新处理。
    7、资料装订还原
   资料图像成品检查合格后,移交客户前需要装订还原,根据原稿拆分时的情况按照骑马钉、斜钉、书式塑料装订等方式装订还原。
    8、图像与索引挂接
   文本域录入和扫描处理检验后的图像成品,按年度进行文字图像与系统的挂接,不需手工挂接即可实现文本与图像页与系统的挂接。挂接到档案管理系统中后,进行再次的成品验收,对各种使用习惯逐页进行检验,验收合格后移交验收小组验收。
    9、数据移交
   通过网络传输或硬盘方式移交成品数据。成品数据包括:单层PDF文件、TIFF图像、《备注说明》(原书出现残缺、重页、水淹、火烧、图像不清、空白页、插页、插图,提交数据的总数与原书的总数不一致等情况)文档。
   10、档案数字化加工流程

资料交接(填写移交清单双方签字)和查重(重复资料的审核,客户确认后剔除)→→资料拆卷(起钉、书式塑料金属装订物剔除),检查纸张情况及内容书写清晰度→→资料分页扫描(按厚薄、颜色、阀值调整扫描参数)→→图像修图(纠偏、校正、清晰度调整、裁边)→→图像质检及无损压缩(多页TIF或PDF成品压缩)→→图像命名(PDF命名格式、命名字段规则)→→资料装订还原(骑马钉、斜钉、书式塑料装订、书式金属圈装订等)→→图像与索引挂接→→资料移交(按移交表清点无误后双方签字确认装箱)→→数据备份(硬盘或服务器双备份)→→成品验收(按批次打印加工台账清单,移交目录造册;客户验收通过签订验收合格书)



数据加工

(一)数据加工的业务简介
  文字录入、OCR识别校对、数据扫描加工、图像处理、文件整理与格式转换、数据库开发与全文检索光盘制作;各种古籍、图书、报纸、期刊、杂志、档案、图纸、票据、表单、字画等批量信息资料的数字化加工;一流的质量、一流的速度、便捷的交通、低廉的价格,为您打造一流的服务。

(二)数据加工的文件格式

文字格式:TXTDOCRTFXMLHTMLExcel数据表、Access数据库等;图像格式:TIFJPGBMPGIFPDFDJVUCEB等;电子书格式:双层PDF、双层DJVU、双层CEBXMLHTML网页 格式等。

(三)数据加工的质量保障

保障体系:OCR智能识别、人工一二三校、人机结合对比校方式保障数据质量的万无一失;
  文字录入:错误率控制在千分之三以内,外校质量可控制在万分之三或万分之一,根据客户要求而制定;
  扫描识别:图书、期刊、报纸、文档等印刷品错误率控制在万分之三或万分之一,根据客户要求而制定;
  原样录入:质量控制在五万分之一、十万分之一乃至零,根据客户要求而制定。

(四)数据加工的服务内容
  OCR识别校对、文件扫描加工;
  电子图书制作,多媒体光盘开发;
  中文(简,繁)、英文海量数据信息处理;
  期刊、杂志、报纸光盘检索与数据库建设;
  各种票据、单据、表格的数据转换与扫描加工;
  大型网站数据处理供应与上传,定项信息采集服务;
  政府机关、企事业单位的文件、档案、资料的数字化加工;
  银行、保险、证券、物流、税务等产生的票据、表单、文件资料的数字化扫描加工