当前位置: 首页 > 政务公开 > 行业动态
将中国的档案数字资源牢牢掌握在自己手中 ——访国家档案局档案科学技术研究所副所长王善柏
编稿时间: 2024-02-27 09:22 来源: 中国档案报 
 

    王善柏,国家档案局档案科学技术研究所副所长兼CMA检测中心负责人,研究馆员,中国档案学会影像技术委员会主任委员,全国文献影像技术标准化技术委员会副主任委员,全国档案工作标准化技术委员会委员。长期从事档案信息化、档案影像技术研究和检验检测工作,主持或作为骨干完成多项国家档案局重点科研项目。

    随着信息技术飞速发展,电子档案备份与长期保存越来越受到档案界的关注。然而,传统电子档案存储方式在载体和技术上存在一些痛点亟待解决。国家档案局重点科技项目“档案数字资源备份策略及数字胶片技术应用研究”为解决该问题提供了一种可能。围绕数字胶片技术及该技术将会给电子档案备份与长期保存带来何种变革,记者专访了该项目负责人、国家档案局档案科学技术研究所副所长王善柏。

    记者:数字时代,传统的电子档案存储方式面临哪些挑战?

    王善柏:自2013年全国数字档案馆(室)建设推进会提出实施“存量数字化、增量电子化”战略至今已过去10年。10年来,在各级各类档案部门的共同努力下,数字档案资源呈海量增长趋势。《2022年度全国档案主管部门和档案馆基本情况摘要》显示,馆藏电子档案已达2372.9TB,档案数字化成果已达28069.0TB。近3年的馆藏电子档案和档案数字化成果存量平均增幅在27%左右。特别是2021年新修订的档案法实施后,仅2022年馆藏电子档案量增幅就达45.6%。数字档案资源建设取得丰硕成果,为档案数字化战略转型提供了强有力的支撑。

    在此背景下,档案保管对象发生深刻变化,保管好档案数字资源面临更大挑战。档案数字资源是国家和民族记忆的信息资产,真实、可靠、完整地长期保存它们是推进“四个体系”建设的基石。然而,传统和新型存储技术都存在各自问题,解决不好势必导致基石不牢。

    科研所以问题为导向,致力于档案数字资源长期安全保存的相关研究,对目前主要存储载体——硬磁盘、磁带、光盘、固态硬盘等开展了大量研究工作,制定相关行业标准,为全国档案部门运用上述载体存储档案数字资源提供了科学指导。

    通过研究,我们发现,上述载体的寿命大大短于档案数字资源的生命周期,并不完全符合数字时代下档案数字资源保管过程中“长期”和“安全”两个基本要素。硬磁盘、固态硬盘的平均可靠寿命仅3至5年,需要投入较大的人力、资金对数据进行频繁迁移。LTO磁带厂商虽标称其存储寿命可达30年,但因其读写设备——磁带库存在读取数据向前仅兼容2代、写入数据向前仅兼容1代的问题(以LTO9磁带为例,其配套的磁带库仅可读取LTO7、LTO8、LTO9磁带中的数据,仅可向LTO8、LTO9磁带写入数据),且LTO磁带每2至3年会更新升级至容量更大、速度更快的新版本,所以其实际存储时间不宜超过10年。根据《档案数据存储用LTO磁带应用规范》的要求,保存时间超过10年的磁带,宜进行更新或转换。然而,倒带和迁移的工作量较大,并需同步更新载体和LTO磁带库设备,成本较高。档案行业广泛应用的蓝光光盘理论寿命虽为30年,但其诞生至今不过20余载,没有真正历经岁月的检验。

    值得注意的是,2023年1月28日,日本松下公司宣布停止生产蓝光刻录光盘,更为蓝光光盘的未来发展蒙上一层阴影。此外,除固态硬盘外,上述载体的技术标准均由国外掌控,硬磁盘、磁带在国内甚至无生产制造能力,在当下日益复杂严峻的国际形势下,非自主可控的存储载体为档案数字资源长期存储带来了极大安全风险。

    与此同时,我们还持续关注了全息光盘、玻璃存储、DNA存储等新技术,但上述技术现阶段尚处于实验室研究阶段,价格和成本高昂,短期内无法在档案部门得到应用。

    记者:何为数字胶片技术?它在档案数字资源的长期保存方面有哪些优势?

    王善柏:我们都知道传统的缩微影像技术是把纸质档案或版式文件原封不动地以缩小影像的形式拍摄记录在胶片上。胶片上呈现的是直观的模拟影像,优点是可借助基本放大设备直接读取内容,不易篡改,具备较强的法律凭证功能;缺点是仅能保存图像信息,在一定程度上影响了电子档案的原始属性,且多数计算机文件格式数据(如音视频文件、CAD等)无法得到保存,还存在存储容量较小(一帧只能保存一个画幅)等问题。

    数字胶片技术是传统缩微影像技术和计算机编码技术的综合创新应用,其利用胶片载体性质稳定、可保存数百年的优势,结合计算机编解码转换和算法扩容,实现真正意义上的数据长期安全保存和快速有效利用。其基本原理是将档案数字资源信息利用数字编码技术生成高密度二维码图像,再采用反射投影的方式将二维码图像输出到胶片上,通过冲洗制作成存储电子档案的胶片盘,进行数据备份和长期保存。需要利用时,通过批量扫描识别胶片上的二维码图像,解码还原为原始的档案数字资源,实现真实有效的还原利用。

    数字胶片技术的数据“落脚点”是胶片,胶片的理论寿命可达500年,并已历经了140余个春秋的实践印证。其性能稳定可靠,无法随意篡改,离线放置无能源消耗,保存得当可极大减少数据迁移的工作量,非常适合以“冷数据”(利用率低且必须保存的数据)为主的档案数字资源的长期安全存储。

    同时,在编码技术、高精度写入读取设备和数字胶片的支持下,打破缩微胶片仅能存储影像信息的局限性,可直接保存文档、图像、音视频、数据库文件、CAD图纸等,更加适用于信息时代下电子档案的长期安全保存工作。

    记者:“档案数字资源备份策略及数字胶片技术应用研究”项目立项以来是如何开展工作的?

    王善柏:科研所早在2013年就开展过相关技术的研究,并获国家档案局优秀科技成果二等奖,但受限于当时的技术水平,仅能存储小容量档案目录信息。近年来,我国光电、胶片、制造等技术的飞速发展为该技术进一步研究发展带来契机。

    在前期研究积累和技术成熟的基础上,2022年,由科研所牵头联合上海鸿翼档案信息技术有限公司、中国人民大学档案学院、上海市高级人民法院、中国乐凯集团有限公司共同申报并成功立项2022年国家档案局重点科技项目“档案数字资源备份策略及数字胶片技术应用研究”。该项目通过产、学、研、用相结合的方式,着力研究档案数字资源备份策略,为档案部门开展备份工作提供科学指导;深入探索数字胶片技术在档案数字资源备份中的应用,研发基于数字胶片技术的写入、读取、冲洗、长期保存等一整套相关设备及国产化数字胶片载体,为档案数字资源长期安全保存工作提供新的解决方案。

    记者:目前,该项目在核心技术攻关、产品研发、设备制造等方面取得了哪些成果?

    王善柏:经过2年的研究,在项目组的共同努力下,已完全掌握数字胶片技术的相关原理,基本实现国产化核心技术的解决方案,国产化数字胶片载体和配套软硬件设备研制工作取得重大突破。

    在载体方面,相对于在档案行业广泛应用的感光颗粒大小为180nm—200nm的进口缩微胶片,项目研发的国产化数字胶片感光颗粒大小仅为进口缩微胶片的三分之一——60nm,实际解像力已可达到1000线对/mm以上,为单位面积存储高密度二维码图像提供了更大的空间。目前,该胶片已进入小规模试产阶段,基本达到国际领先水平。

    在写入设备方面,成功研发精度为4K的第3代数据写入设备。该设备在数字胶片的支持下,在24×12mm的单个画幅中可存储800多万个数据点,采用四色技术(黑、深灰、浅灰、白)的单画幅存储容量已达2MB数据,与实验验证的进口缩微胶片45×32mm单画幅仅能存储63KB数据相比,取得了质的飞跃。此外,在提高设备写入精度的同时,积极提高设备的写入效率,现设备已实现每分钟曝光1500个画幅,即写入速度达50MB/s,与一般COM设备每分钟输出约5.88个画幅相比,写入效率提升了200多倍。在此基础上,项目组仍在持续推进精度更高的新一代数据写入设备研发工作,以期进一步提升存储容量。

    在冲洗设备方面,成功研发第2代数字胶片冲洗机。考虑到数字胶片连续写入需求导致其单卷长度较长等因素,为保障冲洗超长(900米以上)胶片的显、定影液药液浓度,设备已实现冲洗药液自动补充等功能,并达到预定技术指标。同时,配套数字胶片冲洗工作的显影液、定影液已研发完成。

    在读取和保管设备方面,升级迭代后的第3代专业版数据读取设备已进入小规模量产阶段,生产的部分设备已用于参展和交付试点单位;第2代数字胶片储存柜也已进入小规模量产阶段。

    截至目前,上述设备中除写入设备的DMD芯片外,项目研发的配套设备、载体和编码技术均已全部实现国产化,基本解决了技术“卡脖子”问题。

    记者:请介绍一下项目后期成果的验证、应用、推广情况?

    王善柏:下一步,我们将在现有成果的基础上,根据项目计划,积极在综合档案馆、机关档案室、企业和高校档案馆等单位开展试点应用,在实践中进一步加强设备的易用性、稳定性,验证载体的可靠性,蹄疾步稳地推进整套数字胶片国产化方案落地见效。

    项目验收后,我们将在档案工作者年会、报刊等行业重要学术平台积极发声,加强该技术的推广宣传。同时,在存储容量、工作效率、标准化等方面持续开展相关研究。相信,通过不懈努力,在不久的将来,数字胶片技术定会进一步实现全流程标准化、全设备载体国产化,将中国人自己的档案数字资源牢牢掌握在我们自己手中!

    原载于《中国档案报》2024年2月19日 总第4099期 第四版

 
 
打印本页
关闭窗口