新闻中心 > 要闻

加快人工智能技术在档案管理工作中的应用

作者:祝 成

来源:中国档案报

2021-01-15 星期五

    近年来,人工智能技术呈井喷式发展,在诸多领域引发变革,成为各国政府、产业界、科研机构及消费市场竞相追逐的国家战略级科技技术,并已深入人们工作、生活的方方面面,在提高生活质量、增强工作效率、推动社会发展等方面发挥着巨大作用。

    我国高度重视人工智能技术发展,从国家层面、行业层面、地方层面纷纷制定人工智能相关政策,积极推动人工智能技术发展及其落地应用。档案行业在战略转型的过程中,也积极拥抱人工智能技术,目前,已有部分档案部门率先开展基于人工智能技术的应用与研究工作,并取得一定成果。

    从人工智能技术发展现状与档案行业迫切需求等角度来看,人工智能技术目前主要可应用于档案数据化、分类与划控、档案影像修复着色、智能安防4类工作场景中。

    一是档案数据化工作领域。“数据化”是近年来在档案行业被反复提及的热门词汇。档案数据化旨在将图像、声像等档案中的内容识别成计算机可编辑、处理、分析、检索的信息。档案数据化工作又可具体分为纸质档案数字化副本OCR(光学字符识别)、照片档案数据化、录音档案数据化、录像档案数据化4种场景。

    在国家档案局大力实施“存量数字化、增量电子化”战略的背景下,全国各级档案馆(室)存量档案数字化工作成效显著。截至2019年年底,全国各级综合档案馆馆藏档案数字化副本量已达1407.8万GB。部分地区档案部门在完成纸质档案数字化工作的基础上,纷纷启动了档案OCR全文识别工作。国家档案局因势利导,于2019年12月出台《纸质档案数字复制件光学字符识别(OCR)工作规范》,标志着该项工作在档案行业已全面启动。基于人工智能技术的OCR在简体印刷文字方面的识别率已达98%以上,为档案部门持续开展OCR工作提供了技术保障。

    近年来,语音识别技术发展迅速,基于标准普通话的语音识别率已达97%以上。人脸识别技术也不断成熟,已广泛应用于安防、金融认证等方面。与此同时,随着影像技术的不断发展,存储成本降低,数字录音、数字录像档案存量不断增长。档案部门也积极探索数字录音、数字录像档案的数据化工作,并基于人工智能技术开展相关研究,取得较大进展。浙江省档案馆与科大讯飞公司联合开展了国家档案局科技项目《人工智能技术在音视频档案整理利用中的应用研究》,通过综合运用语音识别、人脸识别等技术实现语音全文数据化、人物智能聚合等,项目成果于2020年9月3日正式发布。

    二是分类与划控工作领域。归档分类和划控鉴定是两种工作场景,但从技术角度来看,有相同之处,因此,笔者将这两者归为一类进行阐述。分类与赋予保管期限工作一直是档案管理领域的基础性工作,但由于重视程度不够、专业人员匮乏等原因,该工作一直是部分基层档案部门面临的比较棘手的问题。通过人工智能技术辅助缺乏经验的档案管理工作人员开展归档分类工作,可解决基层档案部门的难点问题,提高归档效率与准确性,具有一定的实用价值。

    划控鉴定工作难度大、风险高、责任大,且相关专家人数少,标准不统一,在一定程度上阻碍了档案的开放工作。新修订的档案法已正式实施,本次修订的重大内容之一是缩短了档案开放期限、扩大了开放主体、拓宽了开放渠道和方式,并对不按规定开放的责任追究等作出具体规定,此举必将进一步促进档案的开放工作。

    当前,已有档案部门率先开展基于人工智能技术的研究与应用工作,如中国移动通信集团江苏有限公司基于TextCNN(利用卷积神经网络对文本进行分类的算法)人工智能算法开展档案保管期限鉴定工作;安徽省档案局与科大讯飞公司联合开展了国家档案局科技项目《人工智能技术在档案划控上的应用》,辅助档案管理人员开展档案划控鉴定工作。

    三是档案影像修复着色工作。在新中国成立70周年之际,中央档案馆公布了迄今关于开国大典时间最长、内容最完整的彩色录像档案,在网络上引起了巨大轰动,该彩色录像档案被各大媒体转载报道,仅24小时浏览量就达到3.2亿次。同期上映的电影《决战时刻》斥巨资将开国大典黑白影像修复为4K彩色影像,也同样引起了较大的社会反响。虽然修复着色后的档案影像在一定程度上改变了其原貌,甚至无法再将其作为档案,但是在信息时代下,清晰彩色的历史影像不仅能增强人们对历史的好奇心和兴趣,激发人们的民族自豪感,还能充分发挥档案在爱国主义宣传、教育等方面的作用。因此,档案影像修复着色工作具有一定的社会效益。国家档案局档案科学技术研究所研究二室已在该领域开展相关实验并申报课题,下一步,将在基于人工智能技术的档案影像修复着色领域持续开展应用研究。

    四是智能安防工作。当前,智能安防技术已发展得十分成熟,从2005年开始启动的平安城市建设,到2011年启动的智慧城市建设,以及天网工程、“雪亮工程”等安防重点项目处处可见人工智能技术的影子。作为智慧档案馆的一部分,许多档案部门已将智能安防系统纳入规划、建设内容之中。当前,先进的智能安防系统多采用集人脸识别、步态识别、人体特征识别、语音识别等于一体的多模态识别技术,进一步提高了智能安防系统的安全等级,为档案安防工作提供更好的技术保障。

    当下,人工智能技术的发展已日趋成熟,简体印刷文字OCR识别、标准普通话语音识别等功能基本可直接应用于档案工作。在现阶段的人工智能技术条件下,要拓宽更多的应用场景还需进一步开展算法优化、模型设计及训练等适配工作,并投入一定成本。为适应时代发展,应进一步发掘人工智能技术在档案管理工作中的应用场景,加强对人工智能技术的研究与应用,尽快建立健全相关标准,着力打造“会技术,懂档案”的复合型人才队伍,科学运用新一代信息技术加速档案事业战略转型工作。

    原载于《中国档案报》2021年1月14日 总第3628期 第三版

 
 
责任编辑:张雪
 
版权所有,未经许可,不得转载。