新闻中心 > 要闻

人工智能在档案领域的应用分析与展望

作者：加小双林妍歆

来源：中国档案报

2023-07-12 星期三

    去年，现象级生成式人工智能ChatGPT的横空出世表明人类迈向人工智能时代的脚步正在加快。人工智能具有的深度学习、跨界融合、人机协同、群智开放、自主操控等优势，能够通过各类工作场景应用的方式与各个领域实现深度关联，在各行业的渗透速率日趋提升，在国家层面的重视程度显著提高。《“十四五”全国档案事业发展规划》明确提出，“积极探索知识管理、人工智能、数字人文等技术在档案信息深层加工和利用中的应用。”可见，将人工智能转化为提升档案管理水平的工具，是加速驱动档案行业变革，顺应智慧化时代档案事业发展趋势的必然选择。近年来，档案实践领域不断涌现出人工智能应用于档案管理的案例与成果，一方面验证了人工智能强大的应用潜力以及与档案领域结合的多重可能，另一方面也为技术如何赋能档案工作积累了宝贵经验，为发现和探索新技术应用存在的风险和挑战提供了实践土壤。

    一、人工智能在档案领域的应用场景

    人工智能技术发展至今，伴随着核心技术的不断破解和应用场景的拓展升级，其在档案领域的应用也从档案著录等传统管理中重复性、机械化的部分工作发展到如今深入档案鉴定、利用等复杂性、逻辑化的业务环节，逐步推动档案工作智慧化的迭代升级。总体来看，人工智能在档案领域的应用场景主要集中在档案资源建设、档案开放利用和档案安全管理3个方面。

    1.“人工智能+档案资源建设”

    人工智能赋能档案资源建设的路径主要是从档案收集、整理和数字化等具体业务入手，针对传统管理环节和流程面临的切实需求，以“记录完整、收集齐全”为目标，为档案资源信息化、数据化的转向提供强大的技术动能。人工智能综合利用智能分类模型、文字处理技术、模式识别技术等手段，对档案管理工作的任务和流程进行程式化的改造，形成自动化、一体化的机器操作模式，推动工作增速提质。以电子档案数据采集为例，人工智能可以辅助档案系统从网页爬取信息，分析并自动捕获元数据，获取所需的档案信息。据有关统计，采用智能采集模型的人工智能的业务水平可以达到专业档案员水平的80%以上。

    2.“人工智能+档案开放利用”

    人工智能应用于档案开放利用能够为解决海量档案的开放审核压力、有限的在线检索和获取渠道、单一形式的开发成果等问题提供全新的思路与方案。人工智能融合自然语言处理技术、语音处理技术和计算机视觉技术，既能够研发、运用智能化平台或检索工具，又可以通过语义解析理解用户操作意图，进而通过推理计算形成反馈内容，在更大程度上方便用户的检索和利用。以智能编研为例，人工智能技术可以运用知识表示与处理技术实现档案垂直领域的知识优化，并通过大数据手段进行用户需求分析，助力档案数据价值、知识价值的发挥，满足用户多元化、个性化的利用需求。

    3.“人工智能+档案安全管理”

    信息时代档案安全管理的重心已经转移到对包含物理层、网络层、传输层和载体介质所组成的复杂的档案生态系统的安全监督和管控。人工智能的应用可以为档案载体安全、信息安全、库房安全、通信安全和存储安全等加固安全墙，构建系统科学的档案安全管理体系。以库房安全为例，人工智能技术可以通过对档案存放位置、库房“八防”状况进行实时感知和跟踪，结合智能管理系统对感知数据按照预设规则进行处理，从而建立起完备的智能安防系统，实现高度自动化的档案实体管理、库房环境控制等。如，江苏省太仓市智慧档案馆将人工智能技术嵌入门禁系统、识别和定位跟踪系统及防火墙中，提高了馆藏档案的安全性。

    二、人工智能应用于档案领域要处理好三组关系

    目前，人工智能在档案资源建设、档案开放利用和档案安全管理等多个领域和场景释放出强大的应用潜能，“人工智能+档案管理”已然成为现实。我们既要看到人工智能带来的机遇和释放的潜力，也要充分认识其潜在的危机和多维的风险。为更有效地将人工智能应用于档案领域，需要正确处理好三组关系。

    第一，正确处理好效率和效益的关系。将人工智能技术应用于档案领域使得大量传统业务环节被编码和算法取代，从而有效降低人工误差，提高档案著录、管理、检索和分析的速度和准确性，提升工作效率，节约时间和人力资源。然而，仅追求效率而忽视效益可能导致档案内容误读、鉴定错误等工作风险的发生，进而造成档案质量下降和信息丢失，破坏甚至严重损害档案工作的效益。为此，需要正确处理好效率和效益的关系。可以通过数据清洗、质量控制、算法优化、数字孪生等手段提高档案数据处理的效果，保障人工智能技术的可靠性和准确性，兼顾效率与效益。

    第二，正确处理好眼前与长远的关系。将人工智能技术应用于档案领域不仅要考虑当前需要和所面临的现实问题，还要预见未来的挑战和需求。一方面，档案部门应注重技术的更新和升级，还可以应用对抗样本等进一步提升人工智能应用的安全系数；另一方面，档案部门在利用人工智能技术过程中要着重考虑保护档案的完整性和可靠性，确保历史的连续性和文化的传承得以延续。

    第三，正确处理好技术和人文的关系。由于人工智能运作的核心在于“大数据”和“算法”，这就意味着档案领域必将面对随之而来的算法黑箱、算法歧视、数据隐私等不确定因素造成的种种风险与挑战。当人工智能将档案管理工作从人文理性推向技术理性，档案领域就必须要正视技术与人文之间的矛盾关系，在技术创新的同时保持对档案人文价值的尊重和关注，确保技术应用符合人文需求和伦理价值。

    三、合理推进人工智能在档案领域的应用

    首先，要对接业务需求，强化技术应用评估。当前，对于人工智能技术的应用评估应主要关注两个方面：一是人工智能工具的性能；二是人工智能应用存在的风险。对于前者而言，由于其性能优劣关乎人工智能技术应用的价值高低，因此对其进行评估能够促进技术应用不断趋于完善。对于后者而言，当算法介入档案整理、保管、编研、利用服务等工作时，算法盗窃、算法歧视、算法黑箱等问题也随之而来，应加强相关风险评估，提升风险预判能力，及时解决不确定性和复杂性带来的危机。

    其次，要开展专业教育，提升人工智能素养。培养人工智能素养，就是引导档案工作者学会科学地使用、批判性地评估人工智能。人工智能人才的培养既要关注技能型的知识，又要关注数据意识和计算思维。在初级阶段，档案工作者可以在重复性、技术要求低的场景中掌握人工智能工具的使用方法和策略。而后随着人工智能素养的不断提升，档案工作者应基于人工智能技术创造性地形成解决问题的思路与进行人工智能应用开发，发挥人工智能技术的巨大优势。

    最后，要严守安全底线，保证档案信息资源安全。档案安全是人工智能应用的底线要求。没有安全保障的技术应用都应被审慎对待。档案是历史和记忆的重要载体，一旦档案数据被篡改或丢失，将导致真相丢失和记忆遗失，带来不可估量的损失。因此，将人工智能应用于档案领域，要严守档案安全底线，确保档案信息的真实、完整、可用和安全。档案工作的实际操作中有许多环节都涉及保密要素和安全问题。如果无法确保人工智能本身的应用安全性，那所谓的智能化将成为空谈。档案部门在应用各种人工智能技术之前必须充分了解其设计思路及具体功能，做好一定的安全评估和管理工作，保证档案信息资源的绝对安全。

    原载于《中国档案报》2023年7月10日总第4007期第三版

责任编辑：张雪

版权所有，未经许可，不得转载。