新闻中心 > 要闻

挪威国家档案馆使用人工智能处理数字化档案

作者:何露彤 编译

来源:中国档案报

2023-06-08 星期四

    去年以来,挪威国家档案馆使用人工智能处理数字化档案,有效改善用户体验,提升数字服务水平。人工智能存在众多分支,挪威国家档案馆的工作主要集中于自然语言处理(内容提取和分类)、机器学习以及图像识别等领域,目前已有一些成功的人工智能应用实例。

    一是利用人工智能编辑土地登记册中的个人身份证号码。挪威国家档案馆拥有约560万页的土地登记册扫描件,其中许多页面包含公民的个人身份证号码,依据相关隐私保护法律规定,这些个人信息不能进行网络公开。为此,挪威国家档案馆对页面中的个人身份证号码进行了编辑,其中约有6.35万个号码已被手动编辑,而利用人工智能,另外3.2万个号码实现了自动编辑,在极大提高编辑效率的同时,也有效保持较低的编辑错误率,应用效果令人满意。二是利用人工智能从全国人口登记册中提取数据。挪威国家档案馆有数千万份索引卡,它们是全国人口登记册的一部分。索引卡中包含敏感资料,不宜向公众开放,但挪威国家档案馆收到许多对索引卡的信息利用请求,鉴于此,档案馆使用人工智能创建了姓名索引,利用文字识别技术提取了超过1000万张索引卡中的人员姓名,以供挪威税务局、挪威福利与劳工局的研究人员和办案人员使用。三是利用人工智能自动检测元数据。挪威国家档案馆在一些项目中利用人工智能进行了元数据的自动检测,目前已经能够检测出信件标题、发信人姓名、收信人姓名、发信日期等元数据类型,同时档案馆还尝试对元数据进行分类,将其归类为地点、人物、组织等,以便从文件中提取相应概念。

    原载于《中国档案报》2023年6月1日 总第3990期 第三版

 
 
责任编辑:实习编辑 阮伸伸
 
版权所有,未经许可,不得转载。