新闻中心 > 要闻

让电子文件成为数字社会的资源要素

作者:冯惠玲

来源:中国档案报

2022-04-28 星期四

    信息化社会的一个显著特征是从数字化阶段进入了数字赋能阶段,即数字信息被嵌入社会运行中,如数字政府、数字经济、数字文化、智慧城市、数字乡村、数字生活等。信息社会追求信息世界与物理世界的统一融合。在这个融合过程中,信息不以“独善其身”为追求,而是要作为鲜活的要素参与和赋能数字社会的各个领域,“数据要素”“资源要素”的概念逐渐深入人心。

    今年,习近平总书记在《求是》杂志发表了题为《不断做强做优做大我国数字经济》的重要文章,指出“数据作为新型生产要素,对传统生产方式变革具有重大影响。”今年的《政府工作报告》也提出要促进数字经济发展,加强数字中国建设整体布局。那么电子文件怎样才能转变为资源要素,融入数字社会呢?笔者认为,要回答这个问题,需要从“深耕内容:电子文件管理深化与服务升级”这个议题出发。

    为什么要深耕内容?简单来说,以数据驱动为特征的数字化生活需要鲜活的、含义明确的数据作为支撑,而不是静止的、意义不明的文件库藏。《信息简史》一书的作者詹姆斯·格雷克对于文件的电子化收藏有两个忧虑和两个对策。忧虑之一是“当文件进入电子系统中,一旦被归档,从概率上讲,它就不太可能被人读到了”。这里他指的并不是文件公开、档案开放政策问题,而是说读者很难在电子文件系统的汪洋中找到所需信息。忧虑之二是“一大堆数据往往不能告诉我们所需要的知识,也不能确保带来启示和智慧”。与这两个忧虑对应的两个对策就是过滤和搜索。

    然而,进入大数据时代,这两个对策并不足以让电子文件活化为资源要素进入数字社会各领域,即使人们通过鉴定和文件级著录已经实现了对电子文件的过滤和检索,在用户确切表达需求时能够找到相应文件,但文件的作用和功能仍然是有限的、被动的,或是滞后的。只有让电子文件的全部内容自动灵活地匹配任何明确或潜在的需求时,才能使其以要素身份融入大数据战略,为数字政府建设、数字经济发展等提供信息、知识和智慧,实现电子文件价值并使其增值。

    比如,为了优化企业采购行为,针对供应商、采购商品、商品价格等电子业务数据(包括调用归档的电子档案数据),中国石油天然气集团有限公司专门配备了相应的算法模型,为所有的供应商刻画高度精炼的特征标识,形成七大维度立体的供应商信息库,有力地解决了对企业供应商风险判断不明、比价难度大等核心问题。这些业务数据也成为采购活动的依据性要素,能够有效帮助客户优化采购资源、降低采购成本、规避采购风险。此外,他们还对集团全业务场景的数据进行梳理,形成由4个领域、30项业务分析组成的“企业价值地图”,为企业各方面的核算、运行和决策等提供重要的数据支持。

    另一个例子是由瑞士洛桑联邦理工学院和意大利威尼斯档案馆等多机构合作的“威尼斯时光机”项目。通过该项目,研究学者可以知道16世纪威尼斯市中心地区每一栋房子里居住的是什么人。研究学者并没有400多年前该地区的居民档案,而是将收藏于威尼斯档案馆的地图、纳税档案、医疗档案等进行数字化加工和数据关联后,对该地区进行了实景建模和社会网络重建,还原了居住区原貌。

    档案中藏着很多宝贵知识,对其进行电子化、数据化管理,甚至可以实现“点石成金”。尽管对电子文件的常规管理还存在诸多挑战,但不能等管理跟上来了再深耕内容,而是要通过深耕内容推动电子文件管理的高质量、智能化发展。

    那么应该怎么深耕内容呢?笔者认为,需要对电子文件管理目标中的“四性”要求赋予新的内涵,特别是其中的可用性。早期的共识是,把电子文件中的数字信息还原成可以阅读的记录形态就达到可用目的了。笔者认为,在此基础上,应该加上机器的可读、可理解、可表达和可分析,让计算机“能看懂”电子文件内容,借助机器学习、人工智能等技术实现文件内容的知识化和智能化应用,才能让电子文件进入数字社会,成为有独特价值的资源要素。

    数据化管理是深耕内容的基本路径,其中,数据的覆盖面与连接度是两个重要条件。社会学家内尔·格罗斯预测,在21世纪,整个地球都会蒙上一层“电子皮肤”。现在这层电子皮肤正在形成、连接成片,直至覆盖全球,其中相当一部分来自于记录数字社会运行的电子文件。这就要求我们把电子文件的范畴扩大到文图影音等各种原生数据领域,与数据管理深度融合。数据的知识化很大程度上是通过数据连接实现的,主要包括各种系统数据和多种媒介数据的连接,这也是数据主义的基本点,尽管它推崇的数据至上、算法至上有绝对化倾向,但这种强大的数据连接范式正向各个领域蔓延,在复杂的关联中发现和建立各种关系,让数据实现增值。

    电子文件数据的连接有赖于从文件单元到数据单元的细颗粒化、结构化、语义化管理,使计算机能够在数据识读、理解和分析中发现和创造新知识,进而升华为智慧。这是电子文件管理的又一场实质性进阶革命,目标是大幅提升电子文件对于数字业务的贡献度和资产价值,让电子文件深度参与数字社会运行,成为激活数字政府、数字经济、数字生活的资源要素。

    原载于《中国档案报》2022年4月28日 总第3823期 第三版

 
 
责任编辑:实习编辑 程子淇
 
版权所有,未经许可,不得转载。