NEWS
党的十八大以来,我国高度重视科技创新,将创新摆在国家发展全局的核心位置,着力推进以科技创新为核心的全面创新。2018年,国务院办公厅印发的《科学数据管理办法》提出了“推动科学数据开放共享”。推动科技档案资源与科学数据的开放共享,是贯彻落实创新驱动发展战略、建设创新型国家的必然要求。目前,学界对科技档案开发利用以及科学数据管理的研究日益增多,但对二者协同融合的研究还比较缺乏。现有研究主要聚焦于科技档案的数字化管理、开放共享、知识服务等方面,以及科学数据相关政策、元数据标准、平台建设等内容,尚未系统深入地探讨科技档案与科学数据的内在关联和协同路径。
一、科技档案与科研数据的概念辨析
1.科技档案的内涵与外延
科技档案是科学技术研究活动中形成的对国家、社会、单位和个人有保存价值的文献材料。从内涵上看,科技档案主要包括反映科研活动过程与结果的各种文字、图表、声像等不同形式的原始记录,翔实地反映了科研活动的重要事宜,是科技成果的重要组成部分。从外延上看,科技档案涵盖了基础研究、应用研究、试验发展等不同类型和阶段的科研活动,覆盖自然科学、工程技术科学、生物科学、管理科学等各个学科领域,贯穿于科研立项、中期检查、结题验收及后续应用的全过程,记录了科研活动的源起、探索、突破直至创新的脉络轨迹。从整体上看,科技档案具有三个特点:其一,科技档案的原始性主要指科技档案是科研活动的第一手原始记录,能够真实、准确、具体地再现科研过程的方方面面;其二,科技档案的系统性是指科技档案依据科研活动的内在逻辑关联而形成,体现了科研过程各环节之间的有机联系;其三,科技档案的特定性则体现在科技档案的形成遵循特定的标准和规范,如实验方法、数据格式、文献著录等,需要具备专门的知识背景才能读懂和利用。
2.科研数据的定义与分类
科学数据是科学研究活动过程中产生的、经过加工整理可供分析利用的数据集合,通常以数字、文本、图像、音视频等形式记录了科研过程的原始观察结果、实验数据、计算结果等。从科研范式演进的角度看,随着大数据、人工智能等新一代信息技术的发展,数据驱动的研究范式日益深入人心,科研数据在整个科研过程中的基础地位和关键作用愈加凸显。科研数据具有多源异构、动态演化等鲜明特点。一般而言,科研数据按照其产生方式可分为观测数据、实验数据、统计数据和衍生数据等多种类型。不同领域、不同环节形成的科研数据在数据模型、格式、标准等方面存在较大差异,这对数据管理提出了较高要求。与此同时,科研数据呈现出动态演化和版本迭代的特点。在科研过程不断深入、新的发现不断涌现的过程中,科研数据也在不断更新完善,因而需要引入数据全生命周期管理、版本控制等方法,以确保数据的连续性、一致性和可追溯性。
3.科技档案与科研数据的关系辨析
科技档案与科研数据在本质内涵、反映侧重点、管理流程等方面既存在联系,又存在一定差异。二者之间的联系主要体现在以下几个方面:首先,科技档案与科研数据均源自科学研究活动,是科研过程不同阶段的原生性记录,共同记载了科研活动从萌发创意到创新突破的发展历程。其次,科技档案与科研数据对于科技创新都具有重要价值,是国家创新发展的基础性战略资源。再次,随着科研方式向数据密集型转变,文本与数据的界限日益模糊,档案管理与数据管理日趋融合,统筹推进科技档案与科研数据的一体化管理,构建档案大数据体系,有利于最大限度地挖掘知识内涵、激发创新活力。然而,科技档案与科研数据在内容导向、管理重点等方面又存在一定差异。科技档案侧重于完整记录和长期保存科研活动的过程性信息,重点关注文件材料的系统性、准确性和安全性;科研数据则更聚焦于细粒度的科学发现和数据再利用,因而对数据质量、数据关联、语义注释等有更高要求。
4.面向协同的双向价值凸显
在数据驱动与知识驱动相融合的全新范式下,推动科技档案与科研数据协同管理和融合开发,可提升二者的双向价值。一方面,科研数据可为科技档案的深入开发以及知识发现提供科研支持,即借助数据集成、数据挖掘、关联分析等方法,可从海量档案资源中发现新的科学问题并提炼关键技术路线,再通过重构前人的研究过程剖析创新性思维逻辑。另一方面,科技档案同样为科研数据的规范化管理以及长期保存提供了切实有效的经验与路径。长期以来,档案事业以及档案工作在档案整理著录、编目组卷、安全存储等方面积累了丰富的理论与实践经验,为规范科研数据管理、保障数据全生命周期的可重复利用提供了参考与指引。档案部门在机构设置、人才队伍组建、制度建设等方面的积累沉淀,为科研数据的系统化、专业化管理提供了有力保障。
二、国内外科技档案与科研数据协同开发的实践进展
1.英美等国的先行探索
科技档案与科研数据的协同管理已成为英美等发达国家推动科技创新的重要举措。以英国为例,英国非常重视科研数据的规范管理和开放共享。2011年,英国颁布了《RCUK数据政策共同准则》,明确将科研数据纳入国家数据开放战略,提出研究者应当采取适当措施,促进用于公共利益的研究数据的开放获取和再利用。在政策引领下,英国研究理事会、英国数据中心等机构协同发力,共同构建科研数据管理制度规范、基础设施和人才队伍,并对科研项目产生的科研数据与文献档案实施统筹管理,有力推动了科研数据与科技档案的融合管理。以美国为例,科研数据开放是美国信息自由以及开放政府的重要组成部分。各资助机构依据备忘录要求,制定了各具特色的数据管理政策,如美国国立卫生研究院(NIH)、美国国家科学基金会(NSF)等均要求受其资助的科研项目必须提交数据管理计划,并在项目结题时将科研数据提交至指定平台。与此同时,美国还高度重视科技档案的数字化管理,美国国家档案和记录管理局制定了一系列标准,规范电子档案的移交、管理和长期保存流程,形成了科研数据与科技档案管理的协同合力。
2.我国的政策实践与问题分析
近年来,我国高度重视科技档案与科研数据的开放共享,相继出台了一系列政策措施。2018年,国务院办公厅印发的《科学数据管理办法》明确提出“推动科学数据开放共享”,并将科研数据纳入各类科技计划项目和基地的绩效评估指标。新修订的《中华人民共和国档案法》的颁布实施,为档案信息化管理、开放利用提供了法律保障。为加强科研档案工作,国家档案局、科学技术部通过了《科学技术研究档案管理规定》,进一步丰富了科技档案的内涵外延,强化了科研单位的主体责任,为科技档案与科研数据的协同管理指明了方向。总的来看,我国科技档案与科研数据领域的政策供给日益完善,为协同管理奠定了良好的制度基础。然而,从实践层面来看,当前我国科技档案与科研数据的协同开发还面临诸多挑战。首先,科研院所的档案管理与数据管理仍存在“两张皮”现象,缺乏统筹规划和制度设计,业务协同与数据融通机制有待完善。其次,科技档案与科研数据在采集、著录、编目等环节缺乏统一的元数据标准,难以实现无缝衔接和关联利用。再次,由于科研数据的特殊属性,传统档案管理范式在数据异质解析、语义关联、知识发现等方面还存在不足,科学数据的深度开发和创新应用仍需进一步探索。
三、科技档案与科研数据的协同开发策略
1.协同管理的总体思路
科技档案与科研数据虽然在形态、内容和管理重点上存在差异,但二者均为科研活动的重要产出,对推动科技进步、激发创新活力具有不可替代的作用。新时期推动二者的协同管理与融合利用,需要树立系统思维,以问题为导向,坚持开放共享、融合创新的基本原则。具体而言,科技档案与科研数据的协同管理应立足科研创新需求,聚焦重大科技计划、科技基础设施等国家战略任务,充分发挥档案部门与科研机构的专业优势,建立健全统筹协调、上下联动的工作机制[3]。在内容方面,协同管理应兼顾科技档案与科研数据全生命周期各环节的特点,从生成到管理、从应用到保存,进行全流程的规划设计、标准规范、平台支撑和服务创新。在实施路径方面,应在夯实协同管理的政策、标准、流程等基础性工作的同时,着力破解制约融合应用的瓶颈问题,积极探索大数据环境下知识发现和价值创造的新模式、新方法。
2.构建一体化的制度规范体系
完备的制度规范是科技档案与科研数据协同管理得以顺利推进的关键保障,目前我国在档案管理、科学数据管理等领域已相继出台了一系列政策法规,但在协同管理层面仍存在空白,档案部门亟须制定专门的指导性文件,明确协同管理的总体要求、基本原则、主要任务以及保障措施。基于此,需构建并完善囊括数据采集、质量控制、安全存储、开放共享等环节的配套标准体系。展开来说,要加快构建不同学科领域的元数据框架以及描述规范,严把科技档案与科研数据等多源异构资源的标引关;要制定统一的数据提交、审核、归档流程规范,明确不同主体的职责界限;要明确数据共享的时间限制、方式以及范围,建立分级开放、多元利用的机制;要建立数据引用标准,完善科研评价机制,激发科研人员提交和开放数据的积极性。科技档案与科研数据协同管理的标准规范应秉持国际视野与本土特色相融合的理念,在参考国际通行做法的同时,依据我国科技创新与档案管理的实际状况,制定切实有效的中国方案。
3.发挥档案专业优势创新多层级的关联融合机制
科技档案在内容组织与安全存储等方面积累了丰富的理论与实践经验,是推动科研数据规范化管理的关键资源,档案部门要充分发挥档案学科在收集、鉴定、整理、编目等环节的专业优势,引入档案全生命周期理念,对科研过程中产生的原始数据、中间文件、正式出版物等内容进行系统整理,实现与传统科技档案的有效对接。另外,面对多源异构的科研数据,还需创新关联融合的理论方法。例如,探索基于本体论的语义关联办法,运用知识图谱技术,构建科技档案与科研数据在语义层面的内在关联,揭示其结构关系与演化规律,也可以探索基于证据链的内容关联办法,从科研数据到科技文献再到科技档案,形成完整的记录链条,保证创新过程和重大成果的可追溯、可复现。
4.着眼开放共享拓展知识服务新内涵
科技档案与科研数据只有实现开放共享,才能最大限度地释放其价值、惠及社会。科技部门和档案部门应以开放的理念与融合的视角,着力破除体制藩篱,构建多方参与、良性互动的开放共享生态。一方面,相关部门要着眼场景应用导向,面向科研和管理中的重大需求开展科技档案与科研数据的关联检索、知识发现、情报分析等增值服务,如运用大数据、人工智能等新一代信息处理技术,建立智能化的分析挖掘与可视化平台,为科技查新、项目评估、决策咨询等提供精准支持。另一方面,要着眼开放引领,在传统档案服务的基础上,创新服务理念、拓展服务内涵,由被动式的“查档服务”向主动式的“档案+服务”转型升级。可探索面向重大科技创新的专题档案知识库构建任务,汇聚科技报告、文献资料、原始数据等多元资源,为攻关突破、成果转化提供精准服务。