中国科学院“科技文献知识科学数据中心”(以下简称“科学数据中心”),依托中国科学院文献情报中心丰富的科技文献知识资源与专业团队建设。科学数据中心旨在发挥科技文献知识阵地作用,实现对全球科技领域“论文、专利、图书、政策、标准、会议、报告、奖项、项目、学者、机构、工具书”等多类型、多模态科技文献资源的“跟踪与获取、加工与集成、挖掘与标注、管理与服务”。
科学数据中心全面支撑AI4S科技创新,深度开展学科服务、情报分析等应用,致力于打造成为国内领先、国际知名的“科技文献知识科学数据中心”。将发挥枢纽作用,突破数据壁垒,推进与国内外重要科技文献数据库、高校学位论文库、机构知识库、领域特色数据库的深度融合;建立健全数据质量控制体系,为用户提供高质量、高可靠性的科技文献知识资源;健全完善运行管理机制,培养一支高水平的数据治理、知识挖掘、系统开发、智能服务等专业人才队伍,保障科学数据中心高效稳定运行和可持续发展。
“科技文献知识科学数据中心”面向科技文献与知识资源底座建设获取、治理、挖掘、服务全流程,包含以下4个业务方向:
(1)商业资源体系保障与数据权益研究 开展文献资源采购、商业和开放数据资源体系构建研究,第三方资源渠道建设研究,数据资源权益研究、管理和应用。推进文献资源采购模式重塑,加强资源采购风险管理,高质量完成文献资源采购。
(2)全球科技文献数据资源汇聚与治理方法研究 持续汇聚与治理多类型科技文献基础数据,支撑公益学术平台、中国科讯等国家级知识平台的运行,为情报业务提供数据底座;持续扩展数据类型,建设新型特色数据。
(3)面向AI4S的科技文献知识底座建设研究 面向AI4S及其对数据与知识基础设施的需求,开展多层次的AI-Ready新型数据建设,形成科技文献解构语料库、科技文献深度语义标注语料库和Prompt文献语料库。
(4)科技文献与知识资源的工具能力建设研究 围绕科技文献与知识资源建设全流程,研发覆盖“数据采集、数据清洗、数据解析、数据集成、数据加工、数据挖掘与标引、数据服务”的工具链,形成智能化的数据处理能力。
“科技文献知识科学数据中心”设立理事会和学术委员会,其运行和管理实行理事会领导下的中心主任负责制,执行平台资源共享、有机合作、产品成果分享的行为规范,建立符合创新规律和充满活力的现代管理制度,实现灵活、有效的产学研结合模式,促进符合技术发展规律和市场规律的科技成果转化。学术委员会由领域内的专家和资深工程师组成,主要负责制定和审核科学数据中心的研究方向、技术路线和标准,评估和引进先进技术,指导和监督研究、开发和应用,以及研究难题的攻关等。
科学数据中心的领导团队包含1名中心主任和3名副主任,设置秘书岗位2名,协助领导团队工作。中心下设4个业务部门,分别对应中心的4个业务方向,具体为商业资源体系保障与数据权益研究部、科技文献数据汇聚与治理研究部、面向AI4S的科技文献知识底座建设研究部、科技文献与知识资源的工具能力建设研究部。每个业务部门设立部门主任1名,副主任1名,分管各个业务方向的发展建设。各业务部门依据研究内容的具体规模,设岗10~20名不等。此外,学术委员会设置主任1名,副主任2名,委员10余位。
科技文献与知识资源
Literature and Knowledge Resources
功能服务
Functional Services