CNKI论文汇编 | 科学数据共享与出版的研究与实践

浏览次数:166

随着科学数据的指数级增长,《科学数据管理办法》的出台,《科学数据引用》国家标准 (GB/T 35294-2017)的正式实施,《中国科学院科学数据管理与开放共享办法(试行)》的发布,科学数据的共享、评价、传播、权益等受到越来越多的关注,科学数据开放共享的条件也日趋成熟。

中国科学院作为中国自然科学的研究中心,在长期的科学研究实践中,通过观测、考察、试验、计算等多种途径产生和积累了大量具有重要科学价值和实用意义的科学数据和资料。1982年,中国科学院将科学数据库建设列入了“七五”和后十年重大基本建设项目。1986年,国家计委对“科学数据库及其信息系统”工程任务书进行了批复,科学数据库及其信息系统开始启动建设。

中国科学院计算机网络信息中心(Computer Network Information Center, Chinese Academy of Sciences,简称CNKI)成立于1995年3月,作为中国科学院科研信息化与管理信息化的系统集成、运行和服务保障机构,信息化应用技术的研发和示范基地,自1986年中国科学院科学数据库工程起,长期负责中国科学院信息化环境存储设施的建设和运行服务。通过多年工作的积累,已提出一套完善的科学数据汇聚、存储、管理、共享与服务通用解决方案,同时也面向学科领域深度挖掘,建立了地理空间数据云等特色数据平台。

到2015年底,科技数据资源整合与共享工程项目建成了52PB 存储容量的数据资源中心,系统地整合了58家单位的科学数据库,可共享数据量达655TB。目前,科学数据库持续积累与服务提升,已建设了7个学科领域重点数据库及20个特色数据库,完善了科学数据资源体系建设。

2015年8月,国家批复的首本纯数据期刊——《中国科学数据(中英文网络版)》(www.csdata.org)创刊。同时,开发了一套具有自主知识产权的“数据期刊云服务+数据存储库云服务”一体化数据出版平台;并自主研发了通用型科学数据存储库ScienceDB(www.sciencedb.cn),已建成1个总中心+1个总备份中心+12个区域分中心,总存储空间50 PB的数据存储网络,PB级数据处理能力的数据密集型数据中心,是支撑科学数据出版的必要基础设施。

经过4年出版时间,《中国科学数据(中英文网络版)》已累计发布数据论文248篇,专题特色数据集12 个,发表数据集 238个,数据文件45566个,数据总量 536.88 GB,数据论文下载量14171,数据论文浏览量 1354834,数据集访问次数372276,数据集下载人次 19716,已支持多个“国家科学数据中心”、“国家生物种质与实验材料资源库”的数据出版服务。

以下,分享中国科学院计算机网络信息中心相关人员在科学数据共享与出版的研究和实践方面的论文成果。

 

1. 刘峰,张晓林,孔丽华. 科学数据知识库研究述评[J].现代图书情报技术, 2014, 30(2): 25-31.

2. Chengzan L, Yanfei H, Jianhui L, et al. ScienceDB: A Public Multidisciplinary Research Data Repository for eScience[C]//2017 IEEE 13th International Conference on e-Science (e-Science). IEEE, 2017: 248-255.

3. 李成赞, 张丽丽, 侯艳飞, 等. 科学大数据开放共享: 模式与机制[J]. 情报理论与实践, 2017, 40(11): 45.

4. 吴超, 张丽丽, 李成赞, 胡良霖. 科学数据出版调查与分析[J/OL]. 中国科学数据, 2016, 1(1). http://www.csdata.org/paperView?id=9. DOI: 10.11922/csdata.120.2015.0009.

5. 胡良霖,黎建辉,高瑜蔚,姜璐璐. 科学数据出版应用实践. 中国科研信息化蓝皮书2015, 2016, 304-319.

6. 朱艳华,胡良霖,孔丽华,高瑜蔚,陈希.科学数据引用国家标准研制与推广[J].科研信息化技术与应用,2018,9(6).25-30.

7. 孔丽华, 邵明玥.科学数据出版内容与案例分析[J].科研信息化技术与应用,2018, 9(6).39-46.

8. 孔丽华,习妍,张晓林. 数据出版的趋势、机制与挑战[J].中国科学基金, 2019(5):237-245.

9. 孔丽华,习妍,郎杨琴,汪洋. 数据期刊中科学数据的同行评议方法研究[J].编辑学报, 2019, 29(3): 262-266.

10. 姜璐璐,孔丽华,李成赞. 科学数据出版探索与实践. 第十七届(2019)全国核心期刊与期刊国际化、网络化研讨会论文集, 2019.

11. 习妍, 孔丽华, 姜璐璐. 科技期刊融合出版中网络平台效能的发挥——以《中国科学数据(中英文网络版)》为例[J]. 编辑学报, 2019, sup.2: 25-29.

 

科研数据知识库研究述评

刘峰1,2,3, 张晓林1, 孔丽华1,2,3

1. 中国科学院国家科学图书馆 北京 100190;

2. 中国科学院计算机网络信息中心 北京 100190;

3. 中国科学院大学 北京 100049

摘要[目的]分析描述科研数据知识库及其服务的现状和未来发展方向。[方法]利用Databib开放注册数据,分析科研数据知识库的国别、建立时间、学科领域、隶属机构类型、开放度等分布,并利用GenBank、Dryad、Figshare三个典型数据知识库分析对比科学数据库的服务特色。[结果]科研数据知识库无论在开放趋势还是在服务模式都呈现积极上升和丰富化态势,但在标准化集成化管理和多样化服务模式方面仍有重要发展潜力。[结论]科研数据知识库已有良好的发展基础,但应在基于科研活动全生命周期的科研数据规范化管理和开放科研数据应用机制方面加大研究和发展力度。

关键词:数据知识库;机构知识库;数据管理;数据服务

引用本文:刘峰, 张晓林, 孔丽华. 科研数据知识库研究述评[J]. 现代图书情报技术, 2014, 30(2): 25-31.

 

ScienceDB: A Public Multidisciplinary Research 

Data Repository for eScience

li Chengzan, Hou Yanfei, Li Jianhui, Zhang Lili

Big data technology and application development department, Computer Network Information Center, Chinese Academy of Science, Bejing 100190, China

Abstract: Research data repositories are necessary infrastructures that ensure the data generated for research are accessible, stable, reliable, and reusable. Based on years of accumulated data work experience, the Computer Network Information Center of the Chinese Academy of Sciences has built a multi-disciplinary data repository ScienceDB for research users and teams using its big data storage, analysis and computing environments. This paper firstly introduces the motivation to develop ScienceDB and gives a profile to it. Then the overall technical framework of ScienceDB is introduced, and the key technologies such as the support for multidiscipline extensibility, data collaboration and data recommendation are analyzed deeply. And then this paper presents the functions and features of ScienceDB’s current version and discusses someissues such as its data policy, dataquality assurance measures, and current application status. Finally, it summarizes and puts forward that it needs to carry out more in-depth research and practice of ScienceDB in order to meet the higher requirements of eScience in terms of thorough data association and fusion, data analysis and mining, data evaluation, and so on.

Keywordsresearchdata repository; technical framework; multidiscipline; data recommendation; data collaboration; open data

DOI: 10.1109/eScience.2017.38

Conference: 2017 IEEE 13th International Conference on e-Science (e-Science)

 

科学大数据开放共享:模式与机制

李成赞,张丽丽,侯艳飞,周园春,黎建辉

中国科学院计算机网络信息中心,北京,100190

摘要: 文章结合科学大数据开放共享的案例场景,提炼出5种典型的开放共享模式:大科学装置的单源数据共享模式、广域合作驱动的分布式注册模式、基于数据存储库的集中存缴模式、以数据期刊为代表的科学数据出版以及数据集市,并对这些模式进行分析,识别出关键角色及主要共享瓶颈.在此基础上,探讨了数据开放共享激励机制、评价机制、传播机制等关键机制.希望上述研究能够有助于厘清当前科学大数据开放共享的有关现状,并对其未来推进有所裨益.

关键词:科学大数据  数据开放  数据共享  模式  共享机制 

DOI10.16353/j.cnki.1000-7490.2017.11.009

引用本文:李成赞, 张丽丽, 侯艳飞, 等. 科学大数据开放共享: 模式与机制[J]. 情报理论与实践, 2017, 40(11): 45.

 

科学数据出版调查与分析

黎建辉1*,吴超2,张丽丽1,李成赞1,胡良霖1

1. 中国科学院计算机网络信息中心,科学数据中心,北京 100190;

2. 伦敦帝国理工学院,数据科学研究院,伦敦 SW7 2AZ

摘要:现代科学活动对数据的依赖日益增强,这使得推动科学数据开放共享逐渐成为现代科学研究的必然诉求。然而科学数据共享实践仍存在诸多障碍。为了更好地协调科学数据开放共享相关利益者的权益分配、减少数据开放的阻力,科学数据出版提供了一种积极的模式探索。立足现代科研活动背景,本文面向在ESSD、ESA、GBIF、DRYAD、PANGAEN等机构发表数据论文的上千名作者展开数据出版调查。本调查于2014年8月至12月进行,重点围绕数据出版动力、数据出版方式、数据出版运营模式以及数据出版质量评价展开。调查结果显示,数据出版作为推动科学数据共享的途径之一,已获得较广泛共识。当前数据出版发展初具规模并进入快速上升期。与传统出版相比,数据出版在树立学术地位和行业认可度等方面还有待提升。运营模式尚不成熟,数据权益保护、运营机制等仍是数据共享的关注焦点。数据引用评价源于传统学术体系又有所不同,亟待建立一套高效合理的质量控制与评价激励机制。

关键词:科学数据;科学数据出版;数据共享;调查统计

论文DOI: 10.11922/csdata.120.2015.0009

Dataset URL:http://www.sciencedb.cn/dataSet/handle/87

引用本文:吴超, 张丽丽, 李成赞, 胡良霖. 科学数据出版调查与分析[J/OL]. 中国科学数据, 2016, 1(1). http://www.csdata.org/p/6/. DOI: 10.11922/csdata.120.2015.0009.

 

 

科学数据出版应用实践

胡良霖,黎建辉,高瑜蔚,姜璐璐

中国科学院计算机网络信息中心 北京 100190

 要:文章在综述国内外科学数据出版研究现状的基础上,结合我国科学数据开放共享的进展及制约因素,重点介绍了我国科学数据出版的时间,明确出版流程、建立标准体系、构建出版系统、创立数据存仓库,并主办国家网络连续型出版物的首批试点刊物《中国科学数据》(China Scientific Data,国内统一连续出版物号CN11-6035/N),建设数据出版平台和科学数据存储库,面向未来数据出版全面发展审读思考了数据出版生态系统的建设,力推我国科学数据出版的健康发展。

关键词:数据出版;数据论文;中国科学数据

引用本文:胡良霖,黎建辉,高瑜蔚,姜璐璐. 科学数据出版应用实践[M]. 中国科研信息化蓝皮书2015-2016: 304-319.

 

科学数据引用国家标准研制与推广

朱艳华,胡良霖*,孔丽华,高瑜蔚,陈希

中国科学院计算机网络信息中心,北京 100190

  :2017年12月,《科学数据引用》国家标准 (标准号为GB/T 35294-2017) 正式发布,该标准规定了科 学数据引用元素描述方法、引用元素详细说明、引用格式等方面的内容,适用于科学数据传播机构、数据使用者等。该标准的发布标志着科学数据可以像学术论文一样被研究者引用,在一定程度上促进数据拥有者开放共享其数据。自标准发布以后,一些科学数据发布平台和科研项目开始使用标准规定的元素和引用格式。

关键词:科学数据;数据引用;国家标准;研制推广

DOI: 10.11871/j.issn.1674-9480.2018.06.004

引用本文:朱艳华, 胡良霖, 孔丽华, 高瑜蔚, 陈希. 科学数据引用国家标准研制与推广[J]. 科研信息化技术与应用, 2018, 9(6): 25-30.

 

科学数据出版内容与案例分析

孔丽华1,2,3, 邵明玥4

1 中国科学院文献情报中心,北京 100190;
2. 中国科学院计算机网络信息中心,北京 100190;
3. 中国科学院大学,北京 100049;
4. 北京师范大学,北京 100875;

 :本文以近年来迅速发展的数据期刊为研究对象,通过统计和分析国内外代表性数据期刊的发文量、学科分部、引证指标、稿源机构分部等,试图分析和探讨数据出版内容的分布及趋势。以期对数据期刊的出版情况进行了解,希望对我国在数据出版及数据共享方面的相关工作起到一定参考作用。

关键词:数据出版;数据论文;数据期刊

引用本文:孔丽华, 邵明玥.科学数据出版内容与案例分析[J].科研信息化技术与应用,2018, 9(6): 39-46.

 

数据出版的趋势、机制与挑战

孔丽华,, 习 妍 张晓林

1 中国科学院文献情报中心,北京 100190

2 中国科学院大学经济与管理学院图书情报与档案管理系,北京100049

3 中国科学院计算机网络信息中心,北京100190

摘要:数据出版是激励数据传播、促进数据共享的重要方式之一.本文通过对国内外科研数 据存储库、国内外主要科技出版商、代表性学术研究期刊和专门数据期刊的调研,对当前作为数据 文档自存储发布、作为学术论文辅助数据文档发布、作为专门数据论文发表等三种机制进行了分 析,提炼梳理了它们的数据出版政策要素,分析了我国数据出版面临的挑战并提出针对性建议.

关键词:开放数据;数据出版;论文辅助文档;数据期刊;数据存储库;政策

引用本文:孔丽华,习妍,张晓林. 数据出版的趋势、机制与挑战[J]. 中国科学基金, 2019(5):237-245.

 

数据期刊中科学数据的同行评议方法研究

孔丽华1,2,3 习妍3 郎杨琴3 汪洋3

1. 中国科学院文献情报中心

2. 中国科学院大学

3. 中国科学院计算机网络信息中心

摘要:数据是科学假设、科学分析以及科学理论形成的基础证据,是同行科学家数据评估和检测科研结果的重要证据。数据出版是数据开放共享的重要手段之一。在数据出版的过程中,对数据的评审是重要的环节之一。文章通过对现有数据出版平台中数据评审要求进行调研,并基于FAIR数据共享原则,旨在提出一种数据期刊中科学数据的同行评议指标体系,从而提升数据质量审核,促进科学数据的可发现(findable)、可访问(accessible)、可理解(intelligible)、可重用(reusable),进而推进科学数据的开放、共享和引用。

关键词:数据出版;数据期刊;数据论文;同行评议

DOI: 10.16811/j.cnki.1001-4314.2019.03.007

引用本文:孔丽华,习妍,郎杨琴,汪洋. 数据期刊中科学数据的同行评议方法研究[J].编辑学报, 2019, 29(3):262-266.

 

科学数据出版探索与实践

姜璐璐 孔丽华 李成赞

中国科学院计算机网络信息中心,北京  100190

摘要:随着信息技术的快速发展,数据已成为重要的战略资源,科学研究需要一种开放的模式。互联网技术的发展为期刊的出版带来了新的可能,通过互联网来实现快速传播,突破了对纸媒的依赖,使得期刊新模式成为可能。本文基于数据出版模式进行了探索与实践,提出了一套基于云环境的数据出版技术框架体系,并在框架体系指导下,实现了一套具有自主知识产权的“数据期刊云服务+数据存储库云服务”一体化数据出版平台。

关键词:数据出版;ScienceDB;出版框架

引用本文:姜璐璐,孔丽华,李成赞. 科学数据出版探索与实践. 第十七届(2019)全国核心期刊与期刊国际化、网络化研讨会论文集, 2019.

 

科技期刊融合出版中网络平台效能的发挥

——以《中国科学数据(中英文网络版)》为例

习妍1,2)  孔丽华1,2)  姜璐璐1)

1)中国科学院计算机网络信息中心;

2)《中国科学数据(中英文网络版)》编辑部

摘要:媒体融合发展已成为科技期刊发展的趋势。《中国科学数据(中英文网络版)》作为以数据出版和网络出版为特色的新型科技期刊,借助主办单位中国科学院计算机网络信息中心的技术与资源优势,在平台建设、内容融合、传播渠道、知识服务等方面进行了初步实践和创新。本文主要围绕其网络平台核心理念、投审稿平台设计、灵活出版策略、阅读体验提升、开放共享氛围、科研社交环境、数据分析利用进行阐述,以供科技期刊工作者、出版服务商等研究、分析与讨论。

关键词:科技期刊;媒体融合;网络出版

引用本文:习妍, 孔丽华, 姜璐璐. 科技期刊融合出版中网络平台效能的发挥——以《中国科学数据(中英文网络版)》为例[J]. 编辑学报, 2019, sup.2: 25-29.