中国生物多样性数据集专题 I 区论文(评审中) · 版本 ZH1
中国粉蝶标本图像特征数据集
A dataset of image feature for Chinese Pieridae specimen
 >>
: 2017 - 09 - 21
: 2017 - 12 - 11
294 4 0
摘要&关键字
摘要:中国粉蝶标本图像特征数据集是在对蝴蝶标本图像自动识别的研究中产生的。本数据集收集了从457幅经过处理后的中国粉蝶标本图像中提取的3个最常用特征的数值数据,即颜色、形状和纹理特征。本数据集的每条记录都包含了蝴蝶的分类信息、图像编号以及特征信息,为模式识别、昆虫分类等研究提供了基础数据。本数据集是中国蝴蝶标本图像特征数据集的重要组成部分。
关键字:粉蝶科;标本图像;图像特征;模式识别
Abstract & Keywords
Abstract: The dataset of image feature for Chinese Pieridae specimen is created from researches of butterfly image recognition. This dataset collects the color, texture and shape features from 457 pre-processed specimen images of Chinese Pieridae by standardized feature extraction methods. Each record contains the classification information, image identifier, feature ID and feature value of an image. The dataset could support research on pattern recognition and entomology, and supplement the dataset of image feature for Chinese butterflies specimens.
Keywords: Pieridae; specimen image; image feature; pattern recognition
数据库(集)基本信息简介
数据库(集)名称
Title
中国粉蝶标本图像特征数据集
A dataset of image feature for Chinese Pieridae specimen
数据作者
Data authors
王江宁,韩艳,纪力强
Wang Jiangning, Han Yan, Ji Liqiang
通讯作者
Corresponding author
纪力强
(ji@ioz.ac.cn)
数据时间范围
Time range
1994
地理区域
Geographical scope
中国
China
数据量
Data volume
1.62 MB
数据格式
Data format
*.xlsx
数据服务系统网址
Data service system
http://www.sciencedb.cn/dataSet/handle/483
基金项目
Sources of funding
1. 国家自然科学青年基金(2016),基于在线学习的昆虫图像识别方法的研究及其在蝴蝶识别中的应用,31501841
2. 国家科技部国家科技基础条件平台项目“国家基础科学数据共享服务平台”(DKA2017-12-02-20)
1. “Insect Image Recognition Based on Online Learning and Its Application in Butterfly Recognition (Grant No.31501841), National Natural Science Youth Fund (2016);
2. “Fundamental Science Data Sharing Platform” (DKA2017-12-02-20), National R&D Infrastructure and Facility Development Program of China (2017),
数据库(集)组成
Dataset composition
本数据集在excel的sheet1表中,有4个字段组成,其数据样本描述可以参考《中国凤蝶标本图像特征数据集》一文的数据样本描述。
This dataset has 4 fields in the excel’s “sheet1” table. The means of these fields is as same as those described in Feature dataset of Chinese papilionidae specimen image.
关联数据集
Associated dataset
《中国凤蝶标本图像特征数据集》,发表于《中国科学数据》2016年第1卷第3期,网址:http://www.csdata.org/p/34/
A dataset of image feature for Chinese papilionidae specimen, published in China Scientific Data (Vol.1, No.3, 2017), available at: <http://www.csdata.org/en/p/34/>.
关联说明
Association description
数据集加工方法、质控方法的相同,标本数据源的生物类群不同。
This study uses the same methods for data collection, processing, quality control and assessment as the associated study, but generates different taxon of Chinese Pieridae.
动物的分类系统相对于其它生命的分类系统较为复杂、种类繁多,因此动物图像采集与其它生物图像采集相比较为困难。对于蝴蝶来说,从标本采集到图像采集,再至特征提取,能够使用的数据已经非常少了。为了便于蝴蝶模式识别研究和应用,2016年我们发布了《中国凤蝶标本图像特征数据集》[1]
粉蝶和凤蝶是蝴蝶的两大常见类群。继收集整理《中国蝶类志》(1994版)[2]中的凤蝶标本图片后,针对粉蝶图像经过类似的处理[1,3],我们获取了粉蝶图像特征数据集,依然配有准确的分类学信息、模式识别方法。
由于本数据集与《中国凤蝶标本图像特征数据集》的采集方法、结构组成、质量评估和控制、使用方法等都相同,因此这些部分请参考关联文献[1],此处不再赘述。两者的比较如表1所示。两者共同构成了更完整的蝴蝶标本图像特征数据集。但是因为数据获取需要时间,而且面向的蝴蝶类群不同,因此也是相对独立的数据集,是对蝴蝶整体数据的重要补充。昆虫分类学研究人员可以将其与凤蝶标本图像特征数据集结合使用。
表1   新旧数据集比较
比较项目说明
数据采集和处理方法相同
数据结构组成涉及生物类群不同
数据质量控制和评估相同
数据价值与不同生物类群的应用价值有关联,因此数据价值相似但不完全相同
数据使用方法相同
致 谢
感谢研究组张荣在原始图像处理中所作的工作。
[1]
王江宁, 韩艳, 纪力强. 中国凤蝶标本图像特征数据集[J]. 中国科学数据, 2016, 1(3). DOI: 10.11922/csdata.180.2015.0008.
[2]
周尧. 中国蝶类志[M]. 郑州: 河南科学技术出版社, 1994.
[3]
WANG J N, JI L Q, LIANG A P, et al. The identification of butterfly families using content-based image retrieval [J]. Biosystems Engineering, 2012, 111(1): 24-32.
数据引用格式
王江宁, 韩艳, 纪力强. 中国粉蝶标本图像特征数据集[DB/OL]. Science Data Bank, 2017. (2017-09-21). DOI: 10.11922/sciencedb.483.
稿件与作者信息
论文引用格式
王江宁, 韩艳, 纪力强. 中国粉蝶标本图像特征数据集[J/OL]. 中国科学数据, 2017. (2017-11-29). DOI: 10.11922/csdata.2017.15.zh.
王江宁
Wang Jiangning
主要承担本数据集的规划、建设和维护。
(1982—),男,博士,助研,研究方向:昆虫图像识别。
韩艳
Han Yan
主要承担本数据集原始数据的采集和整理。
(1972—),女,学士,工程师,研究方向:生物多样性信息学。
纪力强
Ji Liqiang
主要承担本数据集的设计。
ji@ioz.ac.cn
(1961—),男,博士,研究员,研究方向:生物多样性信息学。
出版历史
I区发布时间:2017年12月14日 ( 版本ZH1
参考文献列表中查看
中国科学数据
csdata
技术支持:印刻学术