海南资源环境遥感产品数据集专题 I 区论文(评审中) 版本 ZH2
下载
基于中高分辨率遥感数据的海南省陆域水体分布数据集
A dataset of land water distribution in Hainan province: Based on medium and high resolution remote sensing data
 >>
: 2018 - 11 - 06
: 2018 - 11 - 22
: 2018 - 11 - 22
287 6 0
摘要&关键词
摘要:陆域水体分布是全球水资源安全和管理、气候变化研究、生态环境动态监测等不可或缺的重要基础信息。本文基于高分1号数据与Landsat 8 OLI数据,通过mRMR特征选择算法,采用面向对象知识规则集自动化提取海南省2015年、2016年、2017年雨季陆域水体分布信息。选取500个验证样本点,结合高分辨率遥感影像与Google Earth对分类结果进行精度验证,得到Kappa系数分别为0.806、0.869、0.913。其中水体信息的误分率与漏提率均低于0.1,分类结果精度较高。本数据集可直接用于陆域地表水体时空分布研究,也可为水环境,如水体水质研究、水资源安全评估等提供数据基础。
关键词:陆域水体;面向对象知识规则集;海南省;中高分辨率遥感
Abstract & Keywords
Abstract: Land water distribution is an indispensable component of global water resource security and management, climate research and ecological environment dynamic monitoring. Based on GF-1 data and Landsat8 OLI data, we used the mRMR feature selection algorithm and the object-oriented knowledge rule set to automatically extract the land water distribution of Hainan province in 2015, 2016 and 2017. Then assisted by high-resolution remote sensing images and Google Earth images, 500 sample points were selected to verify the classification accuracy. Results show a Kappa coefficient of 0.806, 0.869 and 0.913 for the three subsets, respectively, and both an error rate and an omission rate of lower than 0.1, demonstrating a high accuracy of the classification results. This dataset can be directly used to study the spatial and temporal distribution of land surface water. It also provides data basis for water environment research, such as water body studies and water resource safety assessment.
Keywords: land water; object-oriented knowledge rule set; Hainan province; medium and high resolution remote sensing data
数据库(集)基本信息简介
数据库(集)名称基于中高分辨率遥感数据的海南省陆域水体分布数据集
数据作者许芬、孟庆岩、张琳琳
数据通信作者孟庆岩(mengqy@radi.ac.cn)
数据时间范围2015年、2016年、2017年
地理区域海南省:北纬18°10′–20°10′,东经108°37′–111°03′
空间分辨率15 m、16 m
数据量25.3 MB
数据格式*.shp
数据服务系统网址http://www.sciencedb.cn/dataSet/handle/673
基金项目海南省重大科技计划项目(2017-2018),海南省遥感大数据服务平台建设与应用示范,ZDKJ2016021;四川省科技计划项目(2018-2020),基于大数据机器学习与冠层反射率模型结合的水稻叶面积指数提取技术,2018JZ0054。
数据库(集)组成数据集由3部分数据组成,分别为3个不同年份(2015年、2016年、2017年)水体分布结果数据,每部分数据包含*.dbf,*.prj,*.shp,*.shx ,*.sbx,*.sbn,*.xml 8个文件,示例如下:
1. 2015.dbf为2015年矢量数据dBASE表文件;
2. 2015.prj为2015矢量数据坐标投影文件;
3. 2015.shp为2015矢量数据主文件;
4. 2015.shx为2015矢量数据索引文件,存储地理数据几何特征的索引;
5. 2015.jpeg为2015年水体产品分布结果图;
6. *.sbx和*.sbn为矢量数据索引文件,存储地物特征的索引;
7. *.xml为对数据的描述,方便实现数据交换。
Dataset Profile
TitleA dataset of land water distribution in Hainan province: Based on medium and high resolution remote sensing data
Data corresponding authorMeng Qingyan (mengqy@radi.ac.cn)
Data authorsXu Fen, Meng Qingyan, Zhang Linlin
Time range2015, 2016, 2017
Geographical scopeHainan province (18°10′N–20°10′N, 108°37E′–111°03′E)
Spatial resolution15m,16m
Data volume25.3MB
Data format*.shp
Data service systemhttp://www.sciencedb.cn/dataSet/handle/673
Sources of fundingMajor Science and Technology Plan of Hainan Province (2017–2018) – Construction and Application Demonstration of the Remote Sensing Data Service Platform of Hainan Province (ZDKJ2016021); Science and Technology Program of Sichuan Province (2018–2020) – Technology for Extraction of Rice LAI Based on Big Data Machine Learning and Canopy Reflectance Model (2018JZ0054)
Dataset compositionThis dataset consists of three subsets in total, which store data of water distribution in three consecutive years. Each subset contains eight files: *.dbf, *.prj, *.shp, *.shx. *.sbx, *.sbn, *.xml. An example is shown as follows:
1. 2015.dbf is the dBASE table file for vector data in 2015.
2. 2015. prj is the coordinate projection file for vector data in 2015.
3. 2015. shp is the main file for vector data in 2015.
4. 2015. shx is the index file for vector data in 2015; geographic data geometric feature index.
5. 2015.jpeg is the water distribution image product for the year 2015.
6. *.sbx and *.sbn is the vector data index files, storage features characteristic index.
7. *.xml is the description of the data and convenient to realize data exchange.
引 言
水是人类赖以生存和社会发展不可替代的战略资源,是全球水资源安全和管理、气候变化研究、生态环境动态监测[1,2,3 ]等不可或缺的重要基础信息。海南省河流众多,水资源丰富,人均水资源占有量达3700立方米,是全国平均水平的1.76倍[4]。随着自然环境的变化与社会经济的发展,由地表水带来的洪水泛滥和水体污染等问题已成为当前人类社会关注的热点问题[5-6]。因此,及时快速监测地表水体动态变化,掌握地表水体空间变化规律,减少其带来的灾害威胁,需开展地表水体产品研制。
国内外大中尺度地表水体产品生成和制图研究成果,主要依赖粗分辨率卫星数据[7],如由联合国环境规划署世界保护监测中心(WCMC)提供的Global Lakes and Wetlands Database(GLWD)主要采集包括湖泊、水库和湿地在内的水体,利用多边形矢量的面积、体积来判断水体,其空间分辨率为30弧秒(大约1 km),覆盖范围在60°S至90°N。然而,大多数的内陆水体面积相对较小,粗分辨率卫星数据难以有效提取出小范围水体信息[8],因此,中高分辨率遥感影像对于中尺度区域的水体提取具有重要意义。本文利用高分1号数据与Landsat 8 OLI多光谱与全色波段融合后的15 m空间分辨率数据,采用面向对象的知识规则集对海南省雨季水体进行自动化提取,最后加以人工修正,得到2015年、2016年、2017年的覆盖全省陆域地表水体信息,一方面为揭示水体分布和动态变化规律提供有效信息,另一方面水体水质监测、水环境评估均需要以准确的水体边界信息为基础。覆盖全省陆域范围的地表水信息能为水资源和环境变化研究提供数据支撑。
1   数据采集和处理方法
1.1   数据采集
1.1.1   区域范围
海南省位于北纬18°10′-20°10′,东经108°37′-111°03′,属热带季风气候,存在明显的干湿季。每年5–10月份是多雨季,总降水量达1500毫米左右,占全年总降水量的70%~90%;每年11月至翌年4月为少雨季节,降水量仅占全年的10%~30%。地势中部高四周低,河流大都发源于中部山区,组成辐射状水系,河流众多,自然形成的湖泊较少,人工水库居多。
1.1.2   影像数据源
高分辨率遥感影像为准确提取陆域水体信息提供了重要的数据源,但随着空间分辨率的提高,影像覆盖范围变小,覆盖全省所需数据量增大,同时海南省云雨天气较多,无云或少云的数据难以满足覆盖全省的要求。而中高空间分辨率数据一方面能满足水体信息准确提取的要求,另一方面能满足覆盖全省范围的需求。本文以2015年、2016年、2017年雨季(5–10月)覆盖整个海南省陆域范围的高分一号WFV传感器产品及Landsat 8 OLI多光谱与全色波段融合后的数据为数据源,空间分辨率分别为16 m、15 m,云量均低于9%,其中高分一号WFV影像数据来源于中国资源卫星应用中心(http://www.cresda.com/CN/),Landsat 8 OLI传感器影像来源于地理空间数据云网站(http://www.gscloud.cn/),海南省遥感影像覆盖范围如图1。


图1   研究区遥感影像(假彩色合成)图
1.2   数据处理
本数据集以经过正射校正、大气校正等预处理后的高分1号及Landsat 8 OLI数据为数据源,再通过影像分割,生成能合理表现地物类型,特别是水体信息的影像对象层;选取对象样本进行特征提取,根据特征信息构建知识规则集提取水体信息;再对分类结果进行滤除碎斑、人工修正等后处理,对分类进行精度评价,最后得到海南省陆域范围的水体分布产品,具体处理流程如图2。


图2   数据处理流程图
1.2.1   数据预处理
首先将高分1号数据与Landsat 8数据结合DEM数据进行正射校正,消除原本由地势起伏等原因所导致的影像几何畸变[9];再根据数据的定标系数,通过辐射定标消除各种辐射失真[10];同时采用改进的6S大气校正模型进行大气校正,基于查找表逐像元计算的方式,对太阳天顶角、水蒸气、臭氧浓度、气溶胶光学厚度等参数进行敏感性分析,得到每个点的大气校正系数用以修正地表反射率影像,从而消除大气的影响[11]。最终得到研究区域的地表反射率产品。
1.2.2   水体信息的提取
首先基于异质性最小原则的区域合并算法FNEA(Fractal Net Evolution Approach),考虑光谱异质性、形状异质性对影像进行多尺度分割,形成影像对象层,统计影响对象层中对象的特征信息,其次基于mRMR算法选择众多特征中的最优特征子集,具体包括水体指数、灰度共生矩阵GLCM(Grey Level Concurrence Matrix)信息熵、形状特征中长宽比,构建知识规则集,提取水体。具体规则集为:首先利用规则水体指数[12](NDWI)大于等于0.3提取出大致水体范围。此范围中除了水体信息,还包含部分云层、山体阴影信息。再通过调节长宽比特征阈值,选取长宽比小于0.2的范围剔除山体阴影信息。通过调节信息熵阈值,确定为大于0.56的范围是云层信息,结合前后时期的影像信息人工判读云层覆盖范围的地表土地利用类型。最后对提取出的水体信息进行碎斑去除等后处理,整理出水体分布产品,结合验证点对最后分类结果进行精度评价。
2   数据样本描述
数据以年份命名,包括3个年份的全省水体分布矢量图,研究范围的矢量边界以“海南省”命名。在ArcGIS中打开由面向对象规则集分类提取出的结果文件,对图斑进行显示和颜色填充,得到2015年、2016年、2017年的水体分布图(图3)。






图3   2015年、2016年、2017年海南省水体分布图
3   数据质量控制和评估
利用ArcGIS软件中Create Random Point工具,在研究区域范围随机生成500个验证点(图4),结合不同时期的Google earth影像数据与部分高分一号PMS传感器2m分辨率影像数据确定验证点的属性值,与分类结果构建误差矩阵,如表1(2015年)、表2(2016年)、表3(2017年)。混淆矩阵中用户精度是指从分类结果中任取一个随机样本,其所具有的类型与地面实际类型相同的条件概率。生产精度指分类中某一类别正确分类的像元数占这一类别所有像元数的比例。总体精度为所有样本中被正确分类的样本比例。Kappa系数则用于反映整体的分类精度,系数越接近1,分类质量越好。


图4   验证样本点分布图
表1   2015年海南省水体分类精度验证混淆矩阵
水体非水体总计生产精度
水体169271960.862
非水体192853040.938
总计188312500
用户精度0.8990.913
总体精度:0.908;Kappa系数:0.806
表2   2016年海南省水体分类精度验证混淆矩阵
水体非水体总计生产精度
水体175181930.907
非水体132943070.958
总计188312500
用户精度0.9310.942
总体精度:0.938; Kappa系数:0.869
表3   2017年海南省水体分类精度验证混淆矩阵
水体非水体总计生产精度
水体16891770.949
非水体203033230.938
总计188312500
用户精度0.8940.971
总体精度:0.96;Kappa系数:0.913
2015年、2016年、2017年的分类结果Kappa系数均大于0.8,分类质量较好。其中2015年水体漏提率为0.101,误分率为0.138,总体精度达到0.908;2016年水体漏提率为0.069,误分率为0.093,总体精度为0.938;2017年水体漏提率为0.106,误分率为0.051,总体精度为0.96,分类结果质量较好,能达到水体分布产品制图要求。
4   数据使用方法和建议
本数据集是基于中高分辨率遥感数据提取得出的3个年份的水体分布数据产品,可比较好地识别小面积湖泊、河流等水域,且分类精度较高,可为水资源时空分布研究提供数据支持,为区域水质水安全等方面的研究提供基础底图,同时可以服务于水资源变化和环境变化研究。
致 谢
感谢地理空间数据云(http://www.gscloud.cn/)提供Landsat 8 OLI数据、GDEMDEM 30M分辨率数字高程数据,中国资源卫星应用中心(http://www.cresda.com/CN/)提供高分1号数据。
[1]
CHAUMETTE P. Changes in land surface water dynamics since the 1990s and relation to population pressure[J]. Geophysical Research Letters, 2012, 39(8): 85-93.
[2]
LUO S, HU H X, CHENG S P, et al. A primary study on species diversity of water birds and its pelationship to water environment at lake Jinyinhu,Wuhan[J]. Resources & Environment in the Yangtze Basin, 2010, 19(6): 671-677.
[3]
QIAO X J, HE B Y, ZHANG W, et al. Modis-based retrieval and change analysis of suspended sediment concentration in middle Yangtze river[J]. Resources & Environment in the Yangtze Basin, 2013.
[4]
李洪波. 海南国际旅游岛建设与水资源保护和发展战略[J]. 新东方, 2012 (3): 18-22.
[5]
PIERDICCA N, PULVIRENTI L, CHINI M, et al. Observing floods from space: Experience gained from COSMO-SkyMed observations[J]. Acta Astronautica, 2013, 84(84): 122-133.
[6]
ALDERMAN K, TURNER L R, TONG S. Floods and human health: a systematic review[J]. Environment International, 2012, 47(16): 37-47.
[7]
FENG M, SEXTON J O, CHANNAN S, et al. A global, high-resolution (30-m) inland water body dataset for 2000: first results of a topographic–spectral classification algorithm[J]. International Journal of Digital Earth, 2015, 9(2): 1-21.
[8]
廖安平, 陈利军, 陈军, 等. 全球陆表水体高分辨率遥感制图[J]. 中国科学: 地球科学, 2014(8): 1634-1645.
[9]
赵英时. 遥感应用分析原理与方法[M]. 北京: 科学出版社, 2013.
[10]
Markham B, Storey J, Morfitt R. Landsat-8 Sensor Characterization and Calibration[J]. Remote Sensing, 2015, 7(3):2279-2282.
[11]
Peng Y, He G, Zhang Z, et al. Study on atmospheric correction approach of Landsat-8 imageries based on 6S model and lookup table[J]. Journal of Applied Remote Sensing, 2016, 10(4):045006.
[12]
徐涵秋. 利用改进的归一化差异水体指数(MNDWI)提取水体信息的研究[J]. 遥感学报, 2005, 9(5): 589-595.
数据引用格式
许芬, 孟庆岩, 张琳琳. 基于中高分辨率遥感数据的海南省陆域水体分布数据集[DB/OL]. Science Data Bank, 2018. (2018-11-06). DOI: 10.11922/sciencedb.673.
稿件与作者信息
论文引用格式
许芬, 孟庆岩, 张琳琳. 基于中高分辨率遥感数据的海南省陆域水体分布数据集[J/OL]. 中国科学数据, 2018. (2018-11-22). DOI: 10.11922/csdata.2018.0068.zh.
许芬
Xu Fen
主要承担工作:数据预处理及数据生产。
(1994—),女,湖北省仙桃市人,硕士,研究方向为遥感信息处理与应用技术。
孟庆岩
Meng Qingyan
主要承担工作:数据产品的设计与组织实施。
mengqy@radi.ac.cn
(1971—),男,黑龙江省肇东市人,博士,研究员,博士生导师,研究方向为城市陆表环境遥感研究。
张琳琳
Zhang Linlin
主要承担工作:数据生产及精度检验。
(1994—),女,河北省衡水市人,博士,研究方向为遥感信息处理与应用技术。
出版历史
I区发布时间:2018年11月22日 ( 版本ZH2
参考文献列表中查看
中国科学数据
csdata