全球30米地表覆盖数据(GlobeLand30)产品说明 - 图文 下载本文

全球30米地表覆盖数据(GlobeLand30)

产品说明

国家基础地理信息中心

二○一四年五月

目录

1.项目简介 ...................................................................................................................................... 1 2. 分类影像和参考资料................................................................................................................. 1

2.1 分类影像 ........................................................................................................................... 1 2.2 辅助数据 ........................................................................................................................... 4 3.类型定义与赋值........................................................................................................................... 7

3.1类型定义 ............................................................................................................................ 7 3.2类型赋值 ............................................................................................................................ 8 4分类技术指标................................................................................................................................ 9 5. 分类策略与方法....................................................................................................................... 10

5.1分类策略 .......................................................................................................................... 10 5.2分类方法 .......................................................................................................................... 11 6. GlobeLand30产品 ................................................................................................................... 12

6.1 参考坐标系 ..................................................................................................................... 12 6.2 数据分幅 ......................................................................................................................... 13 6.3数据组成及格式 .............................................................................................................. 13 6.4文件命名与组织 .............................................................................................................. 15 7. 精度自评估............................................................................................................................... 16

7.1抽样方案 .......................................................................................................................... 16 7.2 自评估精度 ..................................................................................................................... 16 8. 致谢 .......................................................................................................................................... 18 附录:全球地表覆盖数据产品元数据表结构 ............................................................................. 19

i

1. 概述

地表覆盖是指地球表面各种物质类型及其自然属性与特征的综合体,其空间分布反映着人类社会经济活动过程,决定着地表的水热和物质平衡,其变化直接影响到生物地球化学循环,改变着陆地-大气的水分、能量和碳循环,甚至影响气候变化。科学准确地测定全球地表覆盖的空间分布与动态变化,对于全球变化研究,如地球系统的能量平衡、碳循环及其它生物地球化学循环、气候变化等,有着十分重要的意义。

为了有效地支撑全球变化研究和地球系统模式发展,科技部在2010年启动了 863计划“全球地表覆盖遥感制图与关键技术研究”重点科研项目。项目由国家基础地理信息中心牵头,来自测绘局、中科院、教育部、农业部、林业局等7个部门的18家单位共同参与。2013年底, 2010基准年的30米全球地表覆盖遥感制图数据产品(GlobeLand30-2010)研制完成。该数据覆盖南北纬80度的陆地范围,包括耕地、森林、草地、灌木地、湿地、水体、苔原、人造地表、裸地、冰川和永久积雪等10种地表覆盖类型。

本手册是对GlobeLand30-2010产品进行简要介绍的材料,包括所用的分类影像、参考资料、影像处理方法、分类方法、数据产品组织和精度评估情况等,供国内外学者和相关人员参考使用。

2. 分类影像与参考资料

2.1 分类影像

GlobeLand30-2010数据研制所使用的分类影像主要是30米多光谱影像,包括美国陆地资源卫星(Landsat)TM5、ETM+多光谱影像和中国环境减灾卫星(HJ-1)多光谱影像。影像选取原则是:在每景影像无云(少云)前提下,择优选择植被生长季的多光谱影像,影像时相尽量控制在2010年±1年内。对于影像获取困难区域,适当放宽影像获取时间,确保全球无云影像的完整覆盖。

1

2.1.1 Landsat TM/ETM+ 影像

Landsat影像波段多,可提高分类精度,需要尽可能多的收集。所有Landsat TM5、ETM+影像从USGS下载(http://earthexplorer.usgs.gov/),订购其Level 1T处理级别的产品。Level 1T处理级别的Landsat影像经过几何和辐射纠正处理,采用WGS-84坐标系和UTM投影,共7个波段。总共从USGS下载了Landsat TM5、ETM+影像9907景,约80%的获取时间在2009-2011年内,详细统计情况见表1,9907景影像的季相分布见图1。GlobeLand30-2010分幅产品中有多光谱影像接图表图层,其详细反映了每景影像的获取时间及分类所利用的实际范围。

表1 Landsat影像获取年代统计 年份 所占比例

2009年 30.59% 2010年 41.06% 2011年 9.14% 其他 19.21%

图1 GlobeLand30-2010所利用的LandsatTM5、ETM+影像时相

根据Landsat网站技术文件介绍,Level 1T处理级别的TM/ETM+影像,几何纠正平面中误差为±75米。在分类前,利用GoogleEarth影像和1米分辨率正射影像,选取明显地物点对每景TM和ETM+影像进行了平面几何精度检查。总共检查出有171景Landsat影像达不到几何精度要求,对这171景影像全部进行了重新纠正处理。用于分类的所有Landsat影像,其影像接边差在1个像素内。

影像分类预处理包括大气和地形校正。大气校正采用基于改进版本的Fast Line-of-Sight Atmospheric Analysis of Spectral Hypercubes (FLAASH)算法,地形校正采用的是基于COS校正的地形抹平处理校正方法(SCOS法)。

2

由于2010年前后的TM5影像全球覆盖不佳,在赤道等多云区域无法检索订购到无云的影像,需要利用Landsat7 ETM+ SLC-off影像数据进行补充。通过下载多期ETM+ SLC-off影像,采用邻近相似像元插补法(Neighborhood Similar Pixel Interpolator,NSPI)进行数据插补,形成一景完整影像。共插补ETM+ SLC-off影像1354景,主要分布在靠近赤道沿线及北半球高纬度地区,见图2。

图2 GlobeLand30-2010所利用的ETM+ SLC-off影像区域

2.1.2 HJ-1卫星影像

HJ-1是中国发射用于环境监测和防灾减灾的卫星星座,该卫星拥有光学、红外、超光谱多种探测手段。其中HJ-1A星搭载有多光谱相机(CCD)、高光谱成像仪(HSI);HJ-1B星搭载有多光谱相机(CCD)、红外多光谱成像仪(IRS)。其卫星传感器技术参数见表2。有关HJ-1卫星的详细介绍请访问http://www.cresda.com/。 表2 HJ-1A/B卫星有效载荷指标一览表 卫星名称 有效载荷 波段 谱段范围(μm) 空间分辨率(m) 幅宽 (km) 侧摆能力 1 2 3 4 HJ-1B HSI CCD 115 1 0.43-0.52 0.52-0.60 0.63-0.69 0.76-0.90 0.45-0.95 0.43-0.52 100 30 50 ±30° 单台相机:360 — HJ-1A CCD 30 单台相机:360 双台相机:700 — 3

IRS 2 3 4 1 2 3 4 0.52-0.60 0.63-0.69 0.76-0.90 0.75-1.10 1.55-1.75 3.50-3.90 10.5-12.5 双台相机:700 150 300 720 — 地表覆盖数据研制利用的是HJ-1星CCD影像数据,其幅宽360KM,空间分辨率为30米,包括4个波段。共利用HJ-1多光谱影像1465景,覆盖全球60%范围(见图3),获取时间为2008年9月至2011年12月。

HJ-1影像利用全球ETM+镶嵌产品(GeoCover2000)作为控制源进行几何纠正,纠正影像与Landsat影像的套合中误差在1.5像元以内。

图3 GlobeLand30-2010所利用的HJ-1卫星影像覆盖区域

2.2 辅助资料

除了分类影像外,GlobeLand30-2010研制还使用了大量的辅助数据和参考资料,支持样本选取、辅助分类及验证精度等工作。主要包括:已有地表覆盖数据(全球、区域)、MODIS NDVI数据、全球基础地理信息数据、全球DEM数据、各种专题数据和在线高分辨率影像(如GoogleEarth高分影像、必应影像、OpenStreet和天地图高分影像)等。

4

2.2.1 已有地表覆盖数据

1)6套全球地表覆盖数据:分别为USGS的IGBP-DISCover数据集、美国马里兰大学的UMD GeoCover数据集、美国波士顿大学的BU_MODIS数据集、欧盟联合研究中心的GLC2000数据集、欧空局的GlobCover2005和GlobCover2009。除GlobCover2005和GlobCover2009的分辨率为300米外,其他4套数据的分辨率均为1千米。

上述6套数据的分类系统存在较大差异,本项目主要参考了GLC2000和GlobCover2009。

2)区域地表覆盖数据

在项目实施过程中,加强了对区域性高分辨率地表覆盖数据的收集,总共收集了以下国家和区域的高分辨率地表覆盖数据。

? 中国1:10万土地利用数据:由中国科学院地理科学与资源研究所提供,

利用1999-2000年的LandsatTM/ETM+影像和中国资源一号卫星CCD影像生产完成,采用中国科学院土地利用分类系统。

? 美国土地覆盖数据集(NLCD):从美国环境保护署网站

(http://www.epa.gov/mrlc)下载,利用Landsat TM/ETM+影像生产完成,数据空间分辨率30米,采用MRLC分类系统。

? 加拿大1:25万地表覆盖数据(Circa2000):从加拿大基础地理空间信

息数据共享平台(http://www.geobase.ca)下载,利用Landsat TM/ETM+影像完成,采用EOSD土地覆盖分类系统。

? 欧洲地表覆盖数据(CORINE Land Cover2000):从欧洲环境署

(http://www.eea.europa.eu)下载,比例尺为1::100000,数据采用CORINE土地覆盖分类系统。

? 澳大利亚地表覆盖(DLCD):从澳大利亚地球科学局

(http://www.ga.gov.au/)下载,该数据集2011年发布,分辨率为250米,采用国际标准化组分类系统。

2.2.2 MODIS NDVI数据

USGS

下载了

2009

年全年

MODIS

MOD13Q1

产品

(https://lpdaac.usgs.gov/ )。该产品包含MODIS的单波段影像(蓝波段、红

5

波段、近红外波段、中红外波段)和NDVI、EVI数据,空间分辨率250米。MOD13Q1产品全年共23期,全球陆地区域共有616幅。

该数据集经过投影转换、配准纠正、数据滤波、数据时间序列整合等处理,形成了包含23个波段、250米空间分辨率的MODIS NDVI时间序列数据。该数据能反映耕地、裸地、林、灌、草等类型的季相变化信息,可以弥补单期分类影像无法获取地物季相变化信息的不足。 2.2.3 全球基础地理信息数据

收集了全球1:100万基础地理底图数据和全球Vmap数据。主要利用其所包含的居民地层、道路层、湖泊层、河流层4个矢量数据图层,作为分类时样本选取、人工交互检查时的参考数据。 2.2.4 全球DEM数据

收集了全球SRTM DEM 数据和ASTER GDEM数据。主要利用DEM数据生成坡度信息,为地表覆盖类型的类型判别及质量检查等提供参考信息。

收集的SRTM DEM为CGIAR-CSI发布的第四版,分辨率为3弧秒(约90m),数据覆盖范围为北纬60度到南纬56度之间;

收集的ASTER GDEM数据分辨率为1弧秒(约30m),数据覆盖范围为北纬83度到南纬83度之间。

根据对2套DEM数据的质量分析结果,分类时优先使用SRTM DEM数据,在SRTM DEM不能覆盖的高纬度地区(南纬56度以南和北纬60度以北),使用ASTER GDEM数据。

2.2.5 全球生态地理分区数据

生态地理分区数据包含该分区的地表水热条件、土壤、植被等自然要素的基本信息及分布状况,可作为辅助资料和知识来加强分类技术人员对该分区地表覆盖类型的了解。收集了世界自然基金会(WWF)的全球生态地理分区数据(http://www.worldwildlife.org),经适当合并和边界调整后,将全球划分为了400个地表覆盖类型差异明显的生态地理区。逐一对这400个生态地理分区中所包含的地表覆盖类型及分布进行了细化描述,帮助解译人员认识区域地表覆盖的分布状况、合理选择分类方法及确定质量控制的重点等。

6

2.2.5 专题数据

1)GLWD数据:从http://worldwildlife.org/ 网站下载。该数据是世界自然基金会(WWF)和德国卡塞尔大学(University of Kassel)在一系列全球湿地地图和湿地相关数据资料基础上,利用地理信息系统汇编而成的湿地综合性数据库形成的,记录了全球湖泊、水库和河流的矢量边界及相关属性信息,其中包含:

面积>50km2的大型湖泊3067个; 容积≥0.5km3的大型水库 654个;

较小型的湖泊、水库和河流(面积>0.1km2)约25×104个。

GLWD数据是水体和湿地分类的重要参考资料。在人机交互检查时,对数据库中的河流、湖泊、湿地与分类结果进行逐一对比检查,避免大型水体、湿地的错分与漏分。

2)湿地名录数据:从Ramsar网站下载(http://ramsar.wetlands.org/)。该数据包含了全球近2000个列入国际湿地公约的湿地名录,记录了湿地的经纬度位置和面积大小等相关信息。湿地名录数据是湿地分类的重要参考资料。在人机交互检查时,对名录中的湿地与分类结果逐一进行核对,避免重要湿地的错分和漏分。

3)全球MODIS红树林数据:全球MODIS红树林数据是USGS利用MODIS影像解译的结果。该数据较准确反映了2000年红树林的全球分布状况,用于红树林湿地分类的参考数据。

4)世界冰川编目:搜集了由美国雪冰数据中心(NSIDC)发布的《世界冰川编目》(World Glacier Inventory)数据。该数据包括全世界107009条冰川的经纬度、名称、面积等信息,用于冰川和永久积雪分类的参考数据。

3.类型定义与赋值

3.1类型定义

GlobeLand30-2010数据共包括10个类型,分别是:耕地、森林、草地、灌木地、湿地、水体、苔原、人造地表、裸地、冰川和永久积雪。每个类型的定义见表3:

7

表3 GlobeLand30类型定义 代码 10 类型 内容 用于种植农作物的土地,包括水田、灌溉旱地、雨养旱地、菜地、耕地 牧草种植地、大棚用地、以种植农作物为主间有果树及其他经济乔木的土地,以及茶园、咖啡园等灌木类经济作物种植地。 乔木覆盖且树冠盖度超过30%的土地,包括落叶阔叶林、常绿阔叶森林 林、落叶针叶林、常绿针叶林、混交林,以及树冠盖度为10-30%的疏林地。 天然草本植被覆盖,且盖度大于10%的土地,包括草原、草甸、稀草地 树草原、荒漠草原,以及城市人工草地等。 灌木覆盖且灌丛覆盖度高于30%的土地,包括山地灌丛、落叶和常灌木地 绿灌丛,以及荒漠地区覆盖度高于10%的荒漠灌丛。 位于陆地和水域的交界带,有浅层积水或土壤过湿的土地,多生长湿地 有沼生或湿生植物。包括内陆沼泽、湖泊沼泽、河流洪泛湿地、森林/灌木湿地、泥炭沼泽、红树林、盐沼等。 水体 陆地范围液态水覆盖的区域,包括江河、湖泊、水库、坑塘等。 寒带环境下由地衣、苔藓、多年生耐寒草本和灌木植被覆盖的土地,苔原 包括灌丛苔原、禾本苔原、湿苔原、裸地苔原等。 人造 由人工建造活动形成的地表,包括城镇等各类居民地、工矿、交通地表 设施等,不包括建设用地内部连片绿地和水体。 植被覆盖度低于10%的自然覆盖土地,包括荒漠、沙地、砾石地、裸地 裸岩、盐碱地等。 冰川和由永久积雪、冰川和冰盖覆盖的土地,包括高山地区永久积雪、冰永久 川,以及极地冰盖等。 积雪 20 30 40 50 60 70 80 90 100 3.2类型赋值

分类产品中对10个类型的赋值及颜色配置见下表。

表4 GlobeLand30-2010数据的类型赋值及颜色配置表 颜色 类型 耕地 森林 草地 灌木地 赋值 颜色 10 20 30 40 R 250 0 100 0 G 160 100 255 255 B 255 0 0 120 8

湿地 水体 苔原 人造地表 裸地 冰川和永久积雪 海域 无数据区 50 60 70 80 90 100 255 0 0 0 100 255 190 200 0 0 100 0 100 0 190 240 200 0 255 255 50 0 190 255 255 0 4分类技术指标

4.1最小图斑

本手册中的最小图斑是指在分类时,进行质量控制的最小图斑。大于或等于该图斑尺寸大小的地表覆盖,需逐一进行质量检查,以控制各类型提取的详细程度,保障分类质量。对于线状地物(如河流等),采用最小宽度来进行约束。各类型的最小图斑大小有所差异,主要在综合分析以下因素基础上制定:

? 地物类型的空间分布(大小、疏密程度等)情况; ? 地物类型在30米影像的尺度特性; ? 人机交互编辑、检查工作量; ? 地物类型的最低分类精度要求。

需要指出的是,最小图斑不是该地物分类的最小表示图斑。如果面积小于最小图斑的地物类型被提取、且提取正确,应保留该图斑,无需删除或合并。如果面积小于最小图斑的地物类型没有被提取出来,则无需添加,不视为漏分。

4.2最低分类精度

最低分类精度是指个地表覆盖类型需要保障的最低精度。每个类型的最低分类精度在综合考虑数据应用、30米分辨率尺度特性及分类难易程度等因素基础上进行制定。

10个地表覆盖类型的最低分类精度及质量约束最小图斑指标见表5。

9

表5 GlobeLand30-2010最低分类精度与最小图斑指标

序号 1 2 3 4 5 6 7 8 9 10 类型 耕地 森林 灌木地 草地 湿地 水体 苔原 人造覆盖 裸地 冰川和永久积雪 6×6像元 8×8像元 10×10像元 10×10像元 9×9 像元 面状水体:3×3像元;线状水体: 3像元宽度 依照草地、湿地、裸地、灌丛的最小质量控制图斑执行 城乡结合部:8×8像元;分散式团状人造覆盖:4×4像元;道路及沿线分布的居民地: 5像素宽度 6×6像元 3×3像元 最小质量控制图斑(宽度) 最低精度 70% 70% 70% 70% 70% 80% 70% 80% 80% 80% 注:像元指用于分类的影像像元,大小为30米分辨率。 5. 分类策略与方法

5.1逐类型层次分类策略

GlobeLand30产品研制采用逐类型层次提取方法。在每个分类单元内(一景影像为一个分类单元),采用单类型逐一分类、然后集成的分类策略。即一次只提取一个地表覆盖类型,该类型提取完成后,对分类影像进行掩膜,然后再开展下一个类型的分类工作。采用该分类策略可以有效提高分类精度,但同时会增加大工作量。各个类型分类提取的顺序依次为:

1)水体 2)湿地

3)冰川和永久积雪 4)人造地表 5)耕地

6)裸地、森林、灌木地、草地 7)苔原

10

每种类型分景提取完成后,对提取结果进行质量检查,如果错漏率、接边等指标超过控制指标,则需要重新进行修改处理,直至达到质量控制指标要求。

对单类型地表覆盖分类结果按照标准分幅进行数据集成,并利用服务系统进行在线发布,经多种参考知识检核修改后,如果经质量评估达到指标要求,则可利用该分类结果对原始分类影像进行掩膜处理。利用掩膜后的影像开展下一个类型的分类。

TM影像水体分类掩膜融合湿地分类掩膜融合人造地表分类掩膜融合耕地分类参考资料永久积雪和冰川分类掩膜融合掩膜裸地, 森林, 灌木林和草地分类苔原分类图 5 逐类型层次分类策略流程图

5.2单类型分类方法

单要素类地表覆盖类型均采用基于“像元-对象-知识”(Pixel-Object-Knowledge,POK)的方法。该方法包括像元法分类、对象化过滤、人机交互检核三个步骤,以充分发挥各类分类算法的优势,充分利用各种知识和人的经验来提高分类质量。

1)像元法分类

11

该步骤是根据每种地表覆盖类型在影像上的光谱、纹理等特征,选择能够实现较高精度提取的像元分类算法,同时加强类型提取难点分析、分类技术流程优化,训练样本选取质量控制等措施,保障像元法的基本分类精度。

采用的像元法分类法有:MLC、SVM、阈值法及其改进法等。具体实施时综合考虑影像及参考资料情况、算法对类型的有效性、分类效率等因素进行选取。

像元法分类结果会存在大量的细碎像元以及图斑不完整、不连续等现象,需要进行对象化处理。

2)对象化过滤

该步骤是对每景多光谱影像进行多尺度对象化分割,分割尺度包括10、20、30、50、100等。根据每景影像中的地表覆盖类型的空间几何形态及大小,选择合适的尺度分割对象,对像元法分类结果进行过滤。

过滤采用阈值法。统计分割对象内的像元数比例,如果分类像元超过阈值(一般为60-70%),则选取该图斑,否则滤除。

通过对象化过滤可以消除像元法分类的椒盐现象,同时保障分类结果的图斑与实际地表覆盖形状相一致,但同时也会存在一定的图斑错漏现象,需要人机交互的检核。

3)人机交互检核

该步骤是利用项目组研发的多源参考资料集成服务平台,采用人机交互的方式,逐景检查对象化过滤的分类结果,去除错分图斑、补充漏分图斑。

在检核时,主要利用多尺度分割对象的矢量结果进行错漏图斑的编辑,不人工勾绘图斑。为提高检查和修改的效率,使检查和修改更有针对性,根据地表覆盖的分布知识与规则,利用参考资料运算出可能存在质量问题的图斑,以重点加强检查。

例如湿地一般分布在坡度小于3度的区域,利用该规则和全球DEM数据可筛选出坡度大于3度的图斑,重点进行核查确认。

6. GlobeLand30产品

6.1 参考坐标系

GlobeLand30-2010数据采用以下参考坐标系。

12

? 坐标系统:WGS84 ? 参考椭球: WGS 84椭球 ? 投影:UTM投影 ? 分带:6度分带

6.2 数据分幅

GlobeLand30-2010产品根据所位于的纬度情况,采用2种分幅方式(如图7所示):

--在南北纬60o区域内,按照5°(纬度)×6°(经度)大小进行分幅; --在南北纬60o至80o区域内,按照5°(纬度)×12°(经度)大小进行分幅,按照奇数6°带的中央经线进行投影。

GlobeLand30-2010的分幅数据共853幅(不包括南极洲),分幅的裁切范围为该分幅图廓范围线向外扩展600米(20个像素)所形成的区域。其覆盖范围见下图所示。

图7 GlobeLand30-2010产品分幅示意图

6.3数据内容及格式

6.3.1 分幅数据内容

GlobeLand30-2010分幅数据由分类成果文件、坐标信息文件、分类影像接图表文件、元数据文件和说明性文件等5部分组成。其中:

--分类成果文件是指存储地表覆盖分类信息的文件;

13

--坐标信息文件是指记录分类成果数据坐标信息的文件;

--分类影像接图表文件是指记录每景分类影像范围及获取时间的矢量图层文件;

--元数据文件指记录分类成果元数据信息的文件;

--说明性文件是指对分类成果数据进行描述、对数据版权进行说明的文件。 6.3.2 分类数据格式

地表覆盖分类数据采用栅格数据格式进行存储,采用无损GeoTIFF压缩格式,8Bit 256索引色模式。栅格影像的像元值代表某类地表覆盖类型,具体像元值与类型的对应关系见表3。 6.3.3坐标信息文件格式

坐标信息采用TIFF WORD格式存储。具体格式示例如下:

N35_30_2000LC030.tfw 文件名称 30.000000000000000 0.0 0.0

-30.000000000000000

203088.91200000001 影像左上角东方向坐标,不加投影带号 3884658.3599999999 影像左上角北方向坐标

6.3.4分类影像接图表文件

分类影像接图表采用SHP格式(Shape file格式),包含影像接图表图层和分幅范围图层,其属性表结构见表6。

表6 分类影像接图表文件数据模型

图层类型 几何类型 图层标识 属性项名称 Sensor 影像接图表 面 TM /ETMScene Resolution PathRow Date 分幅范围 面 MapSheetRange MapSheet Name 数据类型 整型 整型 字符型 日期型 字符型 长度16 14

6.3.5元数据文件

元数据文件采用XML格式,其包含的属性项见附录。 6.3.6说明文件

说明文件采用PDF格式进行存储。

6.4分幅文件命名与组织

6.4.1 分幅命名规则

GlobeLand30-2010数据分幅命名规则如下:

南北纬缩写(1位)+6度带号(2位)+“_”+起始纬度(2位)+“_”+产品年代(4位)+LC(地表覆盖缩写)+分辨率(3位)+。其中北纬缩写为“N”,南纬缩写为“S”;

6度代号:图幅所在的6度分带的带号值。对于跨2个6度带的图幅,其中央经线应填写基数6度带的中央经线,代号应填写奇数带号。

起始纬度:在北半球填写图幅左下角边缘线的纬度值,在南半球填写图幅右上角边缘线的纬度值,见图所示。

图幅起始纬度

图幅起始纬度

北半球 南半球

图8 南北半球分幅起始纬度示意图

产品年代:表示地表覆盖产品的年份,如2000年、2010年等。 分辨率:只表示至整米,不满3位的在前面加0。如30米用030表示。 例如:N19_25_2010LC030图幅,表示的是北半球19带(经度范围东经108°-114°)北纬25°至30°矩形区域内的2010年期30米地表覆盖数据。 6.4.2数据组织

GlobeLand30-2010数据分幅产品按照单独目录存放,其目录以图幅名称命名。在目录下存放所有文件,包括分类成果文件、坐标信息文件、分类基础影像

15

接图表文件、元数据文件和说明性文件等。

N19_25_2010LC030.tif N19_25_2010LC030.tfw N19_25_2010LC030 目录名称 N19_25_2010LC030_IMG.shp N19_25_2010LC030_MAT.xml N19_25_2010LC030_ReadMe.pdf

图9 GlobeLand30数据组织示例

为便于数据拷贝和下载传输,将分幅数据进行压缩处理,形成了一个zip格式的压缩文件,压缩文件名称与目录名称一致。

7. 数据精度

为了客观评价GlobeLand30-2010数据分分类精度,项目组邀请上海同济大学、中科院、农科院、林科院等单位组织开展了第三方精度评价。

7.1抽样方案

采用空间数据二级抽样检验模型。第一级为图幅抽样,以“图幅”为抽样单元。第二级为要素抽样,以“图幅内空间分类要素”为抽样单元。通过计算每一级抽样单元需要抽取的样本量,结合空间变异性分析来合理布设样本,以相当数量的样本来检验地表覆盖分类的准确性。

在第一级抽样中,首先按照该级抽样检验模型,计算需要抽取的图幅样本数量n1,通过检验抽样样本图幅的质量来估算整体数据的质量水平。具体每个抽取的样本图幅,其质量评价通过第二级抽样检验模型来完成。在第二级抽样检验中,根据第二级抽样检验模型,计算需要抽取的各分类要素的样本数量ni(一级类有十大类要素,i=1,2,3…10),通过对每一个检查单元(图幅)进行检验,统计结果并且计算混淆矩阵及各类参数,从而判断该图幅的质量状况。

7.2精度评价结果

根据各大洲图幅数量和陆地面积,以GlobeLand30-2010全球分幅总量(853

16

幅)作为样本总量,按照第一级图幅抽样的样本量计算公式得到抽样方案(853,80),即抽样80幅图进行精度评估。各大洲样本图幅数按照各大洲陆地面积比例分配,其中亚洲26幅、欧洲6幅、非洲18幅、美洲25幅、大洋洲5幅。

在第一级80个图幅样本基础上进行第二级要素抽样,逐图幅进行处理,得到分图幅的要素抽样结果,即检验样本点。用于对检验样本点进行判断的参考资料主要有Google Earth高分影像、TM影像、DCP(Degree Confluence Project)验证点、在线的真实景观照片以及其他参考资料等。检验样本点由3组技术人员独立判断,经与参考资料分析对比后,对每一个检验样本点进行判断标记,包括完全正确、完全错误、不确定。

总共选取9类超过15万个检验样本进行精度评估,GlobeLand30-2010数据的总体精度为83.51%,Kappa系数0.78,各类型的精度情况见下图所示。精度混淆矩阵见表7。

图10 GlobeLand30-2010各类型精度 表7 GlobeLand30-2010精度评价混淆矩阵

Cultivated Land Forest Actual Type Grassland Shrubland Wetland Water Bodies Artificial Surfaces Bareland Cultivated Land 28011 2371 1590 542 136 189 705 180 Forest Grass land 1346 3202 21208 510 393 186 269 472 Classified Type Shrub land 624 993 890 7402 68 27 103 101 Wet land 129 771 219 29 5289 138 16 8 Water Bodies 70 44 51 11 226 5122 28 14 Artificial Surfaces 143 135 92 15 7 13 2749 8 Bareland 415 204 533 231 84 48 92 5630 Permanent Snow & Ice 2 41 57 7 1 5 12 70 Actual Sum 32073 60305 26814 9568 7379 6231 4274 6671 1333 52544 2174 821 1175 503 300 188 17

Permanent snow & ice Classified Sum 0 33724 4 59042 11 27597 0 10208 0 6599 0 5566 0 3162 13 7250 613 808 641 153956 苔原类型因难以获取到大量的正确检验样本点,此次未做精度评价。

8. 致谢 GlobeLand30-2010数据在研制过程中,得到科技部国家遥感中心的支持,美国USGS、EPA,欧洲环境署、加拿大、澳大利亚地球科学局等机构提供了大量的分类影像及参考数据,同时本数据研制过程中利用了GoogleEarth、OpenStreetMap、BingMap、天地图等在线影像及地图,得到了马里兰大学John Townshend教授、中科院地理科学与资源研究所刘纪远研究员和刘闯研究员等专家的支持和帮助,在此一并表示感谢。

有关该产品的详细信息,请访问http://glc30.tianditu.com。如想进一步交流讨论技术问题、合作进行数据应用,请联系国家基础地理信息中心陈利军博士,联系方式如下:

Lijun Chen Ph.D

National Geomatics Center of China (NGCC) 28 Lianhuachi West Road, Beijing, 100830, China Tel: +86-10-63880216 Cellphone: +86-13641011589 E-mail: chenlj@nsdi.gov.cn

18

附录:全球地表覆盖数据产品元数据表结构

表8-4全球地表覆盖数据产品元数据表结构及填写要求

序号 1 2 3 4 5 MapSheet Information 分幅基本信息 内容 元数据项 英文名称 ProductName MapSheetName ReferenceCoordinate System ElevationSystem MapProjection 中文名称 产品名称 图幅名称 参考坐标系 高程系统 地图投影 数据类型 字符型 字符型 字符型 字符型 字符型 长度 60 16 5 5 3 填写要求 不能为空 不能为空 填写本次产品采用的参考坐标系 填写本次产品采用的高程系统 填写本次采用的投影 度分秒格式,度3位,分2位,秒2位。前面用“E”和“W”区分东西经,不满幅图幅填写实际经度范围。2个经度间用“-”隔开。 度分秒格式,度2位,分2位,秒2位。前面用“N”和“S”区分南北纬,不满幅图幅填写实际纬度范围。2个纬度间用“-”隔开。 填写图幅所位于的6°分带带号 用“W”和“E”区分东西经,度数用3位表示 产品坐标采用的单位 填写示例 GlobeLand30 N19_15_2000LC030 WGS84 EGM96 UTM 6 LongitudeRange 图幅经度范围 字符型 16 W0720000-0660000 7 LatitudeRange 图幅纬度范围 字符型 14 N150000-200000 8 9 10 6°ZoneNumber CentralMeridian CoordinateUnit 6°分带带号 中央经线 坐标单位 整型 字符型 字符型 2 4 5 11 111W meter 19

序号 11 12 13 14 15 16 17 18 19 20 21 22 23 24 内容 元数据项 英文名称 X coordinate Constant Year SpatialResolution LandCoverImageFomat 中文名称 X坐标加常数 产品年代 数据分辨率 数据类型 字符型 数值型 数值型 字符型 字符型 字符型 长度 14 4 3 7 10 填写要求 填写横坐标的加常数 填写哪一期的地表覆盖数据产品,只填写年代,如2000或2010 全球地表覆盖产品分辨率,填写30或250 本次产品采用的文件格式 本次地表覆盖产品文件影像存储模式 填写坐标信息文件的文件格式 填写示例 500000 Meters 2010 30 GeoTiff IndexColor TFW 4300478.85 413169.74 4318981.77 413372.63 4318773.61 4318773.61 4300270.95 434877.62 Product Information 产品基本信息 地表覆盖影像格式 地表覆盖影像模LandCoverImageMode 式 format of Coordinate 坐标信息文件格File 式 图幅西南角点XSouthWestAbs 坐标 图幅西南角点YSouthWestOrd 坐标 图幅西北角点XSouthWestAbs 坐标 图幅西北角点YNorthWestOrd 坐标 图幅东北角点XNorthEastAbs 坐标 图幅东北角点YNorthEastOrd 坐标 图幅东南角点XSouthEastAbs 坐标 SouthEastOrd 图幅东南角点Y数值型 12.2 数值型 12.2 数值型 12.2 数值型 12.2 数值型 12.2 数值型 12.2 数值型 12.2 数值型 12.2 20

序号 内容 元数据项 英文名称 中文名称 坐标 分类影像 数据源 数据源信息文件格式 数据类型 长度 填写要求 填写示例 25 26 27 ImageSource ImageSourceInfomationFile Format FirstClassNumber 字符型 50 填写分类所用的主体影像数据情况,例如包括TM、ETM,HJ-1,HJ-1等,根据每期LC分类时所用的实际影像情况填写。 裁切影像分幅接图表矢量格式 填写分类系统的一级类型的数量 TM 字符型 3 2 SHP 10 Croplands:10; Forests:20; Grasslands:30; Shrublands:40; Wetland:50; Water bodies:60; Tundra:70; Imperviousarea:80; Barren Land:90; Permanent snow/ice:100 Shaanxi Administration of Surveying, Mapping and Geoinformation 2012 一级类类型数量 数值型 28 FirstClassList andValue 一级类类型名称及赋值 字符型 200 填写一级类型的英文名称和赋值 Production 29 AndCopyrightInformation 产品研制与版权信息 30 Producer 产品研制 单位 产品研制 时间 字符型 40 省局填写到局名称,公司填写中心 ProduceDate 日期型 4 填写最后形成正式成果时间,到年 21

序号 31 内容 元数据项 英文名称 Copyright owners 中文名称 数据类型 字符型 长度 填写要求 填写示例 National Administration of Surveying Mapping and Geoinforamtion National Geomatics Center of China 28 Lianhuachixi Road,Haidian, Beijing, China 100830 0086-63880127 0086-63880217 www.globallandcover.com glc@ngcc.cn 版权人 40 32 33 34 35 36 37 38

Distributor Address Post Code Tel Fax WebSite Email 分发人 地址 邮编 联系电话 传真 网址 电子邮箱 字符型 字符型 字符型 字符型 字符型 字符型 字符型 50 50 6 13 13 40 20 22