Fine Urban Land Use Identification Based on Fusion of Multi-source Data
-
摘要:
我国土地利用类型复杂,为解决依靠单一遥感图像或POI(point of interest)数据而难以准确识别城市土地利用类型的困境,提出一种遥感图像和POI数据相结合的精细识别方法. 首先,为精细识别城市地块功能,选取500 m栅格为研究单位;其次,提取POI数据并生成各类土地利用的核密度分布图,对遥感、POI图像数据进行数据预处理、数据切分、数据增强以提取有效信息;最后,将POI核密度分布图和高分遥感影像数据融合,以现状土地利用数据为标签,构建UNet++网络对城市地块分类,并运用CA算法对模型参数进行优化. 以深圳市为实例开展实验,并在罗湖区和南山区进行迁移验证,结果表明:融合POI数据的城市土地利用精确识别模型平均精度为70.6%,比仅使用遥感数据识别模型精度高6.7%;使用CA算法后,模型精度提高1.5%;对模型进行迁移验证,模型平均精度为72.6%,表明模型具有较高的稳健性;此外,POI数据弥补了遥感影像仅涉及光谱、纹理和地物结构物理属性的不足,能较好识别商服用地、公共管理与公共服务用地,相较于单一数据识别模型精度分别高了7.5%、6.0%.
Abstract:Land use type in China is complex, and it is difficult to accurately identify urban land use type by relying on a single remote sensing image or point of interest (POI) data. To address this issue, a fine identification method combining remote sensing images and POI data was proposed. Firstly, to finely identify urban land parcel functions, a 500-meter grid was selected as the research unit; secondly, POI data were extracted, and kernel density distribution maps of various land uses were generated. Data preprocessing, data segmentation, and data enhancement were performed on remote sensing and POI image data to extract effective information. Finally, the POI kernel density distribution map and high-resolution remote sensing image data were fused together, and the current land use data was used as the label to construct the UNet++ network to classify urban land parcels. The model parameters were optimized using the cosine annealing (CA) algorithm, and the proposed method was tested in Shenzhen City. Migration verification was carried out in Luohu District and Nanshan District. The results show that the average accuracy of the urban land use identification model fused with POI data is 70.6%, which is 6.7% higher than that of the identification model using only remote sensing data; after using the CA algorithm, the model accuracy is increased by 1.5%. The migration verification of the model is carried out, and the average accuracy of the model is 72.6%. This shows that the model is robust. In addition, POI data makes up for the shortcomings of remote sensing images that only involve spectrum, texture, and physical attributes of ground structures, and it can better identify commercial land and public management and service land. The accuracy is 7.5% and 6.0% higher than that of a single data identification model.
-
Key words:
- traffic planning /
- land use /
- deep learning /
- multi-source data
-
随着城市化进程的不断加快,人口和机动车保有量不断增加,导致城市交通拥堵、环境污染和交通安全问题日益严峻. 从长远发展角度出发,土地利用与交通一体化规划作为调整交通需求空间结构的重要途径,对解决当前城市交通供给需求不平衡问题至关重要[1]. 土地利用的异质性决定了城市出行需求的空间分布形态,是城市交通规划模型的重要输入信息. 细粒度土地利用信息的准确提取可以得到精度更高的交通需求预测结果,有力支撑城市交通规划与管理,提高交通系统运行效率[2]. 传统交通规划建模中主要以交通小区为研究单位,然而基于交通小区的土地利用模型存在同一位置集聚指标相同的假设[3]. 当交通小区较大时,难以为城市交通规划提供准确有效的支撑. 同时,基于交通小区的土地利用仅能粗略地将面积转化成相应土地利用类型,增加了交通小区中土地利用与交通相互作用分析的难度. 相较于基于交通小区的交通规划建模,基于栅格的模型能够更好地描述土地利用与交通之间的相关关系,其在交通工程各个领域得到了广泛应用.
在以往研究中,机器学习方法在土地利用识别中发挥了重要作用,然而在像元级别上实现更精细化的土地利用识别,需要从原始影像中提取低层和深层特征,对机器学习方法的应用带来新挑战. 卷积神经网络(CNN)作为深度学习技术领域中最重要的算法之一,已被证明能够很好地提取原始影像中的低层和深层特征,该算法及其衍生算法已经成功应用于图像识别等众多领域[4]. Carranza-García等[5]基于CNN对不同来源和不同分辨率的遥感影像数据进行土地利用识别,并对比了随机森林(RF)和支持向量机(SVM)2种方法,发现CNN表现出更高水平的性能. 以CNN为基础的编码器、解码器网络结构也被广泛应用于土地利用识别. Zhang等[6]提出一种基于Transformer和CNN混合的深度神经网络,对高分辨率遥感图像进行语义分割,该模型采用编码器-解码器结构,并在框架中添加多种模块以提高准确度;Zheng等[7]提出一种基于CNN的孪生网络结构,即高频注意力孪生网络,应用于高分辨率遥感图像中建筑物变化的精细化识别;Cheng等[8]提出一种改进的深度学习网络遥感图像变化检测方法,通过特征细化、最大化边缘和有针对性的注意机制,实现对高分辨率遥感图像中变化建筑物的精细识别;Cao等[9]基于深度神经网络(DNN)对航拍和街景数据进行语义特征提取和融合,并利用纽约市公开数据集进行验证,发现多源图像数据之间信息互补可以提高模型性能;然而,航拍和街景数据并不能很好地反映社会经济属性,故其对商业服务业用地和公共设施用地的识别效果不佳.
对于城市栅格土地利用信息的提取,国内外学者基于各类数据进行了广泛研究. Zong等[10]以兰州市为例,利用开源OpenStreetMap地图数据和路网数据进行城市地块划分,同时融合多源遥感影像数据、夜间灯光数据、POI(point of interest)数据,采用RF模型对城市土地利用进行分类,其结果表明遥感影像与其他数据的多源特征相结合,有利于改善分类的精度,并且POI数据对分类精度的贡献最大;Lu等[11]以洛杉矶、伦敦、北京为例,使用遥感影像和POI数据,采用带有注意力机制的CNN模型对城市地块分类,研究发现遥感影像和POI数据对城市地块分类存在协同机制,POI数据能提高分类准确性;Sun等[12]以南京市为例,融合遥感影像和社交媒体数据,采用RF模型对城市土地利用进行分类,研究表明POI特征在商业服务业及行政等用地的准确分类上有很大贡献,而遥感影像特征对居住用地、工业用地和绿地的贡献较大,其他特征也对土地利用分类有着不同程度的贡献.
然而,上述研究多以提取地物信息为目标,而非交通规划中与社会经济活动密切相关的土地利用信息[13]. 部分国外研究中有针对于土地利用信息分类的研究,但国外发达国家土地利用种类相对单一,而我国城市土地利用类型复杂,致使分类难度增大[14]. 随着深度学习的蓬勃发展及数据采集技术的不断进步,为面向城市交通规划的土地利用精细化识别带来了新的途径. 据此,本文提出一种基于多源数据融合的城市土地利用精细化识别方法,包括:数据预处理、数据切分、数据增强、数据归一化和土地利用识别5部分. 本文采用深圳市实数据集进行模型参数敏感性分析,构建分层交叉验证机制验证数据融合对预测准确度的提升,最终通过迁移建模框架系统评估模型在异构域间的性能迁移特性。
1. UNet++模型
UNet++是一种基于嵌套和密集跳跃连接的图像分割网络[15],模型整体架构如图1所示. 图1(a)中黑色部分表示原始UNet,与原始UNet相比,UNet++有如下3个方面的改进:通过跳跃路径上的卷积层(图中绿色部分)增加了编码器和解码器特征映射之间的语义信息;通过跳跃路径上密集的跳跃连接(图中蓝色部分)实现梯度流的改善;增加了深度监督机制. Li为共有第i层UNet++的损失函数;$ {x_{i,j}} $为节点$ {X_{i,j}} $的输出,其中,$ i $为沿编码器对下采样层进行索引,$ j $为沿跳跃路径对密集块的卷积层进行索引. 由$ {x_{i,j}} $表示的特征图计算如式(1)所示.
xi,j={H(xi−1,j),j=0,H([xi−v,j]j−1v=0,U(xi−1,−1)),k∈[0,j−1],j>0, (1) 式中:H(·)为连接卷积层的激活函数,U(·)为上采样层,[·]为级联层.
在$ j = 0 $层上的节点只接收1个输入,该输入来自前一层编码器;在$ j = 1 $层上的节点接收2个来自编码器的输入;在$ j > 1 $层的节点接收$ j + 1 $个输入,其中,有$ j $个输入为前面节点在同一层跳跃路径中的输出,另外1个输入是其更低一层跳跃路径的上采样输出. UNet++沿着每个跳跃路径都使用密集卷积块,因此,先前的特征图累积能够到达当前节点.
由于UNet++包含密集的跳跃路径,从而全分辨率特征图在多个语义层上均可生成,这种网络结构适合深度监督. UNet++存在2种模式的深度监督:精确模式和快速模式. 前者模式中所有分割分支的输出被平均;后者模式中只从1个分割分支中选择最终的分割图. 模式的选择决定模型结构和训练速率,本文中选择快速模式,其损失函数定义如式(2).
L(P,R)=−1NC∑c=1N∑n=1(rn,clogpn,c+2rn,cpn,cr2n,c+p2n,c), (2) 式中:R为真实标签矩阵;P为预测概率矩阵;$ r_{n,c}、p_{n,c} $分别表示遥感图像第$ n $个像素为类别c的真实概率和预测概率,$ {r_{n,c}} \in {\boldsymbol{R}} $,${p_{n,c}} \in {\boldsymbol{P}} $;$ N $为一个训练批次中遥感图像像素总数;C为类别总数.
2. 城市栅格土地利用识别方法
2.1 数据预处理
遥感影像在实际应用过程中,需要进行影像融合、拼接和裁剪处理. 影像融合指将光谱信息丰富的多光谱数据和空间分辨率高但波段信息较少的全色数据进行融合. 本文在ERDAS软件中通过“分辨率融合”工具对影像进行融合. 通过ArcGIS中的“地理配准”工具,以多条路网为参照物,在影像和路网之间创建多对控制点连接进行几何矫正. 经过数字化扫描后的每一景影像均具有相同的形状(一般是正方形)和尺寸,影像相互之间会有重叠[16]. 影像拼接和裁剪指对相邻影像进行无缝拼接处理,将重叠部分去掉,根据实际应用的需要对影像边界进行裁剪. 影像拼接和裁剪在ArcGIS中实现,通过“镶嵌至栅格”等工具实现影像拼接,通过“按掩膜提取”等工具实现影像裁剪.
为使POI数据具有和影像数据相同的输入格式,本文使用核密度估计(KDE)方法将映射处理后的POI转换为强度图[17]. KDE方法是一种非参数密度估计方法,无需做出特征参数或密度分布的假设,即可估计样本或指标潜在的分布. 设$ {a_1}、{a_2}、 \cdots 、{a_m} $为估计函数$ f $的总体抽样POI样本点,在某点$ a $处的值为
fm(a)=1mdm∑l=1k(a−ald), (3) 式中:k(·)为核函数,$ d $为带宽,$ m $为POI样本点总数.
KDE由以点$ a $为中心,$ d $为半径的圆形区域内样本点$ {a_l} $来确定. 在KDE中,带宽根据分析尺度及样本点特征进行选择. 如带宽偏大,则KDE曲线较为平滑,会造成部分细节被忽略;如带宽设置偏小,则KDE曲线较为陡峭,无法较好反映整体趋势. 本文采式(4)进行带宽的选取.
d=0.9m−0.2×min (4) 式中:$ ({a_l},{y_l}) $为POI的坐标,$ (\overline {{a}} ,\overline {{y}} ) $为所有POI的平均中心,D为所有POI到$ (\overline {{a}} ,\overline {{y}} ) $的距离中值.
带宽范围内每个POI的贡献值大小直接由核函数决定. 核函数通常为对称函数,常见的核函数包括均匀核函数、三角核函数、Epanechnikov曲线核函数和Gaussian曲线核函数,本文选取广泛应用的Gaussian曲线核函数,如式(5)所示.
k(a)=\frac{1}{\sqrt{2 {\text{π}}}} \exp \left(-\frac{1}{2} a^2\right). (5) 2.2 数据切分
本文以500 m的栅格为研究对象,遥感图像分辨率为2 m. 基于二次幂数值的矩阵维度配置可有效提升GPU并行计算效率,故使用最邻近插值法将每个样本的尺寸更改为256 × 256.
2.3 数据增强
数据增强是指对训练图像进行线性变换,能够起到补充数据样本、缓解深度神经网络过拟合、提高模型泛化能力的作用,让模型更好地适应应用场景. 本文采用包括图像翻转和百分比线性拉伸2种增强策略. 图像翻转变换可分为3种,分别为水平翻转、垂直翻转和对角翻转[18]. 假设图像的宽度和高度分别为$ W $和$ H $,$ \left( {x_{\mathrm{q}},y_{\mathrm{q}}} \right) $为变换前的像素坐标,经过水平翻转后的坐标为$ \left( {x_{\mathrm{h}},y_{\mathrm{h}}} \right) $,如式(6)所示.
\left( {x_{\mathrm{h}},y_{\mathrm{h}}} \right) = \left( {W - x_{\mathrm{q}},y_{\mathrm{q}}} \right), (6) 其矩阵的数学描述为
\left[ {\begin{array}{*{20}{c}} {x_{\mathrm{h}}} \\ {y_{\mathrm{h}}} \\ 1 \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} { - 1}&0&W \\ 0&1&0 \\ 0&0&1 \end{array}} \right]\left[ {\begin{array}{*{20}{c}} x_{\mathrm{q}} \\ y_{\mathrm{q}} \\ 1 \end{array}} \right]. (7) 经过垂直翻转后坐标为
\left( {x_{\mathrm{f}},y_{\mathrm{f}}} \right) = \left( {x_{\mathrm{q}}, H - y_{\mathrm{q}}} \right), (8) 其矩阵的数学描述为
\left[ {\begin{array}{*{20}{c}} {x_{\mathrm{f}}} \\ {y_{\mathrm{f}}} \\ 1 \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} 1&0&0 \\ 0&{ - 1}&H \\ 0&0&1 \end{array}} \right]\left[ {\begin{array}{*{20}{c}} x_{\mathrm{q}} \\ y_{\mathrm{q}} \\ 1 \end{array}} \right]. (9) 对角翻转则通过垂直翻转后再进行水平翻转得到.
2.4 数据归一化
POI数据和遥感数据的通道叠加在生成Batch之后,模型训练之前进行. 在叠加前使用Min-Max缩放器将每个通道的数据缩放到0~1,Min-Max的缩放计算如式(10)所示.
{x_{\mathrm{sf}}} = \frac{{x_{\mathrm{q}} - \min\; x_{\mathrm{q}}}}{{\max \; x_{\mathrm{q}} - \min \; x_{\mathrm{q}}}}, (10) 式中:xq为原始值,$ {{x_{\mathrm{sf}}}} $为缩放后的值.
2.5 土地利用识别
随着模型训练,需调整的参数数量逐渐减少,每个Epoch训练后学习率会衰减. 而模型训练一段时间后,可能会陷入“马鞍面”(局部最优),使得梯度变小. 在“马鞍面”上计算损失函数对参数的导数时,其一阶导数等于0,二阶导数的正负值不相同;梯度为0会导致模型无法进一步对参数进行更新. 针对上述情况,本文采用余弦退火(CA)算法对学习率进行调整. 余弦函数中随着xq从0逐渐增加,余弦值先是缓慢下降,然后加速下降,之后再次缓慢下降. 且该算法带有重启的随机梯度下降机制,可以对学习率进行规划,当学习率小于预先设定的阈值时,可以通过增加学习率使模型跳出“马鞍面”. 在第$ g $个epoch(回合)运行中,学习率pg按式(11)进行衰减.
p_{g} = p_{{\mathrm{min}}g} + {\frac{{p_{{\mathrm{max}}g} - p_{{\mathrm{min}}g}}}{2}} \left( {1 + \cos \left( {\frac{{{E_{{\mathrm{cur}}}}}}{{{E_{\mathrm{all}}}}}{\text{π}} } \right)} \right), (11) 式中:$ p_{{\mathrm{min}}g} $、$ p_{{\mathrm{max}}g} $分别为学习率的最小值、最大值,$ {E_{{\mathrm{cur}}}} $为每一次重启后执行的epoch次数,$ {E}_{{\mathrm{all}}} $为执行的epoch总次数.
当$ E_{\text {cur}}=0 $时,$ {E_{{{\mathrm{cur}}}}} = {p_{\max g}} $;当$ {E_{{\mathrm{cur}}}} = {E_{{\mathrm{all}}}} $时, $ {p _{g}} = p_{{\mathrm{min}}g} $. 当执行完第g个Epoch之后重启,使用$ {p _g} $作为初始解.
3. 实验数据介绍
3.1 城市区域网格化划分
以深圳市数据对模型进行验证. 通过ArcGIS软件,以500 m网格对深圳市域地理图层进行划分,共得到
8650 个网格. 为评估模型的稳健性,将福田区和罗湖区的数据作为迁移验证模型的输入.3.2 土地利用标签数据
本文使用的土地利用识别模型为有监督学习模型,城市土地利用数据来源于深圳市规划和自然资源局. 土地利用一级分类包含如下6类:住宅用地、商服用地、公共管理与公共服务用地、工矿仓储用地、交通运输用地、其他用地. 根据《土地利用现状分类》(GB/T 21010—2017)[19]中一级分类标准对深圳市使用的地类名称与编码核对,全市用地类别编码及相关描述如表1所示.
表 1 深圳市土地利用现状类别Table 1. Current land use types in Shenzhen City编码 用地属性 描述 总面积/km2 07 住宅用地 除配套的商务、服务业设施用地之外的用于居民生活和居住的各种类型的住宅以及周边的附属设施用地 211.75 05 商服用地 包括用于商务服务用地,以及办公场所具有经营性质的用地;居住用地中包含商业零售、服务、生产、批发、娱乐等功能为主的用地也包含在内 37.26 08 公共管理与公共服务用地 包括公用的文体设施用地,以及各种类型的教育、机关团体、医疗服务等用地 390.69 06 工矿仓储用地 指工厂、车间、手工业作坊等进行工业生产、产品加工制造活动用地,也包括直接服务于工业生产的附属设施用地 273.20 10 交通运输用地 包括直接用于交通运输和通行的地面线路;交通服务设施用地,例如火车场站、地铁站、汽运枢纽及其附属设施用地;军民合用机场、民用机场用地;港口及其附属建筑物用地 235.15 12 其他用地 裸地、水域等未利用和未开发用地 1084.64 3.3 遥感影像数据
本文使用的两景高分遥感影像数据来自中国资源卫星应用中心[20],两景数据包括高分一号全色和多光谱卫星影像(空间分辨率为2 m的全色波段和4个空间分辨率为8 m的多光谱波段). 采集时间分别为2017年1月21日和2017年2月15日,中心经/纬度(WGS84坐标)分别为113.974°/22.636°和114.291°/22.643°,遥感影像覆盖的空间区域如图2所示,两景影像为蓝色边框包围的正方形区域,红色轮廓的是深圳市行政边界.
3.4 POI数据
POI数据利用Python从高德开放平台的Web服务[21]获取,共计
82252 条数据. 根据高德开放平台分类编码表,对照表1的城市土地利用类别,可以建立POI和城市土地利用之间的映射关系,如表2所示.表 2 高德POI和城市土地利用的映射关系Table 2. Mapping relationship between AutoNavi POI and urban land use类别编码 用地属性 高德 POI 类别编码 高德 POI 类别说明 07 住宅用地 中类: 1203 中类:住宅区 05 商服用地 大类:12,16,17 大类:商务住宅、金融保险服务,公司企业 08 公共管理与服务
服务用地大类:09,11,13,14;
中类:1410 ,1412 ,1413 ,1415 大类:医疗保健服务、风景名胜、政府机构及社会团体、科教文化服务
中类:文艺团体,学校、科研机构、驾校06 工矿仓储用地 中类:0705, 1703 ;
小类:170204 ,170205 中类:物流快递、工厂
小类:机械电子、冶金化工10 交通运输用地 大类:15 大类:交通设施服务 12 其他用地 3.5 数据融合
遥感影像有4个波段(R、G、B、Nir),归一化植被指数(NDVI)会增加1个通道,POI映射和核密度估计处理后产生6个通道(如图3所示),故模型输入的通道数为11个,本次实验通过通道叠加的方式融合数据. 输入数据的通道概况如表3所示. 由于各类样本数量比例不均衡,实验中采用复制影像样本的方式进行上采样. 若影像样本中包含类别07(商服用地)或类别05(公共管理与公共服务用地),则对其上采样一份.
4. 结果分析
4.1 模型参数说明
本论文实验基于Pytorch框架进行,实验设备系统为Windows系统,CPU为Intel(R)Xeon(R)Gold 6230,GPU为NVIDIA TU104GL,内存为64 GB. 实验使用5层神经网络结构,输入多源特征数据以及相应的标签数据用于模型训练. 输入数据的格式为256 × 256 × Nt,Nt为通道数,Nt的最大取值为11. 每层网络统一采用3 × 3的卷积核,5个编码器的通道数分别为256、128、64、32和16,激活函数为ReLU函数. 池化层连接在卷积层之后,池化核的大小均为2 × 2,步长为2.
表 3 输入数据通道概况Table 3. Description of input data channels数据类型 通道描述 通道数量/个 通道总和/个 遥感影像 全色 1 4 多光谱 3 NDVI 1 1 POI 映射编码为 07 1 6 映射编码为 05 1 映射编码为 08 1 映射编码为 06 1 映射编码为 10 1 映射编码为 12 1 为实现深度监督,UNet++ 输出层和跳跃路径目标节点均采用1 × 1的卷积核,最后通过Softmax激活函数输出每个像素的土地利用分类概率. Batch-size设置为8,采用Adam(自适应学习率的梯度下降算法)优化器,初始学习率为
0.00005 . 采用准确度Acc和平均准确度mAcc对模型性能进行评估,如式(12)、(13)所示.A_{{\mathrm{cc}}k} = \frac{{T_{\mathrm{P}}}}{{F_{\mathrm{P}} + T_{\mathrm{P}}}}, (12) m_{A{\mathrm{cc}}} = {{\displaystyle\sum\limits_{k = 1}^K {A_{\text{cc}k}}}}/{K}, (13) 式中:$ A_{\text{cc}k} $为第$ k $个类别的准确度;$ T_{\mathrm{P}} $为真正例,即模型预测为正例,实际是正例;$ F_{\mathrm{P}} $为假正例,模型预测为正例,实际是反例;$ K $为类别总数.
4.2 交叉验证结果
实验中采用5折交叉验证对融合效果和CA算法进行评估. 由表4可知,交叉验证的平均mAcc提升0.067. POI特征有助于表征城市土地利用信息. 交叉验证中各类别的准确度变化如图4所示. 由图可知,融合POI通道特征后,各类用地的准确度都有明显提高.
表 4 POI特征交叉验证结果Table 4. Results of cross-validation considering POI characteristics验证折数序号 方法 是否融合 POI 通道特征 各用地类型准确度 mAcc 平均mAcc 07 05 08 06 10 12 1 UNet++ 是 0.660 0.467 0.523 0.679 0.644 0.835 0.635 0.639 2 0.676 0.451 0.515 0.691 0.637 0.830 0.633 3 0.720 0.472 0.519 0.712 0.661 0.864 0.658 4 0.675 0.450 0.493 0.639 0.660 0.863 0.630 5 0.689 0.417 0.484 0.677 0.684 0.877 0.638 1 UNet++ 否 0.714 0.581 0.591 0.720 0.681 0.865 0.692 0.706 2 0.729 0.616 0.645 0.735 0.674 0.847 0.708 3 0.735 0.605 0.674 0.723 0.708 0.865 0.718 4 0.720 0.594 0.635 0.684 0.704 0.871 0.701 5 0.735 0.586 0.628 0.712 0.720 0.881 0.710 由图4(f)可知,其他用地的Acc处于最高水平,绝大部分植被、裸地和水域属于该用地类型,其光谱和纹理等特征比较显著,更容易被模型学习到[22], POI数据融合对识别精度的提升并不显著. 在6类用地类型中,商服用地、公共管理与公共服务用地识别难度高于其他类型用地,这2类用地的光谱和纹理特征不够显著,且周围往往伴随着更高的土地利用混合度,模型学习过程中受到较大干扰. 由于遥感影像仅涉及光谱、纹理和地物结构等物理属性,区分用地类型时面临挑战. POI通道特征可以表征上述具有社会经济属性的用地特征,融合POI数据后,这2类土地利用类型识别精度提升幅度大于其他用地类型识别精度. 进一步表明在土地利用类型识别建模过程中融合POI数据的必要性. 在训练时,梯度下降算法可能陷入“马鞍面”,可以通过CA算法的重启机制提高学习率,跳出“马鞍面”并找到全局最优的路径. $ p _{{\text{min}}g} $和$ p _{{\mathrm{max}} g} $分别设置为
0.00002 和0.00010 ,优化前后的结果如表5所示. 采用CA算法对学习率进行优化后,训练模型验证集中各用地类别的准确度得到改善,mAcc平均提高0.015,由此可见CA算法对学习率的重启有助于模型跳出“马鞍面”,从而改善训练模型性能. 其中,序号为8的mAcc最高,该训练模型即为本次实验选择的最优预测模型.表 5 CA算法优化前后结果Table 5. Results of CA algorithm before and after optimization验证折数序号 方法 CA 优化 各用地类别准确度 mAcc 平均mAcc 07 05 08 06 10 12 6 UNet++ 未使用 0.714 0.581 0.591 0.720 0.681 0.865 0.692 0.706 7 0.729 0.616 0.645 0.735 0.674 0.847 0.708 8 0.735 0.605 0.674 0.723 0.708 0.865 0.718 9 0.720 0.594 0.635 0.684 0.704 0.871 0.701 10 0.735 0.586 0.628 0.712 0.720 0.881 0.710 6 UNet++ 使用 0.726 0.599 0.600 0.736 0.708 0.864 0.706 0.721 7 0.742 0.641 0.647 0.754 0.700 0.852 0.723 8 0.744 0.628 0.670 0.733 0.735 0.876 0.731 9 0.733 0.625 0.644 0.705 0.732 0.873 0.719 10 0.748 0.607 0.639 0.729 0.741 0.878 0.724 4.3 迁移建模结果
将最优的土地利用识别模型进行迁移验证,对土地利用类别进行预测,预测结果的混淆矩阵元素如表6所示,各类土地利用的准确率如图5所示.
表 6 迁移区域土地利用预测结果Table 6. Predicted results of land use in migration area土地利用
类型编码预测结果 准确度 mAcc 07 05 08 06 10 12 07 7254587 460884 331122 1373299 463604 150510 0.723 0.726 05 309627 1255023 45412 213230 199606 35091 0.608 08 592161 86457 3267402 256562 228235 126230 0.717 06 348281 35893 127925 2467265 289679 60600 0.741 10 1208635 504431 218529 498040 5776828 390006 0.672 12 824235 52864 32349 833590 1160088 24745690 0.895 从表6和图5可知,住宅用地被误分类为工矿仓储用地和交通运输用地的可能性最大,商服用地、公共管理与公共服务用地、交通运输用地被误分类为居民用地的可能性最大,工矿仓储用地被误分类为住宅用地或交通运输用地的可能性差异不大,其他用地被误分类的类别主要是交通运输用地、住宅用地和工矿仓储用地. 由表6可知,预测精度方面,其他用地上的准确度最高(0.895),此类用地主要包括绿地、裸地、水域、公用设施及未开发用地,这些区域的纹理和光谱特征明显,包含的POI特征很少,且在空间上的分布面积大且连续,说明识别这类用地主要依赖于光谱和纹理特征. 住宅用地、公共管理与公共服务用地、工矿仓储用地上的准确度均在0.700以上,这类用地往往在空间分布上相对连续,且每一块用地的分布面积一般较大,从遥感影像和POI提取的特征能够较好地反映这些用地的相关特性. 住宅用地、工矿仓储用地、其他用地所属区域的土地利用混合度一般较低,意味着有更高的纯度,从而达到较好的识别效果,这与以往的研究结论一致[23].
在交通运输用地上的准确度为0.672,识别效果一般,主要原因是该类用地主要以道路为主,道路的形状比较细长,模型学习过程中容易受到两侧用地特征的干扰,而且由于影像角度的原因,某些道路可能被建筑物遮挡以致其无法表现其光谱和纹理信息[24],因此交通运输用地容易被误分类. 商服用地的预测准确度为0.608,准确性不够理想,尽管大面积的商服用地分布通常比较独立,但小面积的商服用地分布往往与住宅用地混合在一起,且他们的光谱特征相似度高,导致面积较小的商服用地无法被准确识别.
5. 结 论
1) 融合POI数据到遥感图像数据中对城市土地利用识别,可以提升识别精度(识别精度提升0.067),尤其对公共管理与公共服务用地的识别,POI数据弥补了遥感影像仅涉及光谱、纹理和地物结构物理属性的不足.
2) 应用CA算法对模型参数优化,避免模型陷入局部最优困境,提高土地利用的识别结果.
3) 将本文所提出模型应用于新区域,土地利用识别精度增加了2%,表明所提出模型具有较强的稳健性,可迁移到新区域进行应用.
4) 在城市交通系统土地利用识别中,交通运输用地、商服用地识别难度较高,在未来建模研究中,需要着重考虑此类用地的特征.
-
表 1 深圳市土地利用现状类别
Table 1. Current land use types in Shenzhen City
编码 用地属性 描述 总面积/km2 07 住宅用地 除配套的商务、服务业设施用地之外的用于居民生活和居住的各种类型的住宅以及周边的附属设施用地 211.75 05 商服用地 包括用于商务服务用地,以及办公场所具有经营性质的用地;居住用地中包含商业零售、服务、生产、批发、娱乐等功能为主的用地也包含在内 37.26 08 公共管理与公共服务用地 包括公用的文体设施用地,以及各种类型的教育、机关团体、医疗服务等用地 390.69 06 工矿仓储用地 指工厂、车间、手工业作坊等进行工业生产、产品加工制造活动用地,也包括直接服务于工业生产的附属设施用地 273.20 10 交通运输用地 包括直接用于交通运输和通行的地面线路;交通服务设施用地,例如火车场站、地铁站、汽运枢纽及其附属设施用地;军民合用机场、民用机场用地;港口及其附属建筑物用地 235.15 12 其他用地 裸地、水域等未利用和未开发用地 1084.64 表 2 高德POI和城市土地利用的映射关系
Table 2. Mapping relationship between AutoNavi POI and urban land use
类别编码 用地属性 高德 POI 类别编码 高德 POI 类别说明 07 住宅用地 中类: 1203 中类:住宅区 05 商服用地 大类:12,16,17 大类:商务住宅、金融保险服务,公司企业 08 公共管理与服务
服务用地大类:09,11,13,14;
中类:1410 ,1412 ,1413 ,1415 大类:医疗保健服务、风景名胜、政府机构及社会团体、科教文化服务
中类:文艺团体,学校、科研机构、驾校06 工矿仓储用地 中类:0705, 1703 ;
小类:170204 ,170205 中类:物流快递、工厂
小类:机械电子、冶金化工10 交通运输用地 大类:15 大类:交通设施服务 12 其他用地 表 3 输入数据通道概况
Table 3. Description of input data channels
数据类型 通道描述 通道数量/个 通道总和/个 遥感影像 全色 1 4 多光谱 3 NDVI 1 1 POI 映射编码为 07 1 6 映射编码为 05 1 映射编码为 08 1 映射编码为 06 1 映射编码为 10 1 映射编码为 12 1 表 4 POI特征交叉验证结果
Table 4. Results of cross-validation considering POI characteristics
验证折数序号 方法 是否融合 POI 通道特征 各用地类型准确度 mAcc 平均mAcc 07 05 08 06 10 12 1 UNet++ 是 0.660 0.467 0.523 0.679 0.644 0.835 0.635 0.639 2 0.676 0.451 0.515 0.691 0.637 0.830 0.633 3 0.720 0.472 0.519 0.712 0.661 0.864 0.658 4 0.675 0.450 0.493 0.639 0.660 0.863 0.630 5 0.689 0.417 0.484 0.677 0.684 0.877 0.638 1 UNet++ 否 0.714 0.581 0.591 0.720 0.681 0.865 0.692 0.706 2 0.729 0.616 0.645 0.735 0.674 0.847 0.708 3 0.735 0.605 0.674 0.723 0.708 0.865 0.718 4 0.720 0.594 0.635 0.684 0.704 0.871 0.701 5 0.735 0.586 0.628 0.712 0.720 0.881 0.710 表 5 CA算法优化前后结果
Table 5. Results of CA algorithm before and after optimization
验证折数序号 方法 CA 优化 各用地类别准确度 mAcc 平均mAcc 07 05 08 06 10 12 6 UNet++ 未使用 0.714 0.581 0.591 0.720 0.681 0.865 0.692 0.706 7 0.729 0.616 0.645 0.735 0.674 0.847 0.708 8 0.735 0.605 0.674 0.723 0.708 0.865 0.718 9 0.720 0.594 0.635 0.684 0.704 0.871 0.701 10 0.735 0.586 0.628 0.712 0.720 0.881 0.710 6 UNet++ 使用 0.726 0.599 0.600 0.736 0.708 0.864 0.706 0.721 7 0.742 0.641 0.647 0.754 0.700 0.852 0.723 8 0.744 0.628 0.670 0.733 0.735 0.876 0.731 9 0.733 0.625 0.644 0.705 0.732 0.873 0.719 10 0.748 0.607 0.639 0.729 0.741 0.878 0.724 表 6 迁移区域土地利用预测结果
Table 6. Predicted results of land use in migration area
土地利用
类型编码预测结果 准确度 mAcc 07 05 08 06 10 12 07 7254587 460884 331122 1373299 463604 150510 0.723 0.726 05 309627 1255023 45412 213230 199606 35091 0.608 08 592161 86457 3267402 256562 228235 126230 0.717 06 348281 35893 127925 2467265 289679 60600 0.741 10 1208635 504431 218529 498040 5776828 390006 0.672 12 824235 52864 32349 833590 1160088 24745690 0.895 -
[1] 钟鸣,董一鸣,汉特•道格拉斯,等. 面向新城的土地利用-交通整体规划建模方法[J]. 交通运输系统工程与信息,2021,21:13-25.ZHONG Ming, DONG Yi, JOHN-DOUGLAS H, et al. Development of a new town planning method using an integrated land use-transport model[J]. Journal of Transportation Systems Engineering and Information Technology, 2021, 21: 13-25. [2] 武凯飞,钟鸣,王慧妮,等. 面向土地交通整体规划的土地利用精细分类模型研究[J]. 武汉理工大学学报(交通科学与工程版),2020,44:669-75.WU Kaifei, ZHONG Ming, WANG Huini, et al. Study on high-resolution classification model of land use for overall planning of land transportation[J]. Journal of Wuhan University of Technology (Transportation Science & Engineering), 2020, 44: 669-75. [3] 赵锦焕,李文权. 居民出行调查中交通小区划分方法的改进[J]. 交通运输工程与信息学报,2009,7(2): 110-115.ZHAO J, LI W. Improvement of the traffic district partition in resident trip investigation[J]. Journal of Transportation Engineering and Information, 2009, 7(2): 110-115. [4] LI J X, HONG D F, GAO L R, et al. Deep learning in multimodal remote sensing data fusion: a comprehensive review[J]. International Journal of Applied Earth Observation and Geoinformation, 2022, 112: 102926.1-102926.16. [5] CARRANZA-GARCÍA M, GARCÍA-GUTIÉRREZ J, RIQUELME J C. A framework for evaluating land use and land cover classification using convolutional neural networks[J]. Remote Sensing, 2019, 11(3): 274.1-274.23. [6] ZHANG C, JIANG W S, ZHANG Y, et al. Transformer and CNN hybrid deep neural network for semantic segmentation of very-high-resolution remote sensing imagery[J]. IEEE Transactions on Geoscience and Remote Sensing, 2022, 60: 3144894.1-3144894.20. [7] ZHENG H H, GONG M G, LIU T F, et al. HFA-Net: high frequency attention Siamese network for building change detection in VHR remote sensing images[J]. Pattern Recognition, 2022, 129: 108717.1-108717.11. [8] CHENG G, WANG G X, HAN J W. ISNet: towards improving separability for remote sensing image change detection[J]. IEEE Transactions on Geoscience and Remote Sensing, 2022, 60: 3174276.1-3174276.11. [9] CAO R, ZHU J S, TU W, et al. Integrating aerial and street view images for urban land use classification[J]. Remote Sensing, 2018, 10(10): 1553.1-1553.23. [10] ZONG L L, HE S J, LIAN J T, et al. Detailed mapping of urban land use based on multi-source data: a case study of Lanzhou[J]. Remote Sensing, 2020, 12(12): 1987.1-1987.19. [11] LU W P, TAO C, LI H F, et al. A unified deep learning framework for urban functional zone extraction based on multi-source heterogeneous data[J]. Remote Sensing of Environment, 2022, 270: 112830.1-112830.16. [12] SUN J, WANG H, SONG Z L, et al. Mapping essential urban land use categories in Nanjing by integrating multi-source big data[J]. Remote Sensing, 2020, 12(15): 2386.1-2386.18. [13] 季顺平,田思琦,张驰. 利用全空洞卷积神经元网络进行城市土地覆盖分类与变化检测[J]. 武汉大学学报(信息科学版),2020,45:233-41.JI Shunping, TIAN Siqi, ZHANG Chi. Urban land cover classification and change detection using fully atrous convolutional neural network[J]. Geomatics and Information Science of Wuhan University, 2020, 45: 233-41. [14] LIU X P, HE J L, YAO Y, et al. Classifying urban land use by integrating remote sensing and social media data[J]. International Journal of Geographical Information Science, 2017, 31(8): 1675-1696. doi: 10.1080/13658816.2017.1324976 [15] PENG D F, ZHANG Y J, GUAN H Y. End-to-end change detection for high resolution satellite images using improved UNet + + [J]. Remote Sensing, 2019, 11(11): 1382.1-1382.23. doi: 10.3390/rs11111382 [16] YUAN Y T, FANG F M, ZHANG G X. Superpixel-based seamless image stitching for UAV images[J]. IEEE Transactions on Geoscience and Remote Sensing, 2021, 59(2): 1565-1576. doi: 10.1109/TGRS.2020.2999404 [17] 禹文豪,艾廷华. 核密度估计法支持下的网络空间POI点可视化与分析[J]. 测绘学报,2015,44:82-90.YU Wenhao, AI Tinghua. The visualization and analysis of POI features under network space supported by kernel density estimation[J]. Acta Geodaetica et Cartographica Sinica, 2015, 44: 82-90. [18] 侯越,陈逸涵,顾兴宇,等. 基于卷积自编码的沥青路面目标与裂缝智能识别[J]. 中国公路学报,2020,33:288-303.HOU Yue, CHEN Yihan, GU Xingyu, et al. Automatic identification of pavement objects and cracks using the convolutional auto-encoder[J]. China Journal of Highway and Transport, 2020, 33: 288-303. [19] 中华人民共和国国家市场监督管理总局.土地利用现状分类 GB/T 21010—2017[S]. 北京:中国标准出版社,2017. [20] 中国资源卫星应用中心. 高分一号 [EB/OL]. [2023-06-01]. https://www.cresda.com. [21] 高德开放平台. POI数据[EB/OL]. [2023-06-01]. https://restapi.amap.com/v3/place. [22] DU S H, DU S H, LIU B, et al. Mapping large-scale and fine-grained urban functional zones from VHR images using a multi-scale semantic segmentation network and object based approach[J]. Remote Sensing of Environment, 2021, 261: 112480.1-112480.20. [23] DENG Y B, CHEN R R, YANG J, et al. Identify urban building functions with multisource data: a case study in Guangzhou, China[J]. International Journal of Geographical Information Science, 2022, 36(10): 2060-2085. doi: 10.1080/13658816.2022.2046756 [24] ZHOU W, MING D P, LV X W, et al. SO-CNN based urban functional zone fine division with VHR remote sensing image[J]. Remote Sensing of Environment, 2020, 236: 111458.1-111458.20. -