論文推薦| 王鶴: 城市擴(kuò)展極限學(xué)習(xí)機(jī)模型

昵稱(chēng)16619343 2019-01-23

展開(kāi)全文

《測(cè)繪學(xué)報(bào)》

構(gòu)建與學(xué)術(shù)的橋梁拉近與權(quán)威的距離

城市擴(kuò)展極限學(xué)習(xí)機(jī)模型

王鶴^1,2, 曾永年^1,2

1. 中南大學(xué)地球科學(xué)與信息物理學(xué)院, 湖南長(zhǎng)沙 410083;
2. 中南大學(xué)空間信息技術(shù)與可持續(xù)發(fā)展研究中心, 湖南長(zhǎng)沙 410083

收稿日期：2017-10-16；修回日期：2018-09-10

基金項(xiàng)目：國(guó)家自然科學(xué)基金資助項(xiàng)目（41171326；40771198）

第一作者簡(jiǎn)介：王鶴(1993-), 男, 碩士生, 研究方向?yàn)槌鞘屑皡^(qū)域環(huán)境模擬。E-mail:hewang6@126.com

通信作者：曾永年, E-mail: ynzeng@mail.csu.edu.cn

摘要：城市空間結(jié)構(gòu)及其擴(kuò)展的模擬是城市科學(xué)管理與規(guī)劃的重要前提，本文基于極限學(xué)習(xí)機(jī)提出了顧及不同非城市用地轉(zhuǎn)化為城市用地差異與強(qiáng)度的城市擴(kuò)展元胞自動(dòng)機(jī)模型（ELM-CA）。模型驗(yàn)證表明：①ELM-CA模型的模擬精度達(dá)到70.30%，相比于邏輯回歸和神經(jīng)網(wǎng)絡(luò)分別提高了2.21%和1.54%，FoM系數(shù)分別提高了0.025 9和0.017 9，Kappa系數(shù)分別提高了0.024 7和0.016 9，且Moran Ⅰ指數(shù)接近于實(shí)際值，說(shuō)明極限學(xué)習(xí)機(jī)模型較邏輯回歸和神經(jīng)網(wǎng)絡(luò)能更有效模擬城市擴(kuò)展的空間形態(tài)及其變化；②ELM模型的訓(xùn)練時(shí)間僅為神經(jīng)網(wǎng)絡(luò)的1/3左右，體現(xiàn)了ELM學(xué)習(xí)速度的優(yōu)勢(shì)；③在小樣本情況下，邏輯回歸和神經(jīng)網(wǎng)絡(luò)都受到明顯的影響，而極限學(xué)習(xí)機(jī)還能保持良好的性能，這個(gè)特點(diǎn)使其在樣本難以獲取的情況下具有明顯的優(yōu)勢(shì)。兩個(gè)時(shí)相的城市擴(kuò)展模擬與真實(shí)數(shù)據(jù)的比較表明：基于極限學(xué)習(xí)機(jī)的城市擴(kuò)展元胞自動(dòng)機(jī)模型（ELM-CA），簡(jiǎn)化了CA模型的復(fù)雜度，并在小樣本情況下能有效提高模擬精度，適合于復(fù)雜土地利用條件下城市擴(kuò)展模擬與預(yù)測(cè)。

關(guān)鍵詞：城市空間擴(kuò)展復(fù)雜土地利用地類(lèi)轉(zhuǎn)化差異元胞自動(dòng)機(jī) 極限學(xué)習(xí)機(jī)

Urban Expansion Model Based on Extreme Learning Machine

WANG He^1,2, ZENG Yongnian^1,2

Abstract: Urban space structure and its simulation are important prerequisites for urban scientific management and planning. Based on the extreme learning machine, this paper proposes an urban extended cellular automaton model (ELM-CA) that takes into account the differences and intensities of different non-urban land conversions into urban land use. The experimental results show that the urban simulation accuracy of ELM-CA model reaches 70.30%, which is 2.21% and 1.54% higher than logistic regression and neural network respectively. The FoM coefficient is increased by 0.025 9 and 0.017 9 respectively, and the Kappa coefficient is improved by 0.024 7 and 0.016 9 respectively. And the Moran Ⅰ index is close to the actual value, which shows that the extreme learning machine model can simulate and predict the spatial shape and change of urban expansion more effectively than logistic regression and neural network; the training time of ELM model is only about 1/3 of the neural network, it reflects the advantage of ELM learning speed; In the small sample case, both logistic regression and neural network are significantly affected, and the extreme learning machine can maintain good performance, which makes it have obvious advantages when the sample is difficult to obtain. The comparison between urban expansion simulation and real data of two phases shows that the urban extended cellular automata model (ELM-CA) based on the extreme learning machine simplifies the complexity of the CA model and can effectively improve simulation accuracy under small sample conditions. The proposed model is suitable for urban expansion simulation and prediction under complex land use conditions.

Key words: urban space expansion complex land use land conversion differences cellular automata extreme learning machine

進(jìn)入21世紀(jì)，我國(guó)的城市化水平得到大幅度的提高，目前已進(jìn)入城鎮(zhèn)化快速發(fā)展時(shí)期。城市化的快速發(fā)展在帶來(lái)巨大經(jīng)濟(jì)、社會(huì)效益的同時(shí)，也引發(fā)了社會(huì)與環(huán)境的問(wèn)題。城市生活用地、工業(yè)生產(chǎn)用地的擴(kuò)展與農(nóng)業(yè)生產(chǎn)用地、生態(tài)用地的矛盾日益突出^[1^-2^]，城市作為對(duì)生態(tài)環(huán)境影響最為深刻的區(qū)域，城市化過(guò)程對(duì)區(qū)域生態(tài)環(huán)境產(chǎn)生很大的影響^[3^]。為促進(jìn)城市化過(guò)程的健康、可持續(xù)發(fā)展，城市土地資源的科學(xué)規(guī)劃與管理就顯得尤為重要。而城市空間結(jié)構(gòu)及其擴(kuò)展的科學(xué)模擬與預(yù)測(cè)是城市科學(xué)管理與規(guī)劃的重要前提。為此，城市空間擴(kuò)展過(guò)程的模擬與預(yù)測(cè)成為當(dāng)前研究熱點(diǎn)之一。元胞自動(dòng)機(jī)(CA)模型作為一種時(shí)間和空間都離散的網(wǎng)格動(dòng)力型模型，能基于局部行為模擬復(fù)雜的全局變化。因此，CA模型具有模擬地理復(fù)雜系統(tǒng)演化的能力^[4^]。利用CA模型能夠顧及城市區(qū)域宏觀自然經(jīng)濟(jì)環(huán)境和土地利用局部變化^[5^]，從而實(shí)現(xiàn)對(duì)復(fù)雜城市化過(guò)程的模擬與預(yù)測(cè)。

在CA模型的構(gòu)建與城市擴(kuò)展模擬應(yīng)用中，轉(zhuǎn)換規(guī)則的確定是CA模型的關(guān)鍵，在CA模型中，有許多代表著經(jīng)濟(jì)或自然約束的變量，這些變量對(duì)應(yīng)的參數(shù)代表著對(duì)應(yīng)變量的貢獻(xiàn)值，如何求取這些參數(shù)，是CA模型的難點(diǎn)^[6^-13^]。邏輯回歸較早的應(yīng)用于元胞轉(zhuǎn)換規(guī)則的提取，文獻(xiàn)[14]基于線(xiàn)性L(fǎng)ogistic回歸獲得CA模型轉(zhuǎn)換規(guī)則并成功應(yīng)用于廣州城市的擴(kuò)展模擬；文獻(xiàn)[15]將邏輯回歸、馬爾科夫鏈和CA模型結(jié)合，有效地提高了模擬的精度；文獻(xiàn)[16]利用邏輯回歸探索了城市擴(kuò)展驅(qū)動(dòng)力對(duì)于城市發(fā)展的影響，以沈陽(yáng)市1997—2010年城市建成區(qū)變化作為因變量，Logistic回歸分析得到影響沈陽(yáng)城市擴(kuò)展的前幾位驅(qū)動(dòng)因子依次是開(kāi)發(fā)區(qū)、距1997年城區(qū)距離、DEM、距高速公路和鐵路距離、人口密度。已有研究表明邏輯回歸較多元分析更能充分的揭示城市擴(kuò)展規(guī)律，但在處理復(fù)雜的變量關(guān)系時(shí)難以表達(dá)研究區(qū)域的非線(xiàn)性變化。為了有效解決復(fù)雜城市系統(tǒng)模擬的問(wèn)題，文獻(xiàn)[17]將神經(jīng)網(wǎng)絡(luò)引入CA模型，利用神經(jīng)網(wǎng)絡(luò)獲取土地利用轉(zhuǎn)換規(guī)則，獲得了比邏輯回歸更高的模擬精度；文獻(xiàn)[18]將神經(jīng)網(wǎng)絡(luò)與元胞自動(dòng)機(jī)結(jié)合，從不同時(shí)相的遙感數(shù)據(jù)中挖掘城市擴(kuò)展的演變規(guī)律，并對(duì)義烏市作了實(shí)證分析和模擬預(yù)測(cè)，與同期義烏市的發(fā)展基本吻合；文獻(xiàn)[19]將神經(jīng)網(wǎng)絡(luò)與CA模型結(jié)合獲取了理想的模擬結(jié)果。然而，已有的研究表明神經(jīng)網(wǎng)絡(luò)屬于黑箱操作，且存在容易陷入局部最優(yōu)解和收斂慢的問(wèn)題。為此，將智能算法與CA模型結(jié)合的研究成為當(dāng)前研究的熱點(diǎn)之一，文獻(xiàn)[20—21]提出了將蟻群智能算法和遺傳算法等智能算法和元胞自動(dòng)機(jī)相結(jié)合的模型，成功地應(yīng)用于城市的模擬并取得了較好的結(jié)果；文獻(xiàn)[22]利用多智能體與元胞自動(dòng)機(jī)相結(jié)合的方法并成功模擬了上海市2005年城市擴(kuò)展動(dòng)態(tài)；文獻(xiàn)[23]構(gòu)建了一個(gè)基于博弈論的Cellular模型，并模擬了武漢市城市的發(fā)展進(jìn)程，研究表明城市開(kāi)發(fā)進(jìn)程中不同利益相關(guān)者的權(quán)益沖突可以用博弈論來(lái)解決，相比于純粹的CA模型，基于博弈論的Cellular模型擁有更高的模擬精度。智能算法所提取的規(guī)則不需要數(shù)學(xué)式表達(dá)，能方便地描述土地利用復(fù)雜的關(guān)系。然而，利用智能算法提取轉(zhuǎn)換規(guī)則的過(guò)程相對(duì)復(fù)雜，算法復(fù)雜度較高，從而影響CA模型應(yīng)有的簡(jiǎn)潔性。因此，構(gòu)建結(jié)構(gòu)簡(jiǎn)單，又能充分挖掘元胞轉(zhuǎn)換規(guī)律的城市擴(kuò)展模型是值得進(jìn)一步探討的問(wèn)題。

近年來(lái)，在傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上發(fā)展的極限學(xué)習(xí)機(jī)能夠較好地解決神經(jīng)網(wǎng)絡(luò)算法速度慢、易陷入局部最優(yōu)解等問(wèn)題^[24^-25^]。相比于智能算法，極限學(xué)習(xí)機(jī)的結(jié)構(gòu)更為簡(jiǎn)單，能有效降低模型的復(fù)雜度；相比于神經(jīng)網(wǎng)絡(luò)，極限學(xué)習(xí)機(jī)不需要迭代求解，運(yùn)行速度高且不易陷于局部最優(yōu)解。因此，本文基于極限學(xué)習(xí)機(jī)，構(gòu)建城市擴(kuò)展的CA模型(ELM-CA)。在城市元胞結(jié)構(gòu)設(shè)計(jì)的基礎(chǔ)上，基于極限學(xué)習(xí)機(jī)自學(xué)習(xí)特性，有效挖掘城市空間擴(kuò)展轉(zhuǎn)換規(guī)則，以期為城市空間擴(kuò)展模擬與預(yù)測(cè)提供更為準(zhǔn)確、客觀的技術(shù)方法。

1 ELM-CA城市擴(kuò)展模型1.1 極限學(xué)習(xí)機(jī)(ELM)理論基礎(chǔ)

極限學(xué)習(xí)機(jī)是一種簡(jiǎn)單有效的單隱層前饋神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法，能逼近復(fù)雜的非線(xiàn)性函數(shù)，具有泛化性能好、學(xué)習(xí)速度快等特點(diǎn)^[26^]極限學(xué)習(xí)機(jī)的網(wǎng)絡(luò)結(jié)構(gòu)如圖 1所示，其網(wǎng)絡(luò)模型分為輸入層、隱藏層和輸出層。輸入層有 n個(gè)輸入神經(jīng)元，對(duì)應(yīng)著輸入數(shù)據(jù)的 n個(gè)屬性值；隱藏層有 L個(gè)隱藏神經(jīng)單元；輸出層有 m個(gè)輸出神經(jīng)單元，對(duì)應(yīng)著數(shù)據(jù)的 m個(gè)標(biāo)簽。W_ij是第 i個(gè)隱藏層神經(jīng)單元與第 j個(gè)輸入層神經(jīng)單元的鏈接權(quán)值，b_i是第 i個(gè)隱藏層神經(jīng)單元的偏置值，β_ij是第 i個(gè)隱藏層神經(jīng)單元與第 j個(gè)輸出層神經(jīng)單元的鏈接權(quán)值。假設(shè)有 N個(gè)不同的樣本( X_i, Y_i)，其中 i=1, 2, …, N， X_i是屬性數(shù)據(jù)， X_i=[ x_i1xx_in]， Y_i是標(biāo)簽， Y_i=[ y_i1yy_im]。極限學(xué)習(xí)機(jī)的網(wǎng)絡(luò)可以表示為

(1)

式中，g(·)為激勵(lì)函數(shù)，在極限學(xué)習(xí)機(jī)中激勵(lì)函數(shù)要求無(wú)限可微。本文選擇Sigmoid函數(shù)，上述方程用矩陣可以表示為

(2)

式中

(3)

(4)

在極限學(xué)習(xí)機(jī)中，權(quán)值W_ij和偏置 b_i被隨機(jī)確定，所以上述矩陣方程中矩陣 H是確定的，只有 β是未知量。因此，極限學(xué)習(xí)機(jī)中參數(shù)的求解轉(zhuǎn)換為解方程組 Hβ= Y，可以得出(5)式中， H^t是 H的Moore-Penrose廣義逆，經(jīng)過(guò)證明得到的解是唯一的。可以看出極限學(xué)習(xí)機(jī)的求解不需要迭代，所以非常高效，而且克服了傳統(tǒng)基于梯度法所帶來(lái)的局部最小解與過(guò)擬合的弊端。

1.2 ELM-CA模型

1.2.1 元胞狀態(tài)及轉(zhuǎn)換概率

以30 m×30 m分辨率的柵格空間作為元胞空間，元胞狀態(tài)設(shè)置為：城市用地、耕地、林地、水域、裸地。在元胞的轉(zhuǎn)換過(guò)程中，作如下假定：河流、湖泊等水域不發(fā)生轉(zhuǎn)化，城市用地不向非城市用地轉(zhuǎn)化。

非城市用地轉(zhuǎn)換為城市用地的概率( P)一般取決于元胞轉(zhuǎn)換為城市用地的潛力( P_ELM)、元胞鄰域影響( P_neighbor)、隨機(jī)因素( P_random)影響。為此，本模型中元胞轉(zhuǎn)換概率( P)可表達(dá)為(6)元胞轉(zhuǎn)換潛力( P_ELM)：極限學(xué)習(xí)機(jī)能夠很好解決復(fù)雜的非線(xiàn)性問(wèn)題，非常適合地理等復(fù)雜現(xiàn)象。因此，本文利用極限學(xué)習(xí)機(jī)分別提取各主要非城市用地(耕地、林地、裸地)元胞轉(zhuǎn)換為城市用地的潛力( P_ELM)。每一個(gè)模擬的元胞單元有 n個(gè)驅(qū)動(dòng)因子(空間距離變量、自然屬性要素)，對(duì)應(yīng)于輸入層的 n個(gè)神經(jīng)單元，而極限學(xué)習(xí)機(jī)的輸出層對(duì)應(yīng)于該元胞單元轉(zhuǎn)化為城市的潛力。由式(1)可得，元胞的轉(zhuǎn)化潛力 P_ELM(7)

為了充分考慮不同用地類(lèi)型轉(zhuǎn)化為城市用地的差異，按主要非城市用地(耕地、林地、裸地)的歷史數(shù)據(jù)分別采樣，獲得不同用地類(lèi)型轉(zhuǎn)換為城市用地的數(shù)據(jù)，并分別計(jì)算出各用地類(lèi)型對(duì)應(yīng)的模型參數(shù)，這樣在計(jì)算中心元胞城市化潛力的時(shí)候，就用與中心元胞用地類(lèi)型相同的模型參數(shù)，這樣就可以充分考慮不同用地類(lèi)型帶來(lái)的影響。

鄰域影響( P)： P_neighbor是鄰域城市元胞對(duì)中心元胞城市化的貢獻(xiàn)值， P_neighbor(8)關(guān)于中心元胞鄰域的定義，本研究采用擴(kuò)展摩爾型，其中con是條件函數(shù)，S_ij是該元胞的狀態(tài)。隨機(jī)因素影響( P)： P_random是0~1之間的隨機(jī)值，用來(lái)模擬實(shí)際中的隨機(jī)因素的影響，使模擬結(jié)果更加符合真實(shí)情況。

1.2.2 模型流程

CA模型通過(guò)多次的循環(huán)迭代，將鄰域元胞的影響納入模型，體現(xiàn)出元胞間局部相互作用，因?yàn)槊看窝h(huán)城市用地都會(huì)增加，所以鄰域影響每次循環(huán)后也會(huì)改變。假設(shè)從初始年份到目標(biāo)年份，城市元胞數(shù)目增加數(shù)量Q，總的循環(huán)次數(shù)為N，則每次循環(huán)增加的城市元胞個(gè)數(shù)為Q/N，模型的運(yùn)行過(guò)程如下：

(1) 首先利用訓(xùn)練好的極限學(xué)習(xí)機(jī)根據(jù)驅(qū)動(dòng)因子計(jì)算出每個(gè)元胞的轉(zhuǎn)換潛力值(P_ELM)，基于初始年份的城市用地空間分布計(jì)算出鄰域影響值(P_neighbor)，隨機(jī)生成隨機(jī)因素影響值(P_random)，然后將三者相乘得到轉(zhuǎn)化概率(P)。根據(jù)轉(zhuǎn)化概率的大小，選擇前Q/N個(gè)元胞作為新的城市元胞。

(2)根據(jù)新的城市用地空間分布計(jì)算新的鄰域影響值(P_neighbor)，隨機(jī)生成新的隨機(jī)因素影響值(P_random)，轉(zhuǎn)換潛力值(P_ELM)不變。然后根據(jù)得到的新的轉(zhuǎn)化概率(P)，按大小選擇前Q/N個(gè)元胞作為新一輪迭代增加的城市元胞。

(3) 重復(fù)第(2)步，直到總共新增的城市元胞等于Q，或者循環(huán)次數(shù)達(dá)到N。

模型運(yùn)行的流程如圖 2所示。

圖 2 模型運(yùn)行流程Fig. 2 The flow chart of the model

本文的研究區(qū)域是長(zhǎng)沙市主城區(qū)。長(zhǎng)沙市位于中國(guó)東南部，湘江下游地區(qū)，是湖南省政治、經(jīng)濟(jì)、文化中心。地理區(qū)域?yàn)?11°53′E—114°15′E，27°51′N(xiāo)—28°41′N(xiāo)。長(zhǎng)沙市氣候溫和、降雨充沛，屬于亞熱帶季風(fēng)性氣候。長(zhǎng)沙市地形起伏大，東西部山地環(huán)繞，中部較為緩和；地貌類(lèi)型多樣，以山地、丘陵、平原為主；土壤以紅壤和水稻土為主，適合多種農(nóng)作物生長(zhǎng)。試驗(yàn)區(qū)如圖 3所示。

圖 3 試驗(yàn)區(qū)示意圖Fig. 3 Location of the research area

2.2 試驗(yàn)數(shù)據(jù)及處理

利用2006、2010年兩個(gè)時(shí)相的LandsatTM遙感影像監(jiān)督分類(lèi)得到的土地利用數(shù)據(jù)，該土地利用數(shù)據(jù)中將土地利用類(lèi)型劃分為城市用地、耕地、林地、水域和裸地。兩期遙感影像的分類(lèi)精度都達(dá)到80%以上，滿(mǎn)足模擬試驗(yàn)的要求。本文試驗(yàn)使用的交通道路數(shù)據(jù)為1:400 000的湖南省城市電子地圖(2006年)，DEM數(shù)據(jù)來(lái)源于中國(guó)科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心國(guó)際科學(xué)數(shù)據(jù)鏡像網(wǎng)站。

為了確定城市的擴(kuò)展因子對(duì)中心元胞城市化潛力的影響大小，本模型選擇了空間距離、自然屬性?xún)纱箢?lèi)城市擴(kuò)展驅(qū)動(dòng)因子(表 1)作為極限學(xué)習(xí)機(jī)的輸入變量，各空間距離變量利用ARCGIS軟件中的“距離分析”工具獲得；自然屬性變量中的坡度數(shù)據(jù)基于DEM數(shù)據(jù)，利用ARCGIS軟件中的“坡度”計(jì)算模塊獲得；地形起伏度數(shù)據(jù)基于DEM數(shù)據(jù)，利用式(9)通過(guò)移動(dòng)網(wǎng)格計(jì)算獲得

表 1 城市擴(kuò)展驅(qū)動(dòng)因子Tab. 1 The driving factors of urban land

(9)

式中，R為中心單元的地形起伏度；H為網(wǎng)格內(nèi)的平均高程；ΔH為網(wǎng)格內(nèi)的高差；S為網(wǎng)格內(nèi)的平地面積；A為網(wǎng)格面積。

在輸入極限學(xué)習(xí)機(jī)之前，對(duì)上述驅(qū)動(dòng)因子進(jìn)行歸一化處理，以消除量綱的影響，同時(shí)也加快模型的訓(xùn)練速度。

2.3 模型訓(xùn)練與參數(shù)校準(zhǔn)

為了構(gòu)建ELM-CA模型，首先，基于歷史數(shù)據(jù)對(duì)極限學(xué)習(xí)機(jī)進(jìn)行訓(xùn)練，將2006—2010年期間轉(zhuǎn)變?yōu)槌鞘杏玫氐脑幋a為1，沒(méi)有發(fā)生轉(zhuǎn)變的元胞編碼為0，作為模型預(yù)測(cè)的目標(biāo)變量。其次，利用隨機(jī)分層采樣的方法，從轉(zhuǎn)變?yōu)槌鞘杏玫氐脑蜎](méi)有轉(zhuǎn)變?yōu)槌鞘杏玫氐脑须S機(jī)選擇20 000個(gè)元胞作為樣本，獲取這些樣本對(duì)應(yīng)的歸一化處理后的驅(qū)動(dòng)因子和目標(biāo)變量，由此構(gòu)成樣本數(shù)據(jù)集。然后，把樣本數(shù)據(jù)集分為訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)，比例約為7:3，訓(xùn)練數(shù)據(jù)用于訓(xùn)練模型獲取學(xué)習(xí)器參數(shù)，測(cè)試數(shù)據(jù)用于測(cè)試所訓(xùn)練的學(xué)習(xí)器的泛化能力。

極限學(xué)習(xí)機(jī)有兩個(gè)比較重要的參數(shù)。一個(gè)參數(shù)是隱藏層單元個(gè)數(shù)，該參數(shù)決定了學(xué)習(xí)器的復(fù)雜度，隱藏層單元個(gè)數(shù)越多，學(xué)習(xí)器的復(fù)雜度就越高，也就能更有效地捕捉數(shù)據(jù)所蘊(yùn)含的信息；但隱藏層單元數(shù)越多，就越容易受噪聲的影響，從而增加過(guò)擬合的風(fēng)險(xiǎn)。如圖 4所示，可以看出隨著隱藏層單元個(gè)數(shù)的增加，訓(xùn)練集和測(cè)試集的精度不斷增高，但增高的幅度越來(lái)越小，綜合考慮計(jì)算機(jī)運(yùn)算性能和試驗(yàn)精度，本文選取900作為隱藏層單元個(gè)數(shù)。另一個(gè)參數(shù)是極限學(xué)習(xí)機(jī)的正則化項(xiàng)系數(shù)λ，該參數(shù)可以降低模型的過(guò)擬合程度。但從圖 4中可以看出學(xué)習(xí)器并沒(méi)有發(fā)生過(guò)擬合，所以λ設(shè)置為0.000 1。本文選用的驅(qū)動(dòng)因子有12個(gè)，目標(biāo)變量是取值為0或1的二值變量，由此確定極限學(xué)習(xí)機(jī)的網(wǎng)絡(luò)結(jié)構(gòu)是輸入層為12個(gè)單元，隱藏層900個(gè)單元，輸出層1個(gè)單元，正則化系數(shù)λ設(shè)置為0.000 1。

圖 4 隱層單元個(gè)數(shù)與精度的關(guān)系Fig. 4 Relationship between number of hidden layer units and accuracy

作為對(duì)比，本文也用同一批數(shù)據(jù)對(duì)邏輯回歸和神經(jīng)網(wǎng)絡(luò)(單隱層)進(jìn)行訓(xùn)練。表 2是各學(xué)習(xí)器在訓(xùn)練集上耗費(fèi)的訓(xùn)練時(shí)間以及在測(cè)試集上的總體精度和AUC指標(biāo)。從訓(xùn)練時(shí)間可以看出邏輯回歸的平均用時(shí)最短，因?yàn)槠淠Ｐ偷膹?fù)雜度最低，而極限學(xué)習(xí)機(jī)的訓(xùn)練時(shí)間明顯低于同為單隱層的神經(jīng)網(wǎng)絡(luò)，體現(xiàn)了極限學(xué)習(xí)機(jī)在訓(xùn)練速度上的優(yōu)越性。從整體精度上來(lái)看，極限學(xué)習(xí)機(jī)也要好于邏輯回歸和神經(jīng)網(wǎng)絡(luò)。相比于邏輯回歸，極限學(xué)習(xí)機(jī)將輸入數(shù)據(jù)映射到高維特征空間中，解決了線(xiàn)性不可分的問(wèn)題，從而可以學(xué)習(xí)更復(fù)雜的函數(shù)，而邏輯回歸是線(xiàn)性分類(lèi)器，在面對(duì)復(fù)雜的數(shù)據(jù)關(guān)系時(shí)表現(xiàn)不好；相比于神經(jīng)網(wǎng)絡(luò)，極限學(xué)習(xí)機(jī)可以化簡(jiǎn)為求解一個(gè)線(xiàn)性系統(tǒng)，從而求出全局最優(yōu)唯一解，而神經(jīng)網(wǎng)絡(luò)是基于梯度下降算法迭代求解，不僅訓(xùn)練時(shí)間長(zhǎng)，而且可能陷入局部最優(yōu)解，要得出滿(mǎn)意的解需要做更多的嘗試。

表 2 極限學(xué)習(xí)機(jī)、邏輯回歸和神經(jīng)網(wǎng)絡(luò)的訓(xùn)練耗時(shí)及在測(cè)試集上的總體精度和AUC指標(biāo)Tab. 2 Extreme learning machine, logistic regression and neural network training time-consuming and overall accuracy and AUC indicators on test sets

參數(shù)	極限學(xué)習(xí)機(jī)	神經(jīng)網(wǎng)絡(luò)	邏輯回歸
訓(xùn)練耗時(shí)/s	376.8	1 168.4	254.5
總體精度	0.820 5	0.792 4	0.733 9
AUC	0.903 4	0.853 0	0.816 4

極限學(xué)習(xí)機(jī)、邏輯回歸和神經(jīng)網(wǎng)絡(luò)會(huì)為每個(gè)測(cè)試樣本產(chǎn)生一個(gè)實(shí)值概率預(yù)測(cè)，這個(gè)實(shí)值概率預(yù)測(cè)的好壞，直接決定了學(xué)習(xí)器的泛化性能，ROC曲線(xiàn)根據(jù)實(shí)值概率預(yù)測(cè)的結(jié)果，將測(cè)試樣本進(jìn)行排序，預(yù)測(cè)概率值最高的排在前面，概率值低的排在后面，排序本身質(zhì)量的好壞，體現(xiàn)了綜合考慮學(xué)習(xí)器在不同任務(wù)下“期望泛化性能”的好壞。AUC(area under ROC curve)是衡量不同學(xué)習(xí)器ROC曲線(xiàn)質(zhì)量的一個(gè)重要指標(biāo)，因此本文用AUC衡量不同學(xué)習(xí)器的泛化能力。圖 5即為不同學(xué)習(xí)器的ROC曲線(xiàn)及其對(duì)應(yīng)的AUC值，可以看出極限學(xué)習(xí)機(jī)的AUC指標(biāo)高于邏輯回歸和神經(jīng)網(wǎng)絡(luò)。

圖 5 極限學(xué)習(xí)機(jī)、邏輯回歸和神經(jīng)網(wǎng)絡(luò)在測(cè)試集上的ROC曲線(xiàn)及對(duì)應(yīng)的AUC指標(biāo)Fig. 5 Extreme learning machine, logistic regression and neural network ROC curves on test sets and corresponding AUC indicators

上述試驗(yàn)是在樣本較多的情況下進(jìn)行的，作為對(duì)比，采用小樣本數(shù)據(jù)(上述試驗(yàn)樣本數(shù)量的1/3)以和上述相同的方法進(jìn)行試驗(yàn)，試驗(yàn)結(jié)果表明極限學(xué)習(xí)機(jī)的測(cè)試精度為0.798 4，邏輯回歸為0.718 1，神經(jīng)網(wǎng)絡(luò)為0.720 4，說(shuō)明了極限學(xué)習(xí)機(jī)在小樣本的情況下仍然具有較高的精度，而神經(jīng)網(wǎng)絡(luò)的性能卻大幅下降，具體情況見(jiàn)表 3。

表 3 小樣本情況下不同學(xué)習(xí)器在測(cè)試集上的總體精度和AUC指標(biāo)Tab. 3 Overall accuracy and AUC indicators of different learners on the test set in small sample cases

參數(shù)	極限學(xué)習(xí)機(jī)	神經(jīng)網(wǎng)絡(luò)	邏輯回歸
總體精度	0.794 8	0.720 4	0.718 1
AUC	0.877 0	0.806 8	0.803 4

2.4 城市擴(kuò)展模擬與預(yù)測(cè)

使用ELM-CA做城市擴(kuò)展的模擬時(shí)，首先利用訓(xùn)練好的極限學(xué)習(xí)機(jī)學(xué)習(xí)器求出試驗(yàn)區(qū)每個(gè)元胞轉(zhuǎn)化潛力，在此基礎(chǔ)上根據(jù)式(6)計(jì)算出元胞受鄰域影響和隨機(jī)因素影響的綜合轉(zhuǎn)化概率，模擬以2006年遙感影像分類(lèi)數(shù)據(jù)作為初始狀態(tài)開(kāi)始循環(huán)迭代，每輪迭代中選取綜合概率最大的前若干個(gè)元胞轉(zhuǎn)化，每輪迭代后由于城市用地發(fā)生變化，需要重新計(jì)算鄰域影響。當(dāng)模型轉(zhuǎn)換量達(dá)到實(shí)際2006—2010年間的城市轉(zhuǎn)換總量時(shí)，則停止迭代，輸出結(jié)果見(jiàn)圖 6。

圖 6 2010年模擬城市空間分布圖與實(shí)際城市空間分布圖Fig. 6 Simulated urban spatial distribution map and actual urban spatial distribution map in 2010

作為檢驗(yàn)，根據(jù)從2006—2010年提取的轉(zhuǎn)換規(guī)則，以2006年作為起始年份，預(yù)測(cè)2010—2013年間的城市擴(kuò)展。當(dāng)模型轉(zhuǎn)換量達(dá)到實(shí)際2006—2013年間的城市轉(zhuǎn)換總量時(shí)，則停止迭代，輸出結(jié)果見(jiàn)圖 7。

圖 7 2013年模擬城市空間分布圖與實(shí)際城市空間分布圖Fig. 7 Simulated urban spatial distribution map and actual urban spatial distribution map in 2013

2.5 模型檢驗(yàn)與對(duì)比

城市擴(kuò)展模型檢驗(yàn)的方法有兩種，一種是逐點(diǎn)對(duì)比的方法，即將模擬的結(jié)果與實(shí)際的圖層疊加，逐點(diǎn)對(duì)比計(jì)算模擬的精度，假設(shè)2006年到2010年實(shí)際新增城市用地元胞個(gè)數(shù)為Q，模擬的新增城市元胞與實(shí)際新增城市元胞在空間上位置一致的元胞個(gè)數(shù)為S，即正確模擬元胞數(shù)為S，則精度P=S/Q，這里只討論城市的模擬精度；另一種是整體比較，即比較模擬結(jié)果的空間格局與實(shí)際的空間格局的符合程度，這里使用Kappa系數(shù)。

為了進(jìn)一步的驗(yàn)證模型，用邏輯回歸和神經(jīng)網(wǎng)絡(luò)模擬同一地區(qū)2006—2010年時(shí)間段的城市擴(kuò)展。將從遙感影像解譯得到的實(shí)際用地與極限學(xué)習(xí)機(jī)、邏輯回歸與神經(jīng)網(wǎng)絡(luò)的模擬結(jié)果進(jìn)行比較，得到混淆矩陣表 4，從表中可以看出，極限學(xué)習(xí)機(jī)模型的城市模擬精度70.30%，Kappa系數(shù)0.669 7，Logistic模型的城市模擬精度68.09%，Kappa系數(shù)0.645 0，神經(jīng)網(wǎng)絡(luò)模型的城市模擬精度68.76%，Kappa系數(shù)0.652 8。極限學(xué)習(xí)機(jī)模型相比于邏輯回歸和神經(jīng)網(wǎng)絡(luò)，城市模擬精度分別提高了2.21%和1.54%，說(shuō)明極限學(xué)習(xí)機(jī)模型有更好的精度，而Kappa系數(shù)分別提高了0.024 7和0.016 9，說(shuō)明ELM模型模擬結(jié)果與實(shí)際城市擁有更好的一致性。同時(shí)進(jìn)一步的比較了不同模型的FoM(Figure of Merit)系數(shù)，ELM模型的FoM系數(shù)為0.542 1，分別比Logistic(0.516 2)模型和神經(jīng)網(wǎng)絡(luò)(0.524 2)模型分別提高了0.025 9和0.017 9，說(shuō)明了ELM模型擁有更好的模擬能力。FoM系數(shù)的計(jì)算公式如下

表 4 極限學(xué)習(xí)機(jī)、邏輯回歸和神經(jīng)網(wǎng)絡(luò)模擬結(jié)果的混淆矩陣Tab. 4 Confusion matrix for extreme learning machine, logistic regression, and neural network simulation results

年份	參數(shù)	極限學(xué)習(xí)機(jī)			邏輯回歸			神經(jīng)網(wǎng)絡(luò)
年份	參數(shù)	非城市	城市	精度/(%)	非城市	城市	精度/(%)	非城市	城市	精度/(%)
2006—2010年	非城市	1 779 512	61 422	0.966 6	1 774 922	66 012	0.964 1	1 776 365	64 569	0.964 9
	城市	61 422	145 469	0.703 0	66 012	140 879	0.680 9	64 569	142 322	0.687 9
	總精度			0.940 0			0.935 5			0.936 9
	Kappa	0.669 7	0.645 0	0.652 8
	FoM	0.542 1	0.516 2	0.524 2
2006—2013年	非城市	1 549 767	114 270	0.931 0	1 542 497	121 540	0.926 9	1 544 856	119 181	0.928 3
	城市	114 270	269 519	0.702 0	121 540	262 249	0.683 3	119 181	264 608	0.689 4
	總精度			0.888 3			0.881 2			0.883 6
	Kappa	0.633 5	0.610 2	0.617 8
	FoM	0.541 1	0.518 9	0.526 0

(10)

式中，A為實(shí)際中發(fā)生轉(zhuǎn)化但模擬中沒(méi)發(fā)生轉(zhuǎn)化的錯(cuò)誤區(qū)域面積；B為實(shí)際中和模擬中都發(fā)生轉(zhuǎn)化的正確區(qū)域面積；C為實(shí)際中未發(fā)生轉(zhuǎn)化但模擬中發(fā)生轉(zhuǎn)化的錯(cuò)誤區(qū)域面積。

本文增加了2006—2013年時(shí)間段的城市擴(kuò)展預(yù)測(cè)，來(lái)檢驗(yàn)?zāi)Ｐ偷挠行?。根?jù)2006—2010年時(shí)間段提取的轉(zhuǎn)換規(guī)則，以2006年土地利用為初始狀態(tài)，預(yù)測(cè)2010—2013年城市擴(kuò)展，將預(yù)測(cè)結(jié)果與實(shí)際用地比較，得到混淆矩陣見(jiàn)表 4，極限學(xué)習(xí)機(jī)模型的城市預(yù)測(cè)精度分別高于邏輯回歸和神經(jīng)網(wǎng)絡(luò)模型1.87%和1.2%，Kappa系數(shù)分別高于邏輯回歸和神經(jīng)網(wǎng)絡(luò)模型0.023 3和0.015 9，F(xiàn)oM系數(shù)分別提高了0.022 2和0.015 7，證實(shí)了極限學(xué)習(xí)機(jī)模型的可靠性。

試驗(yàn)的結(jié)果與2.3節(jié)中的對(duì)學(xué)習(xí)器的精度評(píng)價(jià)一致。值得指出的是，本文在模擬城市擴(kuò)展過(guò)程中，每次迭代會(huì)選擇本輪中綜合轉(zhuǎn)化概率最高的前若干個(gè)元胞轉(zhuǎn)化為城市用地，因此，城市擴(kuò)展模擬結(jié)果的好壞高度依賴(lài)于學(xué)習(xí)器給出的預(yù)測(cè)概率的排序的好壞，在圖 5中可以看出極限學(xué)習(xí)機(jī)的ROC曲線(xiàn)的AUC值明顯高于邏輯回歸和神經(jīng)網(wǎng)絡(luò)，而模擬試驗(yàn)的結(jié)果也驗(yàn)證了這一觀點(diǎn)。

另外，本文也計(jì)算了實(shí)際結(jié)果與模擬結(jié)果的形態(tài)指數(shù)，以檢驗(yàn)?zāi)M結(jié)果與實(shí)際情況空間格局的一致性。本文采用Moran Ⅰ指數(shù)反映試驗(yàn)結(jié)果的空間聚集與分散程度，計(jì)算結(jié)果見(jiàn)表 5。從表中可以看出，極限學(xué)習(xí)機(jī)的試驗(yàn)結(jié)果的Moran Ⅰ指數(shù)較邏輯回歸和神經(jīng)網(wǎng)絡(luò)更接近于實(shí)際值，這說(shuō)明極限學(xué)習(xí)機(jī)模型模擬結(jié)果的空間格局都與實(shí)際情況比較接近。

表 5 Moran Ⅰ指數(shù)對(duì)比Tab. 5 Comparison of Moran Ⅰ index

年份	實(shí)際	極限學(xué)習(xí)機(jī)	邏輯回歸	神經(jīng)網(wǎng)絡(luò)
2010年	0.212	0.218	0.239	0.197
2013年	0.270	0.236	0.234	0.193

為了考察樣本數(shù)據(jù)量大小對(duì)模擬結(jié)果的影響，利用在2.3節(jié)中在小樣本情況下訓(xùn)練的不同模型，分別對(duì)2010年和2013年的城市用地進(jìn)行模擬和預(yù)測(cè)，試驗(yàn)結(jié)果見(jiàn)表 6。

表 6 小樣本情況下不同學(xué)習(xí)器的性能表現(xiàn)Tab. 6 Performance of different learners in small sample cases

2006—2010年	精度	0.686 4	0.627 9	0.627 0
	Kappa	0.651 1	0.586 1	0.585 1
	FoM	0.522 5	0.457 6	0.456 6
2006—2013年	精度	0.684 5	0.628 7	0.603 5
	Kappa	0.611 8	0.543 1	0.513 0
	FoM	0.520 4	0.458 5	0.432 1

在2006—2010年的城市擴(kuò)張模擬中，小樣本相比于大樣本的情況下，極限學(xué)習(xí)機(jī)模擬精度、Kappa系數(shù)和FoM系數(shù)分別下降了1.6%、0.018 6、0.001 6，而邏輯回歸和神經(jīng)網(wǎng)絡(luò)分別下降了5.3%、0.058 9、0.058 6和6.09%、0.067 7、0.067 6(表 4、6)。

在2006—2013年的城市擴(kuò)張預(yù)測(cè)中，極限學(xué)習(xí)機(jī)的預(yù)測(cè)精度、Kappa系數(shù)和FoM系數(shù)分別下降了1.75%、0.021 7、0.020 7，而邏輯回歸和神經(jīng)網(wǎng)絡(luò)分別下降了5.46%、0.067 1、0.060 4和8.5%、0.104 8、0.093 9(表 4、6)。

可以看出，樣本數(shù)據(jù)量的大小對(duì)極限學(xué)習(xí)機(jī)的影響較小，邏輯回歸次之，對(duì)神經(jīng)網(wǎng)絡(luò)的影響最大。因?yàn)樯窠?jīng)網(wǎng)絡(luò)的模型較為復(fù)雜，在數(shù)據(jù)量較少時(shí)容易發(fā)生過(guò)擬合，需要正則化機(jī)制來(lái)防止過(guò)擬合，而極限學(xué)習(xí)機(jī)算法內(nèi)嵌良好的正則化機(jī)制，在樣本較少時(shí)仍可以較好地工作。極限學(xué)習(xí)機(jī)的這一特點(diǎn)使其在樣本較少或樣本獲取困難的情況下，仍然可以獲取相對(duì)較高的模擬精度。

3 結(jié)論與討論

(1) 本文提出的基于極限學(xué)習(xí)機(jī)的城市擴(kuò)展元胞自動(dòng)機(jī)模型(ELM-CA)，有效地簡(jiǎn)化了CA模型的復(fù)雜度，極限學(xué)習(xí)機(jī)通過(guò)歷史數(shù)據(jù)訓(xùn)練得到CA的轉(zhuǎn)化規(guī)則，減少了人為主觀因素的影響，適合復(fù)雜的土地利用變化模擬，能夠模擬出復(fù)雜的城市空間形態(tài)及其變化。

(2) 本文模型充分考慮了不同土地利用類(lèi)型轉(zhuǎn)換為城市用地的差異和強(qiáng)度，分別求出耕地、林地、水域三種主要用地類(lèi)型所對(duì)應(yīng)的轉(zhuǎn)換參數(shù)，在獲取中心元胞城市化潛力的時(shí)候，就用中心元胞用地類(lèi)型對(duì)應(yīng)的轉(zhuǎn)換參數(shù)，這樣就減小了用地類(lèi)型的不同所帶來(lái)的影響。

(3) 對(duì)比試驗(yàn)分析表明，ELM-CA模型的城市模擬精度和預(yù)測(cè)精度均高于邏輯回歸和神經(jīng)網(wǎng)絡(luò)，能有效模擬與預(yù)測(cè)城市擴(kuò)展的空間形態(tài)及其變化，而且ELM模型的訓(xùn)練時(shí)間僅為神經(jīng)網(wǎng)絡(luò)的1/3左右，體現(xiàn)了ELM學(xué)習(xí)速度快的優(yōu)勢(shì)。

(4) 對(duì)比大樣本和小樣本情況下不同學(xué)習(xí)器的性能表明：在小樣本情況下，邏輯回歸和神經(jīng)網(wǎng)絡(luò)的性能受到較大的影響，而極限學(xué)習(xí)機(jī)仍能保持較為良好的性能，使其在樣本難以獲取的情況下具有明顯優(yōu)勢(shì)。

(5) 本文模擬過(guò)程分為兩個(gè)階段，第一階段通過(guò)學(xué)習(xí)器對(duì)采樣數(shù)據(jù)進(jìn)行學(xué)習(xí)，獲取驅(qū)動(dòng)因子與城市發(fā)展?jié)摬氐膹?fù)雜關(guān)系，第二階段利用訓(xùn)練好的學(xué)習(xí)器進(jìn)行城市擴(kuò)張模擬與預(yù)測(cè)。不難發(fā)現(xiàn)，雖然在第一階段的樣本數(shù)據(jù)學(xué)習(xí)中，極限學(xué)習(xí)機(jī)的性能表現(xiàn)明顯好于邏輯回歸和神經(jīng)網(wǎng)絡(luò)，但在第二階段的城市擴(kuò)張模擬與預(yù)測(cè)中，極限學(xué)習(xí)機(jī)的試驗(yàn)結(jié)果相對(duì)于邏輯回歸和神經(jīng)網(wǎng)絡(luò)提高的并不顯著。其中一個(gè)重要原因是，在第一階段中，利用學(xué)習(xí)器對(duì)采樣數(shù)據(jù)進(jìn)行學(xué)習(xí)的時(shí)候并沒(méi)有將空間關(guān)系考慮在內(nèi)，而僅是在第二階段的模擬與預(yù)測(cè)中，通過(guò)式(6)將空間相關(guān)性納入模型中，這樣會(huì)導(dǎo)致學(xué)習(xí)器并沒(méi)有學(xué)習(xí)到樣本數(shù)據(jù)中所蘊(yùn)含的空間關(guān)系，而空間相關(guān)性在城市擴(kuò)張中具有重要的影響，從而使得學(xué)習(xí)器在城市空間分布模擬與預(yù)測(cè)的表現(xiàn)有一定的折扣。所以在后續(xù)的研究中，將進(jìn)一步試驗(yàn)直接利用學(xué)習(xí)器學(xué)習(xí)樣本數(shù)據(jù)的空間相關(guān)性，以期使得試驗(yàn)方法更為科學(xué)，減少主觀因素的影響。

【引文格式】王鶴, 曾永年. 城市擴(kuò)展極限學(xué)習(xí)機(jī)模型. 測(cè)繪學(xué)報(bào)，2018，47(12)：1680-1690. DOI: 10.11947/j.AGCS.2018.20170586

精

彩

回

顧

權(quán)威 | 專(zhuān)業(yè) | 學(xué)術(shù) | 前沿

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶(hù)發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買(mǎi)等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來(lái)自：昵稱(chēng)16619343 > 《科學(xué)技術(shù)》

舉報(bào)/認(rèn)領(lǐng)