电竞比分网-中国电竞赛事及体育赛事平台

分享

杭州常住人口究竟有多少?

 公司總裁 2019-05-12

杭州常住人口究竟有多少?

——基于時空大數(shù)據(jù)測算結(jié)果的比較與討論

作者:岳雨峰 闞長城 王海任 鈕心毅

本報(bào)告由百度地圖慧眼與同濟(jì)大學(xué)建筑與城市規(guī)劃學(xué)院空間分析和決策支持實(shí)驗(yàn)室聯(lián)合研究發(fā)布,合作雙方發(fā)揮各自在時空大數(shù)據(jù)分析研究領(lǐng)域的資源、技術(shù)優(yōu)勢,形成一系列在城鄉(xiāng)規(guī)劃行業(yè)中具有前瞻性的研究成果,并不斷促進(jìn)研究成果的轉(zhuǎn)化與應(yīng)用。雙方協(xié)作研究的領(lǐng)域涵蓋城鎮(zhèn)化發(fā)展動態(tài)監(jiān)測與預(yù)測、城市空間分析評估與模擬、城市空間決策支持與咨詢、人工智能與城市智慧管理、空間規(guī)劃新技術(shù)創(chuàng)新等。

文章來源于筆者在運(yùn)用時空大數(shù)據(jù)測算杭州市常住人口中所發(fā)現(xiàn)異常結(jié)果,以百度慧眼數(shù)據(jù)、手機(jī)信令數(shù)據(jù)兩組獨(dú)立數(shù)據(jù)源,通過對兩組數(shù)據(jù)源結(jié)果的自我檢驗(yàn)與比較,討論了基于時空大數(shù)據(jù)測算所獲得的2017年末至2018年初杭州市常住人口規(guī)模總量的可靠性。本文分享了運(yùn)用時空大數(shù)據(jù)進(jìn)行城市常住人口測算與數(shù)據(jù)結(jié)果檢驗(yàn)中的相關(guān)注意要點(diǎn),并探討了依托時空大數(shù)據(jù)測算城市常住人口的實(shí)用價值。認(rèn)為將針對城市人口的大數(shù)據(jù)測算方法作為一種輔助傳統(tǒng)調(diào)查統(tǒng)計(jì)方法的監(jiān)測工具具有不可忽視的現(xiàn)實(shí)意義。百度慧眼數(shù)據(jù)在監(jiān)測城市人口變化趨勢方面,具有監(jiān)測數(shù)據(jù)周期長、計(jì)算分析高效、空間統(tǒng)計(jì)單元可變等特點(diǎn)。

基于時空大數(shù)據(jù)測算結(jié)果的困惑——

常住人口測算結(jié)果遠(yuǎn)超統(tǒng)計(jì)局公布統(tǒng)計(jì)數(shù)據(jù)

1

基于百度慧眼數(shù)據(jù)的原始常住人口識別數(shù)與識別率計(jì)算

百度慧眼基于百度地圖開放平臺的去隱私化定位數(shù)據(jù),經(jīng)過脫敏和清洗處理,利用空間聚類算法對移動設(shè)備半年的定位信息進(jìn)行聚類。整合定位簇和POI屬性等信息,提取定位屬性、時間分布、用戶畫像、位置屬性以及WIFI屬性超過60多項(xiàng)特征,利用深度學(xué)習(xí)技術(shù)挖掘得到精度高、覆蓋廣、動態(tài)更新的設(shè)備常駐點(diǎn)信息,推算為杭州市原始用戶設(shè)備識別數(shù),也即百度慧眼直接識別的用戶數(shù)。為了便于原始設(shè)備識別數(shù)與統(tǒng)計(jì)部門統(tǒng)計(jì)數(shù)據(jù)中常住人口規(guī)模的比較,筆者將原始設(shè)備數(shù)識別數(shù)定義為原始常住人口識別人數(shù)(見圖1.)。

在檢驗(yàn)百度慧眼數(shù)據(jù)原始常住人口統(tǒng)計(jì)結(jié)果的可靠性檢驗(yàn)中,筆者參考了杭州市統(tǒng)計(jì)局于2018年2月5日發(fā)布的《2017年末杭州市常住人口情況簡析》報(bào)告內(nèi)的各區(qū)、縣(市)常住人口一覽表。以統(tǒng)計(jì)部門所發(fā)布數(shù)據(jù)報(bào)告為基礎(chǔ),分析百度慧眼數(shù)據(jù)所識別原始常住人口數(shù)在統(tǒng)計(jì)公布的常住人口中的占比情況,即“百度慧眼數(shù)據(jù)的原始常住人口識別率”(見表1.)。

注:杭州市統(tǒng)計(jì)局所發(fā)布的“2017年末各區(qū)、縣(市)常住人口一覽表”中涉及“杭州經(jīng)濟(jì)技術(shù)開發(fā)區(qū)”、“西湖風(fēng)景名勝區(qū)”、“大江東產(chǎn)業(yè)集聚區(qū)”的常住人口均已納入各行政區(qū)人口中。(數(shù)據(jù)來源:杭州統(tǒng)計(jì)局,http://tjj./content-getOuterNewsDetail.actionnewsMainSearch.id=78333538-6229-11e8-97a6-d89d676397bf)

2

原始常住人口識別率的空間差異特征與杭州城市發(fā)展的空間圈層結(jié)構(gòu)相當(dāng)

由表1.可知,杭州市統(tǒng)計(jì)局公布2017年末常住人口為946.8萬人,而基于2018年上半年百度慧眼所識別出常住地在杭州市的用戶數(shù)為877.56萬人,若以統(tǒng)計(jì)常住人口計(jì)算,基于百度地圖慧眼的原始常住人口識別率為93%。其中余杭區(qū)(126%)、濱江區(qū)(111%)、蕭山區(qū)(104%)、江干區(qū)(104%)均遠(yuǎn)超常住人口識別率的平均值。顯著相反的情況則發(fā)生在淳安縣(54%)、建德市(61%)、臨安區(qū)(62%)等區(qū)縣中,其常住人口識別率均遠(yuǎn)小于均值。同時,處于老城區(qū)的上城區(qū)(74%)、下城區(qū)(74%),與處于城市郊區(qū)的富陽區(qū)(77%)、桐廬縣(73%)均呈現(xiàn)相近的原始常駐人口識別率特征。

上述的識別率差異特征可以結(jié)合杭州市區(qū)縣的空間區(qū)位特征簡單歸納為三種類型,其一便是處于城市中心區(qū)邊緣地帶的余杭、濱江、蕭山、江干四區(qū),百度慧眼數(shù)據(jù)識別率遠(yuǎn)高于均值;其二是處于城市遠(yuǎn)郊地帶的淳安、建德、臨安三區(qū)縣,百度慧眼數(shù)據(jù)識別率遠(yuǎn)低于均值;其三是處于城市中心區(qū)或城市近郊區(qū)的上城、下城、富陽、桐廬四區(qū)縣,百度慧眼數(shù)據(jù)識別率結(jié)果較為相近。由此可知,2018年上半年百度慧眼數(shù)據(jù)所識別原始常住人口與杭州市統(tǒng)計(jì)部門公布的2017年末常住人口數(shù)據(jù)的常住人口識別率呈現(xiàn)空間區(qū)位上的極大差異,并且識別率的空間差異性特征與杭州市的城市發(fā)展圈層結(jié)構(gòu)相當(dāng)(見圖2.)。

3

剔除數(shù)據(jù)自身的質(zhì)量與計(jì)算問題,提出統(tǒng)計(jì)公布常住人口失真的猜想

基于筆者運(yùn)用相關(guān)時空大數(shù)據(jù)方法進(jìn)行城市人口規(guī)模測算的早前經(jīng)驗(yàn),時空大數(shù)據(jù)識別常住人口的計(jì)算結(jié)果通常會出現(xiàn)識別率略偏高現(xiàn)象,這一現(xiàn)象往往受到手機(jī)用戶的使用特點(diǎn)影響,即存在一人多賬戶,多設(shè)備更換使用的客觀情況,導(dǎo)致了一個自然人的時空軌跡被重復(fù)計(jì)算識別的可能性大增。百度慧眼較早認(rèn)識到了這一問題,基于這一用戶使用特征,利用百度IDMapping與深度學(xué)習(xí)技術(shù)對百度全網(wǎng)用戶設(shè)備和賬號信息進(jìn)行打通,以此過濾一人多設(shè)備、多賬戶的使用習(xí)慣而可能導(dǎo)致的用戶識別量偏高現(xiàn)象。

更為重要的是,百度地圖開放平臺開發(fā)者市場份額達(dá)到75%,除百度系的App外,相當(dāng)規(guī)模的手機(jī)系統(tǒng)和手機(jī)App均使用百度定位服務(wù),百度慧眼數(shù)據(jù)覆蓋用戶覆蓋率非常高,應(yīng)當(dāng)能夠更全面地覆蓋各年齡、各階層用戶。一般情況下,在杭州中心城區(qū)(上城區(qū)、下城區(qū))與城市遠(yuǎn)郊區(qū)縣(淳安縣、建德市、臨安區(qū))的常住人口識別率不應(yīng)當(dāng)遠(yuǎn)低于城市中心城區(qū)邊緣區(qū)(余杭區(qū)、濱江區(qū)、蕭山區(qū)、江干區(qū))的常住人口識別率。

因此,在反復(fù)檢驗(yàn)百度慧眼數(shù)據(jù)質(zhì)量的基礎(chǔ)上,初步推測杭州市各區(qū)實(shí)際常住人口總量、空間分布已經(jīng)發(fā)生了較大變化。這一變化導(dǎo)致了百度慧眼所識別常住人口總量在部分區(qū)縣激增或驟減的計(jì)算結(jié)果,同時也意味著統(tǒng)計(jì)公布的杭州常住人口數(shù)可能已經(jīng)失真。

針對時空大數(shù)據(jù)的自我檢驗(yàn)與討論——

常住人口年齡結(jié)構(gòu)的空間分布特征解讀識別率結(jié)果

1

處于中青年就業(yè)年齡段、及非就業(yè)年齡段常住人口的空間特征

為了驗(yàn)證對杭州市各區(qū)實(shí)際常住人口總量變化推測的成立,筆者運(yùn)用百度基于全網(wǎng)用戶去隱私化數(shù)據(jù),利用深度學(xué)習(xí)技術(shù)挖掘得到的用戶畫像功能,測算了杭州市常住居民在不同年齡段內(nèi)的各區(qū)空間分布情況(見圖3.& 圖4.)。

以杭州市市域范圍為研究對象,通過杭州市域范圍內(nèi)各鎮(zhèn)、街道統(tǒng)計(jì)單元中18至35周歲常住居民的空間分布情況可以初步判斷,濱江區(qū)、蕭山區(qū)、江干區(qū)、余杭區(qū)四區(qū)的中青年就業(yè)年齡段的人口占比最高,大致處于60%-75%區(qū)間內(nèi)。這意味著以上四區(qū)內(nèi)常住居民的年齡結(jié)構(gòu)構(gòu)成呈現(xiàn)極不均衡特征,即中青年就業(yè)年齡段人群存在空間上明顯聚集現(xiàn)象,并且這一占比遠(yuǎn)高于一般城市內(nèi)中青年就業(yè)年齡段人群的人口占比。相對地,通過杭州市域范圍內(nèi)各鎮(zhèn)、街道統(tǒng)計(jì)單元中18周歲以下、65周歲以上常住居民的空間分布情況可以初步判斷,濱江區(qū)、蕭山區(qū)、江干區(qū)、余杭區(qū)、拱墅區(qū)五區(qū)內(nèi)非就業(yè)年齡段的人口占比最低。而位于杭州市遠(yuǎn)郊的臨安區(qū)、富陽區(qū)、桐廬縣、淳安縣、建德市等區(qū)縣內(nèi)非就業(yè)年齡段的人口占比較高。

這表明了在杭州市域內(nèi),濱江區(qū)、蕭山區(qū)、江干區(qū)、余杭區(qū)四區(qū)出現(xiàn)了中青年人口占比明顯過高的現(xiàn)象,其余區(qū)縣中青年人口占比趨近正常的現(xiàn)象。

2

針對中青年就業(yè)年齡段常住人口占比較大的現(xiàn)象解釋識別率異?,F(xiàn)象

通常情況下,18至35周歲城市常住人口屬于中青年就業(yè)年齡段,往往是城市中最為活躍的勞動力群體,城市外來務(wù)工人員更以該年齡段人群為主體構(gòu)成。特大城市發(fā)展的一般規(guī)律表明,中心城區(qū)邊緣區(qū)(近郊區(qū))是吸引外來就業(yè)人員的首要區(qū)域。這一圈層區(qū)域一般集中了城市主要的工業(yè)制造業(yè),是吸引外來務(wù)工人員的主要就業(yè)影響因素。同時,以外來務(wù)工人員為主的常住人口主要選擇中心城區(qū)邊緣區(qū)居住,這一圈層區(qū)域既保障了鄰近就業(yè)崗位的短距離通勤需要,又具有相對中心城區(qū)較低房租、房價的住房選擇優(yōu)勢。

筆者認(rèn)為,百度慧眼數(shù)據(jù)所揭示的中青年就業(yè)年齡段勞動力人口的空間集聚現(xiàn)象恰恰符合特大城市邊緣區(qū)發(fā)展的一般規(guī)律。以18至35周歲外來務(wù)工人員為主的外來常住就業(yè)人口在濱江區(qū)、蕭山區(qū)、江干區(qū)、余杭區(qū)四區(qū)的迅速集聚,導(dǎo)致了實(shí)際常住人口的快速增長,因?yàn)樵?018年上半年百度慧眼數(shù)據(jù)的常住人口規(guī)模識別中產(chǎn)生了遠(yuǎn)超預(yù)期的測算結(jié)果。

誠然,針對百度慧眼數(shù)據(jù)高識別率現(xiàn)象的成因還存在另一種解釋途徑,即杭州市中心城區(qū)、中心城區(qū)邊緣區(qū)、城市遠(yuǎn)郊區(qū)等不同圈層區(qū)域內(nèi)的常住居民具有顯著不同的手機(jī)移動設(shè)備使用特征。杭州市中心城區(qū)邊緣區(qū)常住居民存在極高比例的一人多設(shè)備現(xiàn)象,且百度慧眼目前的一人多設(shè)備優(yōu)化算法僅僅對中心城區(qū)與城市遠(yuǎn)郊區(qū)常住居民有效,卻對中心城區(qū)邊緣區(qū)常住居民無效。

筆者相信前述的簡單解釋邏輯,以中青年為主體的外來常住人口在濱江區(qū)、蕭山區(qū)、江干區(qū)、余杭區(qū)等中心城區(qū)邊緣、近郊區(qū)集聚,導(dǎo)致濱江區(qū)、蕭山區(qū)、江干區(qū)、余杭區(qū)等區(qū)的實(shí)際常住人口遠(yuǎn)大于統(tǒng)計(jì)公布數(shù)據(jù);當(dāng)我們?nèi)匀灰越y(tǒng)計(jì)公布數(shù)據(jù)為分母計(jì)算識別率時,自然會出現(xiàn)識別率過高,甚至大于100%的異常結(jié)果。因此可以通過計(jì)算中青年就業(yè)年齡段常住居民的空間分布特征,推算2018年上半年杭州市的實(shí)際常住人口規(guī)模應(yīng)當(dāng)遠(yuǎn)高于統(tǒng)計(jì)部門公布的數(shù)據(jù)結(jié)果。

3

百度慧眼數(shù)據(jù)擴(kuò)樣后常住人口與公布統(tǒng)計(jì)數(shù)據(jù)結(jié)果的橫向比較

基于百度原始設(shè)備數(shù)擴(kuò)樣后的2018年杭州市常住人口規(guī)模推測值為1269.2萬(見表2.)。通過對百度慧眼數(shù)據(jù)針對杭州常住人口的擴(kuò)樣估算值與杭州市統(tǒng)計(jì)局發(fā)布的常住人口調(diào)查值之間的橫向比較,不難發(fā)現(xiàn)在中心城區(qū)的上城區(qū)、下城區(qū)及城市遠(yuǎn)郊的富陽區(qū)、臨安區(qū)、桐廬縣、淳安縣、建德市等區(qū)縣內(nèi),大數(shù)據(jù)所識別推算的常住人口與統(tǒng)計(jì)公布的常住人口結(jié)果較為接近。在上述兩類城市圈層區(qū)域內(nèi),百度慧眼數(shù)據(jù)與統(tǒng)計(jì)公布數(shù)據(jù)提供了相近的常住人口結(jié)果,可以初步判斷在該區(qū)域內(nèi)常住人口數(shù)沒有發(fā)生大規(guī)模的變動,統(tǒng)計(jì)部門公布的常住人口數(shù)應(yīng)當(dāng)具有更高的可信度。

然而,在蕭山區(qū)、余杭區(qū)、江干區(qū)、濱江區(qū)、西湖區(qū)、拱墅區(qū)等杭州中心城區(qū)邊緣區(qū)內(nèi),百度慧眼大數(shù)據(jù)得出了遠(yuǎn)遠(yuǎn)高于傳統(tǒng)統(tǒng)計(jì)調(diào)查結(jié)果的常住人口規(guī)模。這表明了表2中至少有一組常住人口數(shù)據(jù)有誤。結(jié)合前述針對中青年就業(yè)年齡段人口空間分布的檢驗(yàn),筆者相信百度慧眼數(shù)據(jù)所測算的蕭山區(qū)、余杭區(qū)、江干區(qū)、濱江區(qū)、西湖區(qū)、拱墅區(qū)等區(qū)常住人口具有相對更高的可信度。

表2-百度慧眼測算2018年杭州全年常住人口規(guī)模

由此推算杭州市2017年末至2018年初的實(shí)際常住人口規(guī)模總量應(yīng)當(dāng)遠(yuǎn)高于統(tǒng)計(jì)部門得出的946.8萬人,杭州市統(tǒng)計(jì)局所公布部分區(qū)縣人口數(shù)量已經(jīng)失真,導(dǎo)致全市人口總數(shù)低于實(shí)際值。

當(dāng)然僅僅依托單一數(shù)據(jù)源解釋百度慧眼數(shù)據(jù)自身的計(jì)算結(jié)果尚不足為憑,還需其他來源的時空大數(shù)據(jù),通過另一套獨(dú)立邏輯測算杭州全市常住人口的結(jié)果進(jìn)行比較論證。

手機(jī)信令數(shù)據(jù)與百度大數(shù)據(jù)計(jì)算結(jié)果相佐證

1

手機(jī)信令數(shù)據(jù)同樣驗(yàn)證了百度慧眼數(shù)據(jù)對杭州市人口增長趨勢的判斷

為了論證百度地圖慧眼時空大數(shù)據(jù)對杭州常住人口所作的測算,筆者同時采用浙江移動所提供的2017年4月整月的手機(jī)信令時空大數(shù)據(jù)進(jìn)行杭州常住人口的測算。針對手機(jī)信令數(shù)據(jù)采用時間累計(jì)計(jì)算法,在剔除物聯(lián)網(wǎng)卡后,從移動時空定位數(shù)據(jù)中識別出手機(jī)用戶的居住地。按照手機(jī)用戶60%以上日期居住地在同一城市的標(biāo)準(zhǔn),推算為杭州市常住手機(jī)用戶。

通過百度慧眼數(shù)據(jù)、手機(jī)信令數(shù)據(jù)、傳統(tǒng)調(diào)查數(shù)據(jù)結(jié)果的橫向比較,可以初步判斷,基于百度地圖慧眼大數(shù)據(jù)所識別的杭州常住人口與基于手機(jī)信令數(shù)據(jù)所識別的杭州常住人口在各區(qū)空間統(tǒng)計(jì)單元上呈現(xiàn)較為相似的特征(見表3.)。其中,在中心城區(qū)的上城區(qū)、下城區(qū),城市遠(yuǎn)郊區(qū)的富陽區(qū)、臨安區(qū)、桐廬縣內(nèi),三組數(shù)據(jù)的校核結(jié)果較理想。在城市遠(yuǎn)郊區(qū)的淳安縣、建德市內(nèi),兩種大數(shù)據(jù)測算結(jié)果較一致,但略小于統(tǒng)計(jì)公布數(shù)據(jù)。

但在中心城區(qū)邊緣區(qū)的江干區(qū)、拱墅區(qū)、西湖區(qū)、濱江區(qū)、蕭山區(qū)、余杭區(qū)內(nèi),百度慧眼數(shù)據(jù)、手機(jī)信令數(shù)據(jù)所識別常住人口具有較高的一致性,且遠(yuǎn)高于統(tǒng)計(jì)公布人口數(shù)據(jù)。以杭州市主城區(qū)的九區(qū)為研究對象,同樣計(jì)算百度慧眼大數(shù)據(jù)相較于統(tǒng)計(jì)公布常住人口的各區(qū)識別率(見圖5.),可以直接地判斷百度慧眼數(shù)據(jù)與手機(jī)信令數(shù)據(jù)的常住人口識別率在空間分布上呈現(xiàn)相似特征(見圖6.)。這再一次證明了統(tǒng)計(jì)公布數(shù)據(jù)在以上幾個區(qū)縣的人口測算數(shù)存在失真的可能,杭州的城市外來常住人口已經(jīng)在中心城區(qū)外圍地域大量增加的假設(shè)應(yīng)當(dāng)成立。

表3 - 傳統(tǒng)調(diào)查數(shù)據(jù)、手機(jī)信令數(shù)據(jù)、百度慧眼時空大數(shù)據(jù)所識別常住人口匯總

2

利用合計(jì)百分比比較三組數(shù)據(jù)源所識別常住人口數(shù)在空間統(tǒng)計(jì)單元上的占比特征,百度慧眼數(shù)據(jù)與手機(jī)信令數(shù)據(jù)在各統(tǒng)計(jì)單元內(nèi)具有更高的一致性。

為了能夠橫向比較公布統(tǒng)計(jì)數(shù)據(jù)、百度慧眼數(shù)據(jù)、手機(jī)信令數(shù)據(jù)所識別常住人口在空間分布上的規(guī)模差異,筆者通過三組數(shù)據(jù)源各自的合計(jì)百分比進(jìn)行差異比較。其反映了公布統(tǒng)計(jì)常住人口數(shù)(紅色)、百度數(shù)據(jù)所識別常住人口數(shù)(深藍(lán))、手機(jī)信令數(shù)據(jù)所識別常住人口數(shù)(淺藍(lán))在區(qū)縣統(tǒng)計(jì)單元層面的構(gòu)成比特征(見圖7.)。以蕭山區(qū)、余杭區(qū)、江干區(qū)三個中心城區(qū)外圍區(qū)縣為例,百度數(shù)據(jù)與手機(jī)信令數(shù)據(jù)所識別常住人口在總?cè)丝谥械恼急蕊@著高于統(tǒng)計(jì)常住人口數(shù)量在總?cè)丝谥械恼急?。而以建德市、淳安縣、桐廬縣三個城市遠(yuǎn)郊區(qū)縣為例,百度數(shù)據(jù)與手機(jī)信令數(shù)據(jù)所識別常住人口在總?cè)丝谥械恼急蕊@著低于統(tǒng)計(jì)常住人口數(shù)量在總?cè)丝谥械恼急?。百度慧眼?shù)據(jù)與手機(jī)信令數(shù)據(jù)從常住人口識別總數(shù)、常住人口識別率、常住人口數(shù)合計(jì)百分比三個指標(biāo)看,均具有更加相似的數(shù)據(jù)特征。

總體而言,百度慧眼大數(shù)據(jù)、手機(jī)信令數(shù)據(jù)針對杭州市常住人口規(guī)模所做的測算具有較高的一致性,印證了在城市外來人口迅速增加的快速發(fā)展階段,傳統(tǒng)人口調(diào)查方法在測算城市常住人口規(guī)模中的局限性。結(jié)合百度慧眼數(shù)據(jù)、手機(jī)信令數(shù)據(jù)對杭州市常住人口的測算結(jié)果,筆者認(rèn)為2017年末杭州市實(shí)際常住人口規(guī)模已經(jīng)遠(yuǎn)超公布統(tǒng)計(jì)所示的946.8萬人。這是外來常住人口快速增加導(dǎo)致的。

3

杭州城市人口規(guī)模的快速增長現(xiàn)象恰如2010年前上海城市人口規(guī)模激增現(xiàn)象的重現(xiàn)

表4.記錄了2010、2011兩個年度上海統(tǒng)計(jì)年鑒對2009年末全市常住人口的統(tǒng)計(jì)數(shù)據(jù)。第六次全國人口普查前的上海2010年統(tǒng)計(jì)年鑒中針對2009年末的全市常住人口公布數(shù)為1921.32萬人,其中外來人口541.93萬人。經(jīng)過“六普”調(diào)查數(shù)據(jù)校正后的上海2011年統(tǒng)計(jì)年鑒中,2009年末的常住人口公布數(shù)修正為2210.28萬人。同一年常住人口統(tǒng)計(jì)結(jié)果經(jīng)過人口普查校正后,增加了288.96萬人。尤其值得注意,兩份公布統(tǒng)計(jì)數(shù)據(jù)所記錄的2009年末戶籍人口僅增加了11.31萬人,而外來常住人口增加了277.65萬人。

由此不難發(fā)現(xiàn),2010年以前上海外來就業(yè)人口的激增現(xiàn)象,導(dǎo)致了2010年統(tǒng)計(jì)年鑒中公布統(tǒng)計(jì)數(shù)據(jù)的相對失真情況。在特大城市快速城市化階段,外來常住人口的快速增長與空間集聚現(xiàn)象有史可循,筆者相信十年前發(fā)生在上海常住人口測算中的統(tǒng)計(jì)失真現(xiàn)象也發(fā)生在了當(dāng)前的杭州市,故此造成了基于時空大數(shù)據(jù)所測算的杭州常住人口發(fā)生了遠(yuǎn)超預(yù)期的超高識別率現(xiàn)象。

(數(shù)據(jù)來源:上海統(tǒng)計(jì)局,http://www./)

結(jié)論

通過基于兩種時空大數(shù)據(jù)測算結(jié)果驗(yàn)證,及其與對杭州統(tǒng)計(jì)公布常住人口數(shù)量的比較,筆者認(rèn)為:

(1)針對常住人口大數(shù)據(jù)計(jì)算結(jié)果的檢驗(yàn)不可或缺。運(yùn)用時空大數(shù)據(jù)調(diào)查城市常住人口的方法仍需不斷地進(jìn)行算法優(yōu)化與實(shí)際檢驗(yàn),尤其是使用時空大數(shù)據(jù)所進(jìn)行的數(shù)據(jù)統(tǒng)計(jì)計(jì)算需要時刻牢記數(shù)據(jù)“檢驗(yàn)”的思想。例如在針對杭州城市人口的研究中,基于百度慧眼數(shù)據(jù)的原始常住人口識別率約為93%,雖然無法排除普遍存在的一人多設(shè)備、多賬戶、頻繁更換設(shè)備的移動設(shè)備使用特點(diǎn),但這些特點(diǎn)顯然不夠解釋時空大數(shù)據(jù)所識別常住人口的高識別率現(xiàn)象。因此需要遵循數(shù)據(jù)檢驗(yàn)的思路,依托數(shù)據(jù)可視化的方法,結(jié)合城市發(fā)展與人口集聚的一般規(guī)律,剖析大數(shù)據(jù)常住人口識別率的空間分布特征,反復(fù)篩查大數(shù)據(jù)計(jì)算結(jié)果超出預(yù)期的原因。

(2)運(yùn)用時空大數(shù)據(jù)進(jìn)行城市常住人口測算時,相比關(guān)注大數(shù)據(jù)計(jì)算結(jié)果的絕對數(shù),更應(yīng)該關(guān)注大數(shù)據(jù)計(jì)算結(jié)果所反映的人口變化趨勢。以杭州常住人口測算為例,百度慧眼數(shù)據(jù)、手機(jī)信令數(shù)據(jù)兩組數(shù)據(jù)所測算的杭州城常住人口在空間分布存在相似的識別率特征。從城市圈層劃分視角看,兩種數(shù)據(jù)源的計(jì)算結(jié)果在杭州中心城區(qū)的核心圈層與城市遠(yuǎn)郊區(qū)的外圍圈層識別率普遍較低,而在城市中心邊緣區(qū)的中間圈層顯示遠(yuǎn)超正?,F(xiàn)象的高識別率特征。兩組獨(dú)立數(shù)據(jù)源確定無疑地揭示了實(shí)際常住人口在中間圈層區(qū)域所發(fā)生的顯著增長趨勢。相比常住人口的絕對數(shù),人口空間分布變化、總量趨勢是更值得關(guān)注的結(jié)果。

(3)基于大數(shù)據(jù)的城市常住人口計(jì)算方法是一種監(jiān)測區(qū)域人口變化的有效工具,尤其針對城鄉(xiāng)人口大量流動、大規(guī)模變化的區(qū)域,可以作為輔助傳統(tǒng)統(tǒng)計(jì)方法的重要輔助手段。應(yīng)當(dāng)將時空大數(shù)據(jù)手段的計(jì)算結(jié)果看成是對傳統(tǒng)調(diào)查方法所得結(jié)果的再認(rèn)知過程,是對傳統(tǒng)人口調(diào)查動態(tài)跟蹤局限性的有效彌補(bǔ)手段。因此,以百度慧眼為代表的時空大數(shù)據(jù)人口統(tǒng)計(jì)結(jié)論更適合作為輔助傳統(tǒng)方法,進(jìn)行人口動態(tài)跟蹤的一種監(jiān)測工具。同樣在針對杭州常住人口的研究中,依托百度慧眼大數(shù)據(jù)、手機(jī)信令數(shù)據(jù)的常住人口測算方法有助于更便捷、更經(jīng)濟(jì)、更高效地判斷杭州市內(nèi)常住人口短期內(nèi)的變化情況。使用時空大數(shù)據(jù)測算、監(jiān)測常住人口較適用于在相隔10年的2次人口普查之間階段,能有效地推測城市人口的空間分布變化態(tài)勢,從而判斷常住人口變化的準(zhǔn)確趨勢。

綜上所述,針對杭州城市常住人口的研究,不僅是為了證明以百度慧眼大數(shù)據(jù)為代表的時空大數(shù)據(jù)人口測算方法相較于傳統(tǒng)城市人口調(diào)查統(tǒng)計(jì)方法所具有的優(yōu)勢,也不僅只是為了論證杭州市常住人口在短期內(nèi)所發(fā)生的快速增長現(xiàn)象,而是希望借這一實(shí)踐案例向讀者們明確,采用時空大數(shù)據(jù)研究城市問題時,對數(shù)據(jù)計(jì)算結(jié)果的驗(yàn)證與數(shù)據(jù)算法的檢驗(yàn)同樣至關(guān)重要。在時空大數(shù)據(jù)的研究中需要時刻懷揣對手頭數(shù)據(jù)的“質(zhì)疑精神”,只有不斷質(zhì)疑、反復(fù)驗(yàn)證自身的計(jì)算結(jié)果才能求得趨近于真相的數(shù)據(jù)分析結(jié)果,才能使得大數(shù)據(jù)的計(jì)算方法與結(jié)論受到越來越多的認(rèn)可。最后,時空大數(shù)據(jù)的計(jì)算結(jié)果依然會受到多方質(zhì)疑,但筆者相信當(dāng)前時期杭州實(shí)際常住人口顯著增長是不爭事實(shí),針對“杭州常住人口有多少”的疑問待2020年第七次全國人口普查后自會揭曉。

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多