台北人口分布地圖:戶籍與信令人口比較


從台北市人口地圖看戶籍與信令人口差異。本文章由台北大數據中心(Taipei Ubran Intelligence Center, TUIC)提供。台北大數據中心下轄於台北市政府,致力於推動以資料與科技驅動的城市治理。

1 簡介

  上篇文章以「台北人口分布地圖:空間資料的尺度變換」為題,這篇文章則利用信令資料,比較戶籍人口和信令人口的分布差異。

  何謂信令資料?因為行動裝置(手機)固定都會回傳信號給基地台,電信公司可以利用訊號的變化,擷取用戶移動的距離與時間變化,拼湊得出使用者的移動路徑,詳細介紹可以參考這篇報告的第三頁。

  為什麼要看信令資料?雖然有戶籍資料在,從生活經驗中不難發現,它與實際生活情況有不小落差,無論是負笈求學、離家工作,不只通訊地址和戶籍地址可能不同,通訊地址也未必就是現在的住所。另外,早上到公司上班、晚上和朋友小酌、午夜時分回家睡覺,戶籍資料無法捕捉這些動態變化。利用信令資料,不僅能看居住地點和工作位置,若原始資料足夠豐富,也能看到出發點和目的地(Origin & Destination, 簡稱 OD)以及之間的流動情形。

  事實上,電信公司的信令資料已經有不少商業和學術上的應用,台灣也不例外。本文即利用台灣某電信公司提供的台北市信令資料,呈現台北市的人口分布。然而,本文重點並不完全放在於台北人口究竟怎麼分布,而是更大程度地關注信令人口和戶籍人口的差異,以及信令資料本身的限制。

2 台北市人口分布

  台北市政府的信令資料尺度是 250 公尺 x 250 公尺的網格,經過電信公司去識別化,考慮市占率進行一定推估後,得到各網格當中的各年齡層、性別人數;另外,因為原始資料中有時間維度,可以據此計算不同時間的人口分布。就內容來說,其實和最近內政部在 SEGIS 平台上公布的電信信令人口統計資料 內容相似,只是內政部的資料已經從網格對照為以行政區域為基礎了。

  利用空間資料的尺度變換文中提過的方法,將人口從網格映射(mapping)至村里,再依照上班時間和睡覺時間,取平均後粗略地將兩個時段的人口分為居住人口和工作人口,便能夠和戶籍人口比較。

  因為若以絕對人數上色,會因為面積不等而影響視覺判斷,因此下圖先呈現信令數據當中的居住人口密度。

台北市信令人口密度

Figure 2.1: 台北市信令人口密度

  從圖中可以看到台北市東北、東南人口密度很低,大部分人口聚集於中間與偏西邊。前者稀疏的理由主因是該地地形以坡地和山區為主,較少人居住,且也被劃為都市計畫保護區。

台北市信令人口密度與保護區

Figure 2.2: 台北市信令人口密度與保護區

  另外,光從圖來看很難直接看出哪些村里的人口密度較高。若將捷運路網疊上密度圖,便可以發現兩者有著緊密關聯。以北投區與士林區來說,人口主要聚集於和北投士林接壤的捷運明德站、石牌站、芝山站一帶,北投的另一個聚集區則是奇岩、北投、新北投構成的三個里,而士林也有士林與劍潭一帶的密集區。內湖也呈現類似情況,人口沿著捷運沿線分布。相對來說,發展多年的中正萬華一帶,人口稠密區域便沒有直接和捷運站點對應,松山信義區也因為商辦密集,人口分布不完全和捷運站貼合。

台北市信令人口與捷運路網

Figure 2.3: 台北市信令人口與捷運路網

  當然,人口的分布絕非看了密度地圖,或者疊上捷運路網或者山地便可有全盤了解,當中有許多台北發展的歷史脈絡,像是地形特色與限制(松山機場建設和風向有關)、都市規劃的考量(發展上先西後東)、與周遭區域如新北市的互動(聚落遷徙)等。若想了解台北更多,可以參考這本臺北.原來如此

3 信令與戶籍人口分布差異

  實際比較戶籍人口和信令居住人口密度,並控制各個密度區間的顏色方便對照,單用肉眼檢視分布狀況來說,其實戶籍和信令人口是接近的。

台北市人口密度

Figure 3.1: 台北市人口密度

  比較戶籍和信令人口分布上的差異,從下圖中可以發現,其實各區都有或多或少的落差,在信令多於戶籍人口的區域旁邊,也有戶籍人口多於信令的區域,並沒有明顯的聚集情況。利用空間性局部指標(LISA)分析,雖然有冷區和熱區存在,但其範圍都非常小,沒辦法清楚的看出模式,因此在這沒有附上圖表。

台北市信令居住與戶籍人口密度差異

Figure 3.2: 台北市信令居住與戶籍人口密度差異

  其實,雖然數字略有落差,但如同人口分布章節所言,兩者的分布大致接近。將人口分布和台北市土地利用中的住宅區套疊,可以看到人口大約都在住宅區上。

台北市信令人口與住宅區

Figure 3.3: 台北市信令人口與住宅區

台北市戶籍人口與住宅區

Figure 3.4: 台北市戶籍人口與住宅區

  因為從地圖中看不出差異,因此改用別的圖表看差值。將戶籍人口放在橫軸,信令人口放在縱軸,再加上斜率 = 1 的斜直線,可以見到兩者偏離多遠。

村里的信令與戶籍人口散布圖

Figure 3.5: 村里的信令與戶籍人口散布圖

  若再用行政區細分,可以見到較為細緻的變化。以中山區與中正區為例,大部分的村里都在斜直線周遭,但各自有一個村里的信令人口多出戶籍人口許多。

村里的信令與戶籍人口散布圖 - 分行政區

Figure 3.6: 村里的信令與戶籍人口散布圖 - 分行政區

  那麼,為什麼這些區域的信令人口若會多出戶籍人口許多呢?從單一資料來看很難直接查出原因,不僅需要熟悉 GIS,也要對該區域有足夠的理解才行。舉例來說,我們或許會推測,某區的學齡戶籍人口年比例高,又考慮到大學生很多都在外地求學,因此這些區域的戶籍人口可能會低出信令人口許多;而老年人口比例高的地方,或許有機會將房屋出租給人,因此這些區域的戶籍人口可能會低出信令人口許多。下圖便在原有的散布圖以外,增加老年人口比例的維度,但還沒有明顯的趨勢,需要更細緻的挖掘原因。

台北市的村里人口統計

Figure 3.7: 台北市的村里人口統計

  除了人口變數以外,還有其他因素可以用來推敲人口動態背後的原因。舉例來說,統計租屋市場上的供給、考慮學校與周遭學區、計算生活機能等,有許多可能的維度,相關資料也不難搜集,內政部的 SEGIS 上有相關資料集可供下載,研究者也能自行搜集點位資料(POI),或是依照自己的假設蒐集其他公開資料。

4 小結與反思

  本文呈現信令人口的分布,再輔以都市保護區、捷運路網、土地利用,並比較戶籍人口差異。

  信令資料確實有眾多優點,如動態測量人口分布,並能捕捉人口的起迄與旅次。台北市大數據中心有一個專案,即是利用信令人口的居住地與起迄資料,查看內湖科學園區的工作人口來源,並搭配捷運與公車的搭乘資料,試圖處理該地的交通壅塞問題。

  但也容許我指出,信令資料雖然好用,因為其仰賴推估的特性(考量市占、去識別化故要考量性別與年齡、考量網格尺度、考量抽樣天數是否有代表性),若樣本不足,便會面臨許多問題,不可不慎。

  最後感謝 TUIC 諸位夥伴提供的建議。因為篇幅限制與本文目的,其實沒有談太多信令人口分析上的應用,因此文末附上三張信令人口相關的地圖,希望你會喜歡!

台北市分時信令人口分布 - 動態版

Figure 4.1: 台北市分時信令人口分布 - 動態版

台北市分時信令人口分布 - 靜態版

Figure 4.2: 台北市分時信令人口分布 - 靜態版

台北市信令人口工作居住比

Figure 4.3: 台北市信令人口工作居住比

台北市週間與週末晚上人口分布

Figure 4.4: 台北市週間與週末晚上人口分布

  

Dennis Tseng
Dennis Tseng
An analyst & R lover

Use data to solve problems, tell stories, and change the world