五星縣長花錢買得到嗎?讓數據說話


有一分數據,說一分話

你也可以在我的 medium publication 上讀到這篇文章

1 Introduction

  近日前台東縣縣長黃健庭被提名為監察院副院長候選人引發爭議,又因為遠見雜誌有 26 年歷史的<縣市長施政滿意度調查>曾多次將黃評為五星縣長,作家楊索在臉書發文抨擊遠見,指該調查實為雜誌的「生財利器」。遠見於六月十九日發表聲明稿駁斥楊索,表示將提起妨害名譽告訴。

  事發後,有人挖出遠見一兩次的政府標案得標紀錄支持楊索的說法,但也有人以政治光譜迥異於黃健庭的陳菊也曾獲評為五星縣市長作為反例。我不知道事情真相,也無法證偽任何一方說法,但我認為僅拿單一年份或者單一縣市的標案金額做為媒體收錢辦事的「證據」都很有問題。

  首先,獲得標案不代表就會收錢辦事,因為有許多媒體奉行編輯與業務分離的原則,就算有影響也未必可以直接改寫特定報導;若把媒體想得壞一點,說他們會拿人手短好了,以黃健庭為例,「台東縣有標案」,所以「黃五年獲評為五星縣長」,難道台北市就沒標案嗎?那為什麼柯文哲連續好幾年連四星都拿不到?沒有選定比較對象就先做結論,比較像先射箭再畫靶。另外,我也懷疑因為個人好惡所作出的推論,因為「傅崐萁很爛」所以「九度蟬聯五星縣長是笑話」,這樣合理嗎?我不喜歡傅崐萁,但撇開喜好不談,如果傅是笑話的話,徐榛蔚傅崐萁還會一直選一直上嗎?

  比起上述經不起檢驗的說法,我認為若能夠把數據攤在陽光下,每個人都能夠有自己的第一手詮釋,會是更好的作法。

2 Method  

  在分析資料前,我先假設遠見壞透了。當我想像自己是遠見時,因為我的假設,只要我一拿到政府標案,就會給縣市長高分/高星等。所以底下我搜集了遠見的政府標案得標資料,以及歷年的遠見調查,希望能驗證這個假設是否正確。

  第一部分的各縣市施政星等與縣市長滿意度分數資料來自於《遠見雜誌》,以工人智慧謄寫而成,橫跨 2011 年到 2020 年。<縣市長施政滿意度調查> 固定在六月號刊出,七月號則會刊出<縣市總體競爭力調查>,前者的滿意度分數主要透過民意調查數字給分,星等則是結合民調與縣市統計指標數字,後者則完全以各縣市統計數字給分。因為總體競爭力可以客觀蒐集,在遠見很壞的前提下比較難動手腳,而民意調查相對比較難查證,所以我主要以滿意度分數與星等作為比較對象。

  第二部份的各縣市標案資料一樣橫跨 2011 年到 2020 年,來源是 Ronny Wang 開發的標案資料瀏覽,他將政府採購網的資料打包成 API ,方便民眾也能使用,我以遠見天下/天下遠見(查閱經濟部商業司資料,遠見曾經改名)為關鍵字,抓下所有遠見參與的標案,接著過濾遠見確實得標的案子,因少數案子有更正決標公告,也有剔除以免重複計算。此外,有另一個開放標案的網站可以參考,資料更好抓,但最早只有到 2014 年而已。

  另外補充一下,除了遠見雜誌的調查以外,天下雜誌也從 2010 年開始每年調查縣市長施政滿意度,結合民意調查和專家評比給分,但這次的主要爭議是來自於遠見調查的「五星縣長」。遠見雜誌與天下雜誌是兩間不同的公司,前者屬於遠見天下文化公司,後者則屬於天下雜誌集團,雖然名字相似,但其實各自獨立經營,想罵人還罵錯就不太好了唷。

3 Data and Visualization  

3.1 data overview

標案資料長這樣
date filename job_number unit_id unit_name brief.type brief.title
20200620 BDM-1-53120843 LASL109011 3.76.42 宜蘭縣政府 決標公告 109年青年政策行銷案
以年與縣市為單位計算標案總金額
county year n money
南投縣 2012 2 550500
南投縣 2016 2 879000
南投縣 2017 2 3244000
南投縣 2018 1 495000
嘉義市 2011 2 980000
縣市長施政分數長這樣
county 2013 2014 2015 2016
臺北市 61.02 62.3 74.6 60.4
新北市 66.46 66.6 68.4 62.4
桃園市 67.25 66.2 68.0 70.9
臺中市 62.82 59.7 67.3 65.2
臺南市 78.58 77.9 78.8 77.7
高雄市 75.92 77.3 79.1 76.8
基隆市 50.41 47.5 64.3 65.6
新竹市 67.14 66.6 62.2 65.9
新竹縣 70.38 68.9 67.0 66.0
苗栗縣 68.55 56.9 66.7 61.7
縣市長星等長這樣
county 2012 2013 2014 2015
臺北市 3.0 3.0 4.0 4.5
新北市 3.5 4.0 4.5 4.0
桃園市 4.0 4.0 4.0 4.0
臺中市 3.5 3.0 3.5 3.5
臺南市 5.0 5.0 5.0 5.0
高雄市 4.5 5.0 5.0 5.0
基隆市 3.0 3.0 3.0 3.0
新竹市 3.5 4.0 4.0 3.0
新竹縣 4.0 4.5 4.5 4.0
苗栗縣 5.0 4.5 3.5 4.0
串好的分數與得標金額長這樣
county_zh year county n money score
新北市 2013 NewTaipei 6 9593090 66.46
臺北市 2013 Taipei 4 2085564 61.02
桃園市 2013 Taoyuan 5 4585000 67.25
臺中市 2013 Taichung 2 3340000 62.82
臺南市 2013 Tainan 1 880000 78.58

  看完資料長相之後,底下來看三張圖表,主要想回答的問題有三個:得標金額越高的縣市,施政分數有越高嗎?施政星等有越高嗎?得標金額成長率高的縣市,施政分數成長率有越高嗎?

3.2 money and score

  橫軸放得標金額,縱軸放施政分數,再依照歷年資料分開,因為花蓮與台東爭議大,而台北市是值得參照的座標,所以特別標出。又因為每年分數與投標金額跨度不同,所以我鬆開橫軸縱軸尺度,方便以年為單位各自比較。由圖表可以看出,至少在公開取得的標案資料中,兩者並沒有明顯的正向關係。

3.3 money and star

  與上圖一樣,只是縱軸從施政分數換成星等,因為星等本來就由施政分數與縣市統計指標組成,結果也呈現沒有明顯的正向關係。

3.4 growth rate: money and score

  上面的圖都很簡單,把各縣市得標金額和施政分數/星等攤開來看就好。但如果事情沒有那麼簡單呢,會不會其實利益交換的運作規則比我們想像得更加複雜?以年度財政預算來說,台北市得標的一百萬與花蓮縣得標的一百萬元並不一樣,因為台北市享有豐沛的行政資源而花蓮只是遙遠的後山,所以直接拿兩個來看並不公平,所以我們不能以年的資料標準化,或許自己跟自己比是更好的辦法。

  要怎麼理解「自己跟自己比」?簡單來說,假設運作規則是這樣:如果今年從同一縣市拿到相對於去年更多的金額,那我就給你加分。舉例來說 A 縣去年讓我得標一百萬,今年讓我得標一百五十萬,雖然沒有很多,但至少有成長,那我就給你更高的分數,鼓勵你之後再接再厲買廣編。

  根據這樣的假設,我計算出了每年的投標金額成長率與施政分數成長率,也就是 YoY,畫成圖表長這樣。

  從圖表來看,也一樣很難說兩者有正相關係。我不死心,覺得不能讓壞人跑掉,但跑一個簡單的 linear model之後,發現 p-value 也沒有辦法通過假設檢定,只好黯然結束分析。

4 Conclusion

  我的分析結果是無法從圖表中看出標案金額和施政分數的正向關係,也推翻了自己的假設,所以我的結論是遠見不壞。雖然我判斷高標案金額不一定等於高星等或高施政分數,但詮釋數據與詮釋圖表很主觀。從資料本身來說,遠見的縣市調查資料是自己人工紀錄,雖然有檢查兩次,但難保疏漏,並且標案仰賴公開資料,也無法確認百分百收錄,若你對標案資料有心得請務必指點。

  還有另外一個關鍵是,數據並沒有辦法直接當作證據,就算從圖表或跑統計,結果看起來是這樣,但有可能利益交換是某年某縣市有這樣,或是用其他方式暗暗影響,但這些都沒有辦法證明。或者說,也沒辦法不證明。與其爭論誰對誰錯,我更相信有一分證據與數據,說一分話。

  退一萬步來講,先拋開對遠見的指控,就像前面所說,傅崐萁跟黃健庭五星縣長很荒謬嗎?你可以討厭他們,但他們的勢力一直在,不正視傅崐萁人馬反覆當選的事實,或者不正視執政黨分明大選狂勝,卻還要提名黃健庭的事實,這樣有用處嗎?我覺得更好的方法是,找證據證明自己的論點,然後試圖說服身邊的人,這樣才有機會讓自己喜歡的候選人當選,並藉此形塑自己心目中更好的世界,雖然世界不一定會真的變更好,但至少要嘗試一下啊。

  最後,我把上述的縣市長評分資料放在這個 google sheet,標案的資料整理後會補上。如果你有跟資料處理/資料分析/資料視覺化/資料新聞的案子可以找我聊聊,如果喜歡這篇文,還可以跟我說一聲讚喔!

謝謝 Steven 幫我 review 架構,資料分析與資料品質由本人概負全責。

Dennis Tseng
Dennis Tseng
An analyst & R lover

Use data to solve problems, tell stories, and change the world