我們組了資料新聞讀書會


力量

1 前言

  在新聞所讀了一年,和所上同學聊到成長曲線,因為無限渴望能夠不斷向前,自然開始想東想西,這些日子積攢的知識、技術與經驗,能夠帶自己走得多遠?

  在新聞實務工作的眾多分枝中,我對資料新聞(Data-Driven Journalism)特別有興趣。望文便能生義,它指的是資料驅動而產生的新聞,強調報導「基於資料」才能存在。資料或者提供全新角度,或者證明某些經驗上的老生常談,也可能沒有太多新聞點,但呈現資料本身便足夠令人驚艷。在這樣的定義中,資料新聞可以是每週一篇的配圖短文,也可以是資料視覺化形式繁複的數位敘事,就算是調查報導,仰賴資料也能落入這樣的歸類。當然,上述說法只是個人詮釋,業內/業外人士各有定義。

  如果說資料科學由數學與統計(Math & Statistics)、電腦科學(Computer Science)、領域知識(domain knowledge)組成,資料新聞的基石就是資料分析、編採技巧、視覺化。具體發展端看個人選擇,既可以用採訪領域/特定線區分,像是政治、醫療,也能用專精的技術區隔,著重資訊設計、前端呈現,或者特別熟悉 GIS、擁有不俗的文字能力等。想在媒體裏面扮演什麼角色,便依此決定技能樹該長成何種模樣。

線上就能讀的[資料新聞手冊](https://datajournalism.com/read/handbook/two)

Figure 1.1: 線上就能讀的資料新聞手冊

  台灣發展資料新聞已有一段時間,各大專院校的新聞傳播系所也不乏相關課程,以台大為例,謝吉隆老師開設的新聞資料處理與視覺呈現,強調如何利用 R 語言,完成「探索、清理、分析、視覺化資料」的過程,林照真老師的新聞資訊視覺化 則與紐約時報的 Archie Tse 合作,特別關照視覺化面向。

  修完相關課程之後,我們渴望更多。幸運的是,已經有前輩整理相關資源,不必重新發明輪子,可以從一開始。例如林辰峰的這篇記者為什麼要學寫程式?,還有雖然停止更新、但仍值得一看的資料新聞從零開始,以及媒體從業人員的受訪經驗談,如數據記者、數位專題製作人、Graphics engineer 在做什麼?

  按圖索驥的學習,開始讀書,但心裡還是不安,單打獨鬥就會想取暖,所以組了讀書會。

2 為什麼要組

  有一句話説:「一個人可以走很快、一群人可以走很遠。」看起來頗有道理,但負面的想,有沒有可能「一個人可以走很快、一群人反而走很慢?」探索組織存在的目的永遠是首要任務。

  但在釐清必要性之前,先和朋友打聽消息。政大的朋友濬浩介紹他 2019 年揪團組的資料新聞讀書會,交大的朋友家慈則介紹他 2020 年主持的資料新聞與互動設計讀書會。   
政大朋友的資料新聞讀書會

Figure 2.1: 政大朋友的資料新聞讀書會

交大朋友的資料新聞與互動設計讀書會

Figure 2.2: 交大朋友的資料新聞與互動設計讀書會

  借鑑前輩經驗,內容大致可以區分為:個案研究、經驗分享、工具學習、實作。若預設成員具備一定 R 語言能力重新發想,也不會離這些內容太遠,微小改動後大概是:讀書、讀作品、學技術、找人分享經驗、做圖表後互相討論、實作。

  但這些東西仍舊無法說服自己,因為若足夠自律,一切都有可能。自己可以讀書、可以讀好作品,技術能夠修課或者自學,分享經驗仰賴 H/H Taipei 便已足夠,又無法確保互相提出的意見足夠專業,實作部分也可依靠個人或與朋友們合力完成。不僅如此,最大的困難之處在於參與者背景殊異,掌握技術的程度、對於特定議題的認識、擁有的期待、能夠投入的時間等等都不同。所以問題再次回到,「1 + 1 > 2 」如何可能?

  重新思考之後,想到兩個可能性:第一是自己做不了、但大家可以做得了的事情,第二則是自己的東西不足,其他的人觀點可以帶來幫助。

  基於上述兩點,延伸出能夠發揮集體力量的實作方法,具體流程如下:

  1. 一起閱讀相關領域的書,例如資料視覺化、文字探勘
  2. 挑選特定主題後,找尋相關媒體作品,歸納重點後討論案例中的資料呈現、分析方法
  3. 依照上述主題,理解相關研究方法,包含該主題的先備知識,以及從原始資料轉譯成報導的過程
  4. 挑選在地資料,發想新角度後實際寫報導

  如果是上述說法,就有說服自己的理由。不再只是讀書會字面意義上的,基於取暖性質的一起移動。

跟所上同學討論後寫下的想法

Figure 2.3: 跟所上同學討論後寫下的想法

3 如何進行

  以「讓身邊同學更加熟悉資料新聞並產出作品」為短期目標,中期目標則是擴及整個新聞所、政大傳碩、整個台大,長遠來看目標是推廣資料新聞到所有學校。不過誘惑太多,道阻且躋。

  目前規劃以 3 週為一個小單位、12 - 15 週為一個大單位,每個小單位依照上述的讀書(2-3)、案例研究(3)、理解理論與方法(3)、實作(3-6)分組進行,各組每週討論一次,全體討論則是各單位一次,每次全體討論還會搭配實作練習,包含圖表討論與圖表實作,前者是搜集案例後品評優劣並實際修改(特別感謝同業友人/前輩的爛圖表相簿與群組支援),後者則是由我準備資料,讓參與者思考如何視覺化,重點包含想說什麼樣的故事、適合的呈現形式等。

  我們從 2021 年 7 月開始,參加的組員組成為台大新聞所 R09 、政大傳碩等修過吉隆老師 R 課程的同學。首輪以貧富不均為主題,各組分到的子題是「同經濟體內所得與資產」、「跨經濟體貧富比較」、「貧窮與其他變數關係」,並不定期邀請對資料新聞有所認識的同業與前輩分享經驗、點評成果。目前仍在試驗階段,若確實可行,參與者又有意願,便能延續下去,當然也不能把話說死,生命何其美好,眾人各有追尋。目前的詳細進度如下:

  讀書部分,各組分別負責 Fundamentals of Data Visualization 的 1-5, 6-9, 10-14 等章節的導讀,搭配資料視覺化練習,目的是讓參與者深入了解將資料變數映射到視覺變數的過程,不再只依賴直覺或經驗畫圖。

其中一次資料視覺化的練習以這篇[文章](https://jcarroll.com.au/2021/07/02/improving-a-visualization/)為案例

Figure 3.1: 其中一次資料視覺化的練習以這篇文章為案例

某組發想圖表的練習成果

Figure 3.2: 某組發想圖表的練習成果

  案例研究部分,我們以組為單位,搜集國內外各子題的案例,撰寫摘要和討論,目的是希望讓其他組員不用完整看完報導,也能夠從整理中學到東西,因此記錄問題意識、拆解報導架構、註明資料來源並解釋方法、討論圖表與文章優劣。組內各自摘要後討論相關的報導重點、形式、維度、指標,再以組為單位寫成整理與他組交流,並改寫成 medium 文章。此階段也搭配修改疑慮圖表的練習。

新聞摘要內容

Figure 3.3: 新聞摘要內容

  理解研究方法部分,同樣以組為單位,發想問題意識、搜集資料、查找相關研究與理論,最後提出提案,目的是希望參與者們不僅可以畫圖,更有能力寫出分析文章。用貧富不均舉例,例如理解 Gini coefficient versus top income shares 的差異,同時也有尺度上的思考,像是全球、區域、經濟體之間與之內的異同。另外和一線記者相比,我們有餘裕讀相關研究,查找案例時也看到外媒如紐約時報改編研究能量的充沛。能夠和理論對話則是最好的了,但無法也並不強求。此階段也搭配資料視覺化練習。

理解研究方法內容

Figure 3.4: 理解研究方法內容

  基礎建設後,便是實作。提案、搜集資料、採訪、寫文章,和採訪寫作的課程無異。最後也會嘗試投稿,尋求發表機會。「我們準備好了。資料新聞向前行、台灣一定贏!」

重繪圖表也有原始資料讓大家練習

Figure 3.5: 重繪圖表也有原始資料讓大家練習

重繪圖表的成果

Figure 3.6: 重繪圖表的成果

4 結語

  資料新聞是個極度吸引人的領域,很感謝 H/H Taipei 的前輩願意花時間經營這樣的組織,知識得以傳遞、同好得以交流。體會過人性的美好,希望自己也能藉著組讀書會的機會,讓更多人認識資料新聞,並且擁抱資料新聞的價值。

  最後謝謝柔安一起主持,感謝濬浩、家慈分享過來人的經驗,還有吉隆老師、照真老師、怡志老師提供意見,以及 Steven, Helene, Ting-Ni, Kerwin 參與定案前的討論,並擔任讀書會來賓、不定時傳來有疑慮的圖表。當然還有幫忙設計 logo 與 banner 的緣份。With data, we Report!

Dennis Tseng
Dennis Tseng
An analyst & R lover

Use data to solve problems, tell stories, and change the world