HOME

 

 

呂理哲,知名電子出版專家、網路作家。
   
  報紙賺錢少,非戰之罪
  呂理哲 August 20, 2013
  請把你的想法寫信給我: [email protected]
   

      Google不生產新聞,卻變成了美國最大的媒體公司,Google一家公司的營收超過全美國1382家報社的營業額,問題出在『大數據』的基本建設和網際網路的互動能量。

《本文開始》

媒體的功能是為大眾整理並提供信息,絕大部分的媒體不針對這樣的服務向閱聽人收費,他們利用聚集的閱聽人數目(發行量)吸引廣告主來付錢登廣告。報紙、電視、地鐵站的牆壁,網絡上的文章、音樂和影片都有聚集閱聽人的能力,都是媒體。

今天的媒體和以往不同,主要是因為互聯網不但可以用來提供信息,還能和閱聽人雙向溝通,和傳統媒體單方向提供信息的效益,有了明顯的差異。其中搜索引擎這種不生產內容的媒體,倒是把天下所有的內容當成自己的材料,就成就了谷歌一家搜索引擎在2012年內做到的營收,居然比美國1382家報紙加起來的營收還要多。

報紙為你報導新聞,除了你買報紙為報社增加一份發行量以外,報社無法從讀者這一端得到任何回饋。但是谷歌(Google)除了幫助大家去找你要的信息以外,同時利用你的搜索,收集到了珍貴的大數據(big data)。

什麼是『大數據』?

2009年,谷歌旗下幾位工程師在著名的『自然(Nature)』發表了一篇論文,解釋了谷歌如何運用每天儲存超過30億筆民眾搜的關鍵字,再加以運用,精確預測出美國那幾州即將在接下來的冬天爆發流感。

幾個星期後,一種結合禽流感和豬流感菌株的新病毒H1N1跳上了所有媒體的新聞頭條,美國疾病管制局(CDC- Center of Decease Control & Prevention) 為了應付這種蔓延迅速的流感,要求全國的醫生一碰到新流感病例,就必須立刻通報,以避免類似1918年西班牙流感的危機,當時可是5 億人受到感染,千萬人送命的大災難。

人們從身體覺得不舒服到自己認為可能感冒了,可能已經過了幾天以後才會去看醫生,經過層層通報關卡才會到達疾病管制局。病毒面對面傳染不會有層層關卡,何況疾病管制局一個禮拜匯總一次,可以想像疾病管制局只能記錄,根本就無法掌控病毒蔓延的真實情況。

谷歌先挑出美國人最常使用前五千萬個搜尋關鍵字,再與疾病管理局2003∼2008年之間的流感傳播資料比對;總共用了四億五千萬個不同的數學模型去測試分析,最後這套軟件系統找出45個關鍵字,用前幾年的數據放進數學模型裡面去運算,結果竟然和2007年和2008年疾病管制局統計的全美國流感真實數據十分符合。

不需要動用任何醫療資源,不用去訪問醫院,更不用採集流感檢體,谷歌這套系統就可以掌握美國流感疫情和疾病管理局一樣,差別在於實效,谷歌系統幾乎及時跟著疫情發展,管制局的記錄得等一兩個禮拜,收集到全國醫生的回報匯總以後。

谷歌不是只理出民眾得到流感後身體不適時,會用那些關鍵字到網絡上去搜尋,就能預知流感傳播的時間和地區,而是從幾千億筆的大數據找出和流感的相關性和在各地區出現的頻率,建立數學模型去預測。

重點在於數據量的龐大,沒有大數據,即使你有谷歌工程師的才華,也無法在疾病管制局發布流感數據以前,知道你住的城市什麼時候會發生流感疫情。

這就是傳統報紙媒體的基礎建設中找不到的機會,報社有訂戶的個人資料,只能用在送報或是催繳報費,無法像谷歌這種數碼媒體,即使沒有用戶的個人資料,也能因為龐大的數據量中找出各種社會現象的變化,如果大數據應用得當,看來就要改變許多領域的面貌,像流感預測這樣的公共領域只是其中一個例子。

1990年左右,IBM開始開發 Candide英法語翻譯系統,可惜因為收集大量數據的成本太高而作罷。今天我們可以看到谷歌利用大數據創造了超過60國語言的翻譯系統,其中有14種語言可以用語音輸入。可以想像IBM當時收集數據的難度,,谷歌既有又不斷增加的大數據可以預測流感,當然可能將這種能量應用到各種商業領域上去,報紙得派業務員去拉廣告,谷歌甚至可以找到產品的客戶以後才去向廠商爭取廣告業務。

傳統報紙不會消失,但是說到賺錢就無法和新電子媒體相比,這是基礎建設的根本差異,非戰之罪。



上一篇   下一篇 索 引