HOME

 

 

那福忠,知名電子出版專家、網路作家。
   
  專家:十五年後百分之九十的新聞由電腦產生
  那福忠 December 22, 2011
  請把你的想法寫信給我: [email protected]
   

   Narrative Science,是一家剛成立一年的研究機構,與芝加哥西北大學工程與新聞兩學院合作,研究項目是電腦自動產生以文字敘述的新聞報導,第一個專案對象是西北大學的棒球隊,每當球賽結束,系統就會以文稿敘述的方式,自產生球賽的總結,雖然有「報導」錯誤的地方,仍是驚人之舉。西北大學電腦與新聞教授 Kris Hammond,也是這間研究機構的創始人之一,簡述這項技術的背後邏輯,並預估十五年後,有 90% 的新聞會由電腦自動產生。

   我們今天所談的「內容」,是從儲存的「資料」擷取而來,這些資料是明確、固定、電腦可以解讀的數據。今天的環境,每天有無數這樣的資料注入網絡,像是體育、財經、房地產、政府、企業、的統計,這一趨勢不但不會停止,每天也有無數的交易在網上進行,這些交易的數據,也都登錄成為資料。用這麼多的資料,來描述我們今天世界的運作。

   當這一趨勢繼續加速,便製造了「開鑿」(Mining) 這些資料的機會,利用電腦軟體,把資料的內涵轉換成文字敘述的型態。有了這一步驟,今天以數據為主的新聞,就可以由電腦處理,產生敘述的文字,來描述這些事件。這是技術進展的第一步,把原始的硬性資料轉換成軟性的文字敘述。

   但每天進入網路的不止固定的數據資料,還有大量的敘述文稿,這些文稿僅有人能理解、電腦還不能理解,所以要在技術上開發另一處理步驟,那就是把前一項反向作業,藉著語言理解與擷取技術的發展,把的敘述文字,轉換成電腦可以理解的固定資料,然後再把這些資料做為驅動器,注入不斷擴張的資料來源,來產生新的敘述文字。

   固定資料與文字敘述的不斷循環,電腦的智慧就會不斷提升,以人力導引的電腦系統,就能自動產生更豐富的敘述文稿。例如今天以球賽結果為主的報導,那時就自動產生場外球員的動態,今天以股市為主的報導,那時就自動產生營運的策略,今天失業的報導,那時就會自動產生政府因應措施的新聞。

   今天的新聞,越來越趨向分眾,類別越分越細、越窄,但每一類別僅對少數人有興趣、有價值,這一趨勢在今天新聞的製作上無法做到,因為不可能大量製作各個狹窄領域的新聞,而每一領域僅供少數讀者閱讀。但如果有了巨大的資料量,電腦又能理解敘述的文稿,那就有機會來解決這一問題。

   事實上,這樣的電腦系統也是產生大量多領域新聞的唯一方式,這些內容多是今天的新聞媒體力不從心所忽視的領域。這一技術的運用,所產生的不僅可供各小群人的需求,可更進一步可產生個人化、對自己更相關、更有意義的新聞內容,讓每個人都能以全新的方式來體驗新聞。

   Kris Hammond 教授說,十五年以後 90% 的新聞會由電腦產生,不但可能,而且不可避免。在二十一世紀,十五年是很長很長的一段時間,什麼事都可能發生,即使五年以後的事也難以預料調。我的預測是不需要十五年就會發生,而且由非新聞媒體主導。



上一篇   下一篇  索引