HOME

 

 

那福忠,知名電子出版專家、網路作家。
   
  矽谷的科學家<
  那福忠 June 15, 2009
  請把你的想法寫信給我: [email protected]
   

   位於美國加州舊金山與聖荷西的縱谷,以電子科技著名於世,電子運作以矽 (Silicon) 半導體為主要材料,故名矽谷。矽谷集聚了全球頂尖的科學家,也吸引了有前瞻眼光的投資人,創造出獨特的環境,使得科學研發成果在充裕資金之下,不斷創新,影響全球的經濟與社會活動。現在雖然不景氣,進度趨緩,但基本體系仍在,只等情況好轉。

   但上週矽谷卻追悼一位天才科學家 Rajeev Motwani(左照片、點選放大),他是史坦福大學電腦科學教授,專精數學與邏輯理論,且樂於助人,曾指導不少年輕學生創業,最著名的就是幫忙 Larry PageSergey Brin 兩人以圖形分析網頁,建構網頁搜尋的理論,這兩人最後成立了一家公司,取名 Google。但週前家人發他溺斃在自己家裡的游泳池,他不會游泳、正在家學習,當時池畔沒有別人在場而發生悲劇,年僅 47 歲。

   Motwani 教授的「隨機運算」(Randomized Algorithms),用短路的方式來解決複雜的問題,成為 Google 搜尋引擎的核心技術。網路資料龐大,不可能搜尋每一網頁尋找答案,但隨機運算可以從一小部分資料,得到高可信度的答案。隨機運算顧名思義是隨機生成的數字,不是預先設定的,好像是擲骰子碰運氣,擲的結果用來決定下一步怎麼走,但電腦能極快的「擲骰子」,數量越多就越接近自然的狀態。搜尋網頁結果的排序,就是最好的例子,幾萬、幾十萬、上百萬的網頁,沒有資源與時間一一比對排列,經隨機運算,排序則達到相當精確的程度。

   Motwani 教授的專長是資料庫、資料開礦、網路搜尋,正好用到搜尋引擎的設計,使 Google 成為最全球使用最多的軟體。如眾所周知,把關鍵字輸入搜尋引擎,幾乎立即獲得回應,所以不可能是搜尋網路所有的網站。目前估計有一億五千萬個網站,網頁更是不計其數,搜尋一遍不但複雜,更相當費時。所以搜尋引擎不是直接搜尋網站,而是搜尋一個索引,包括重要的名詞,以及從哪一網頁來的。索引是由俗稱的網上蜘蛛 (Spider) 「爬行」取來的,網上當然沒有蜘蛛,這只是一個會自動繁殖掃瞄各網站、同時能把資訊帶回來的軟體。

   建構索引,大家用的方法大同小異,Google 與別人最大的差異是搜尋結果的排序 (PageRank),大致的作法是在索引中找出符合的網頁之後,給每一網頁打分數,然後按分數高低排列。給分有幾個原則,越是被別的網頁連過來越多,就這一網頁表示品質越高,所以得分也越高。每一連結等於投票,但比重不同,從高分數網頁連過來的票數,多過從低分數網頁連過來的票數,所以不能用許多空網頁連到同一網頁來增加票數取巧。連結給別人的「投票權」也不相等,對外連結越多的網頁,每一票的比重就被稀釋。另外網站的歷史、網站的名聲、進出連結的新舊歷史,都影響分數的高低。至於運算的細節,則是 Google 的專利,也是 Motwani 教授的心血,至今仍保持高度機密。

   除了學術的研究,Motwani 教授對研究生非常親和,許多學生想把理想變成生意,來徵求他的意見,他不但提供技術指導,也藉著與當地投資人的良好關係,給這些新興的准企業家在資金上的協助,最後他自己也對這些新興技術投入資金。可惜的是他當時沒有投資 Google,但創辦人以後贈送股票以為報償。

   Motwani 教授生於印度 Jammu,在新德里長大,從小就對數學有興趣,原本要進入大學數學系就讀,家人認為數學出路不好,所以改讀電腦,到學校才知道原來電腦也是數學。1983 年印度理工學院畢業後赴美深造,1988 年獲美國加州大學柏克萊分校電腦科學博士。2001 獲象徵最高榮譽的 Goedel 獎,認同他在電腦科學理論上的突破。他突然去世,矽谷的著名網誌、投資家、技術人士,對他生前的成就一致讚揚。

   Google 創辦人之一 Sergey Brin 說,無論是電腦、手機、網路,或是你今天用的各類電子技術,多少都會有一部分是 Rajeev Motwani 教授帶給你的。


上一篇  下一篇  索引