微軟欲推語意搜索 勝過Google的PageRank
微軟欲推語意搜索 勝過Google的PageRank
核心提示:搜索引擎于互聯(lián)網(wǎng),無疑是非常重要的一部分。微軟為了在搜索引擎方面追趕谷歌,最近微軟一邊押注搜索份額第二的雅虎,另一方面收購了互聯(lián)網(wǎng)搜索引擎技術(shù)公司Powerset。
盡管在搜索引擎市場微軟遠遠落后于谷歌,但是微軟一直試圖改變這種狀況。Google的崛起和稱霸很大程度上其開創(chuàng)的Google PageRank(網(wǎng)頁排名)算法,利用這種對網(wǎng)頁的重要性的評估方式,解構(gòu)鏈接網(wǎng)站的內(nèi)容的價值和構(gòu)成。而微軟研究人員打算開創(chuàng)一種叫做BrowserRank的新評價算法體系。簡單說來,取代PageRank算法的BrowserRank評估系統(tǒng)是建立在網(wǎng)絡超鏈接間的關(guān)系數(shù)學模型,他們描述為“通過訪問者一系列行為動作來繪制出對該網(wǎng)頁評價的瀏覽圖表”。
網(wǎng)頁評價瀏覽圖表
于7月日至24日在新加坡召開國際信息檢索(Special Interest Group on Information Retrieval)會議上,微軟亞洲研究院的高斌、劉鐵巖,南開大學的張穎,中國社會科學院的馬志明和北京大學的何樹元(均為譯者音譯)對搜索引擎新研究成果:更多的用戶訪問頁面和頁面的訪問時間長短對頁面的評級都有重要的影響,我們可以模擬出用戶對該頁面的評價,并反饋到搜索引擎當中去。
搜索引擎于互聯(lián)網(wǎng),無疑是非常重要的一部分。微軟為了在搜索引擎方面追趕谷歌,最近微軟一邊押注搜索份額第二的雅虎,另一方面收購了互聯(lián)網(wǎng)搜索引擎技術(shù)公司Powerset。足可見微軟已經(jīng)同谷歌在搜索領(lǐng)域短兵相見。
PageRank的短板
微軟研究人員表示,PageRank對惡意內(nèi)容及鏈接沒有很好的解決辦法,很多惡意網(wǎng)站指向某個網(wǎng)站鏈接,而這個網(wǎng)站可能PR值很高;另一個問題是PageRank算法沒有把對一個網(wǎng)站的訪問時間作為衡量標準,可能一個好網(wǎng)站用戶待的時間要遠遠高于其他網(wǎng)站。
實驗結(jié)果表明,BrowserRank在惡意網(wǎng)站和訪問時間上有很好的解決方案。
搜索研究成果的商業(yè)轉(zhuǎn)化
從實驗室到搜索商業(yè)產(chǎn)品轉(zhuǎn)化時間可能會很長,但是通過收購其他公司可以大大節(jié)約時間。搜索領(lǐng)域?qū)<艺J為語意搜索憑借著其智能搜索很可能成為“谷歌殺手”。通過收購Powerset公司,微軟可以迅速提升追趕谷歌的技術(shù)實力。
Google工程開發(fā)部門副總裁尤迪·曼博爾(Udi Manber)表示,谷歌搜索實驗室在研究很多相關(guān)搜索技術(shù),我們會將研究成果逐步驗證,并放到谷歌搜索算法當中去。
據(jù)市場研究組織eMarketer預測,全球搜索廣告市場的規(guī)模在12年將達到510億美元,雅虎、微軟均覬覦這塊大蛋糕,如果微軟想要對Google形成威脅,那么苦練技術(shù)內(nèi)功是關(guān)鍵,收購Powerset并整合到其搜索體系中,追趕上谷歌的時間也許不會太遠。