專訪Google搜索副總裁:今天的互聯(lián)網(wǎng)搜索有多成熟
專訪Google搜索副總裁:的互聯(lián)網(wǎng)搜索有多成熟
中國站長站訊:最近,CNET專訪了Google的搜索副總裁,訪談中,詳細的闡述了谷歌對于互聯(lián)網(wǎng)搜索的概念和模式,并表示搜索已成為互聯(lián)網(wǎng)運轉(zhuǎn)的核心,也是Google業(yè)務(wù)的重中之重。Udi Manber是Google搜索部門副總裁,主要負責搜索業(yè)務(wù)算法研究。他的工作高度機密,因為Google不想讓人了解其中的玄機。不過Google近來開始少量向外界公布自己的核心搜索業(yè)務(wù)的情況。Udi在Google總部接受了我們的專訪。
互聯(lián)網(wǎng)搜索有多成熟?Udi:做個類比,一個15歲的年輕人認為他很成熟。一個19歲的人認為他異常成熟。不過,每過幾年你都會意識到以前都不太成熟。網(wǎng)絡(luò)搜索好像15歲的人,不過很明顯,我們現(xiàn)在比5年,10年,15年前成熟多了。你畢業(yè)于亞利桑那大學,然后在雅虎,亞馬遜網(wǎng)站,A9工作過,06年,你來到Google。你從這些不同的經(jīng)歷學到了不同的東西嗎?或者只是公司名片的電話號碼改改而已?Udi:現(xiàn)在的公司規(guī)模更大一些,也更好,F(xiàn)在的團隊比我以前共事過的要大。我們投入更多的資源在團隊上。在網(wǎng)絡(luò)發(fā)展的早期,我還記得AltaVista,HotBot和WebCrawler這些搜索引擎的存在。Udi:我也記得它們。當時這些搜索引擎看上去非常精美和成熟,現(xiàn)在回首又是另外的感受了。搜索引擎變得更有用了。不過10年之前,人們并未想到我們將會通過一個搜索框來獲取信息,現(xiàn)在,這種方式顯得理所當然了。10年之后又會怎樣呢?Udi:10年前,還是有一些人知道這一點。不是吹牛,我當時很清楚這一點。這是我為什么在90年代轉(zhuǎn)行搜索行業(yè)的原因,因為每個人都在談?wù)撔畔⒏锩。很明顯有一場信息革命,信息的存儲,傳輸?shù),你需要找到它們。在巨量信息中找到想要的東西成為這場革命的關(guān)鍵。雖然現(xiàn)在這一點已經(jīng)很明顯了,不過在6到7年前,這一點還不是很清晰。我們認為Google之所以現(xiàn)在這樣的成功,原因是創(chuàng)始人 Larry Page和Sergey Brin 10年前看清了這一點,然后投身其中。90年代初,只有很少的人從事搜索研究,領(lǐng)域也很有限,象司法搜索,醫(yī)學搜索,搜索等,當時,如果你要找一個信息,你得讓專業(yè)人士來完成,你告訴他自己要找的東西,他來給你執(zhí)行搜索。我們認為,人們應(yīng)該自己來完成搜索,不必找專業(yè)人員,這是一場革命。我預(yù)計,未來人們希望搜索到更多的東西,因為現(xiàn)在有很多東西在Google上還搜索不到。10年前,如果你能夠找到問題的答案很滿足了,現(xiàn)在,如果你在或第二個搜索結(jié)果中找不到答案的話會不滿意。這種轉(zhuǎn)變很好,人們的期望是我們將從事的事情。搜索技術(shù)的一個有趣趨勢是個人化。比如我喜歡照相機,如果我進行一年的搜索工作,Google會明白我喜歡照相機。個人化技術(shù)有多成熟?Udi:是的。如果你允許,我們將保存你的搜索歷史,并且用它來改進你隨后的搜索。個人化技術(shù)不是要徹底改變你的搜索結(jié)果,它只是略微的調(diào)整你搜索的結(jié)果。即使你很喜歡照相機,你的搜索頁面上仍然有大量與照相機無關(guān)的東西,如果參照搜索歷史,那么結(jié)果會好很多。現(xiàn)在人人都加入了社交網(wǎng)絡(luò),那么整個互聯(lián)網(wǎng)搜索與個人搜索之間有交叉層嗎?Udi:我們能夠用個人信息來改進你的搜索。比如,你搜索了1百次照相機,這會告訴我們很多信息。如果你的朋友執(zhí)行特定的搜索,它們也是一種信號。Google搜索結(jié)果的確定性怎么樣?比如,在不同的時候執(zhí)行相同的一個搜索,結(jié)果會一樣嗎?因為你們有這么多的服務(wù)器,搜索結(jié)果會在這些系統(tǒng)之間緩慢的發(fā)生變化嗎?如果我明天在波士頓進行一個搜索,或者在沒有開啟同步功能的情況下搜索,結(jié)果會不會不同?Udi:搜索結(jié)果是通過系統(tǒng)來進行過濾的。系統(tǒng)以很快的速度來完成搜索工作。如果你在不同的服務(wù)器集群上進行相同的搜索,那么在一定的時間,其結(jié)果 可能有輕微的不同。同樣,如果你在不同的時間執(zhí)行相同的搜索,結(jié)果有可能有所差別,因為有些結(jié)果可能我們剛好在5分鐘之前進行了收錄。我們收錄信息的速度確實很快,如果世界上有事情發(fā)生,你可以在1個小時內(nèi)搜索到與這一時間相關(guān)的眾多頁面。時效性對我們來說非常重要。另一個因素取決于位置。如果你在不同的國家進行相同的搜索,甚至你用一樣的語言進行搜索,你得到的結(jié)果會不一樣。我們會根據(jù)國家的不同改變搜索結(jié)果。通用搜索的情況如何?人們在多大程度上會用到它?Udi:我們希望你來Google.com搜索到你想要的任何東西,我們會想法判斷出你要的是一段視頻,一本書,或者當?shù)氐男畔。根?jù)你的搜索,我們將在搜索結(jié)果頁面上插入不同的媒體類型,象圖片,你不需要再去Google的圖片頁面找圖了。你們?nèi)绾螌⑸樾畔乃阉鹘Y(jié)果頁面上?現(xiàn)在人們不想要兩類信息,一是垃圾信息,二是色情內(nèi)容。Udi:我們在這方面投入了大量的精力。我們專門有一個團隊在從事色情信息的工作,這種范圍不僅是在美國,而是在全球范圍。我認為我們的工作很出色。不可能百分之百的,但它們的數(shù)量已經(jīng)很少了。我們對這一點相當重視。和垃圾信息一樣,這是否有些像貓和老鼠的游戲?Udi:不盡然。我覺得,大部分色情網(wǎng)站并不想欺騙你,而垃圾信息網(wǎng)站的目的是要欺騙你,色情網(wǎng)站已經(jīng)有自己的客戶群,他們不需要去欺騙。色情網(wǎng)站的身份很好確認。我對命令行界面搜索的回歸很好奇,和常規(guī)的搜索相比,命令行搜索的不同點在哪里?人們需要專門學習命令行搜索方式么?Udi:我們不想強迫人們?nèi)W習專門的語法與命令。我們希望在用戶不需要學習的情況下理解他們的想法。不過這也不排斥用命令行搜索。我們只是給專業(yè)人士提供一個專業(yè)搜索方式。目前,行業(yè)垂直搜索已經(jīng)發(fā)展壯大,比如化學,醫(yī)療,健康,司法搜索。你們會進入這一領(lǐng)域嗎?Udi:我們的發(fā)展方向是通用搜索。我們希望在Google搜索中融入全部的東西。我們的結(jié)果界面中已經(jīng)包括了專業(yè)搜索的東西。在視頻和相片方面,計算機會不會有朝一日會判斷出內(nèi)容,而無需人們使用文字標簽?Udi:我認為我們能夠在這方面做得更好。圖片本身不會告訴我們它表達的是什么,因此,圖片的元數(shù)據(jù)將變得越來越重要。用戶創(chuàng)建內(nèi)容的模式會讓你們在這方面更進一步嗎?比如,挖掘Flickr和Picasa網(wǎng)絡(luò)相冊中的信息。Udi:肯定會有所幫助。對于很多搜索來說,我們得到了維基百科全書的內(nèi)容。你認為這是好事還是壞事?維基百科當中已經(jīng)包括了大量的連接到自身的鏈接,是不是這個原因提高了它的搜索排名?Udi:我認為,如果對用戶搜索信息有幫助,這很好。