暖暖提示您:看後求收藏(第9部分,揭密搜尋引擎快速成長路:撬動地球的Google,暖暖,630看書),接著再看更方便。
請關閉瀏覽器的閱讀/暢讀/小說模式並且關閉廣告遮蔽過濾功能,避免出現內容無法顯示或者段落錯亂。
天才,這樣的完美結合確保了他們可以在外面廣闊的世界中取得成功。他們信仰社會進步,這種信仰在矽谷中意味著,他們偏愛免費的、開放性的軟體系統,而不是比爾 · 蓋茨和他領導的微軟公司所偏愛的封閉性系統。同時,他們的立場也很堅定。
“他們非常看不慣商業化的美國社會中存在的一些現象,而且他們從來都不會出於謹慎而向人們掩飾他們的不滿。”阿利森說道。
書 包 網 txt小說上傳分享
神奇的Google(5)
當佩奇開始做報告的時候,阿利森還是很受震動。拉里是個非常出色的教師,他可以找到某個問題的關鍵,然後以非技術性的、人人都能夠理解的方式解釋它。在阿利森看來,拉里是個頭腦清晰的人,而且很清楚自己在做什麼。
“每次當你建立一個連結的時候,”拉里對教室裡鴉雀無聲的聽眾說道,“你就建立了一個引用。但是如果你像搜尋引擎那樣開始計算網路上引用的數量,你就會遇到新的問題。網路不像科學文獻,任何人都能夠製作網頁。”
“一種看待PageRank的方式,”他解釋說,“就是把它當成一個使用者模型。假設有一個隨意的網路衝浪者,從某種意義上來說,它就是一隻猴子,每天到處地跑,點選一個又一個連結,但這種亂點行為卻不包含智力成分。你也可以說,這與人們在網路上的行為類似。”佩奇停頓了一下,聽眾們發出竊笑聲,然後他又接著講。
“從根本上講,PageRank演算法假設,如果有人用連結指向你,那麼你就可以分得一部分屬於他們的重要性。具體來說,如果一個非常重要的人指向你,這就比一個無關緊要的網站的主人指向你要有價值得多。比如,假如雅虎的主頁指向你的網頁,這就是件非常了不起的事。即使你只有一個在雅虎主頁上的連結,這就已經很好了。要讓重要的網站連結你,你要麼付很多錢給別人,要麼你的網頁本身非常不錯。而如果你在我的主頁上有一個連結,估計沒有人會把它當做一回事。”然後,佩奇解釋了他是怎麼找到產生分等級的搜尋結果的配方的。“我們大體上根據那些網頁的重要性,為他們賦值。一張網頁的等級就由指向它的所有網頁的重要性數值的總和來決定。”
搜尋引擎的另外一個重要挑戰,佩奇說,就是人們會想方設法地欺騙它來使自己的網站在搜尋結果列表中得到一個更高的評級。因此,要贏得這場網路戰爭,搜尋引擎必須要比那些惡意操縱它的網站更高明才行。
“人們會試圖誤導搜尋引擎,”佩奇說,“有多少人曾經在搜尋結果中看到色情內容和其他東西一起出現呢?看到的請舉手……OK,我們看到有不少人承認他們看到過。這個問題對於搜尋引擎來說非常嚴重。從根本上講,人們試圖透過讓他們的網頁出現在每個搜尋結果中來賺錢,他們根本不在乎你在搜尋什麼,他們根本就是什麼都不在乎。他們只想為他們的網頁爭取訪問流量,這是個非常嚴重的問題。”
在提出問題之後,佩奇解釋說,他正在尋求解決的方法。他說,問題的答案就在於充滿活力的、不斷更新的衡量網站真正重要性的方式,它使網站經營者鑽系統空子的難度加大了。而Google總是將終端使用者的利益擺在第一位,它一定會做好這項工作的。
這時,佩奇忍不住又指出了其他搜尋引擎技術的另外一個令人遺憾的缺點。“搜尋引擎的執行不盡如人意。”佩奇說,“如果你把AltaVista輸到另外一個搜尋引擎中搜尋,你能看到AltaVista的主頁嗎?很可能不會。而我們很好地解決了這個問題。我們完全依靠自己的力量來解決這些問題。這的確是個非常艱鉅的任務。”
Google運作方式的核心是將複雜的任務分解成小塊,然後同時處理它們。憑藉正確的數學方程,加上多臺個人電腦,布林和佩奇可以創造出一個現代的流水線來處理資訊的收集、索引和呈現。同時,根據摩爾定律,他們將來能夠以更低的成本獲取更強大的計算機處理能力。
“我們在網路中捕獲網頁,也就是說,我們走出去下載整個網路。大概每秒鐘我們可以下載100張網頁,”佩奇說,“要想可靠地完成這個任務是非常複雜的。事實上,我們儲存了我們下載的所有資訊,因為這對於研究工作非常有價值。我們將整個網路儲存在硬碟上,擁有這些資訊對於科學研究很有用處。”
拉里 · 佩奇進一步解釋是什麼使得Google搜尋引擎比其他搜尋引擎效能更優越,在座的斯坦福的學生和教
本章未完,點選下一頁繼續閱讀。