暖暖提示您:看後求收藏(第7部分,揭密搜尋引擎快速成長路:撬動地球的Google,暖暖,630看書),接著再看更方便。

請關閉瀏覽器的閱讀/暢讀/小說模式並且關閉廣告遮蔽過濾功能,避免出現內容無法顯示或者段落錯亂。

ers…Lee)曾經提出這樣的說法,認為資訊飢渴的計算機使用者可以點選突出顯示的文字,從一個檔案跳到另外一個檔案。對一位富有遠見的計算機專家而言,網路就是連結。

1996年慢慢過去,在此期間,佩奇和布林合作進行下載和分析網路連結的工作。獲取資料的過程比佩奇預計的要長,而且他估計他們每放一個網路爬蟲程式出去蒐集整個網路,電腦科學系就得為此支付2萬美元,但是他急於完成這項工作。他想要發現這些自動化的交叉指代的重要性。他的研究目的不但吸引了布林的注意,還吸引了布林的指導教師莫特萬尼的注意。因為,這項工作有希望改進網路搜尋。布林之所以加入這個專案,一是因為他很希望能夠與佩奇一起工作,二是他一向對從大量隨機資料中提取資訊很感興趣,而這個專案恰恰與此相關。如果布林想要發揮他數學和程式設計的優勢,還有哪個舞臺比網際網路更廣闊呢?

佩奇建立起了自己的理論模型——可以透過計算指向某個網站的連結的數量來確定這個網站的受歡迎程度。儘管受歡迎程度並不總是同價值相關,不過,他和布林都生長在學術世家,非常重視發表在學術期刊上引用了諸多相關文獻的學術研究成果。而對佩奇來講,在某種意義上,連結就像是文獻引用。科學家會引用那些同自己的研究相關的已出版的文獻,而這些引用可以幫助學術研究界確定某項研究成果的價值和影響力。“文獻引用非常重要,”佩奇說,“事實證明,獲得諾貝爾獎的科學家們引用了上萬種不同的文獻。”他還說,“如果你的成果在相關科學文獻中被大量引用,就說明,你的工作非常重要,因為很多人都覺得它值得一提。”

而佩奇得出的結論是,同樣的道理也適用於網站。他更進一步取得了概念上的突破:並非所有的連結都具有同樣的價值,其中一些比另外一些更重要。佩奇賦予從重要的網站上發出的連結更高的權重。那麼,他又如何確定哪些網站更重要呢?很簡單,指向哪個網站的連結多,哪個網站就重要。換句話說,如果人氣很旺的雅虎主頁上有指向某個網際網路網站的連結,那麼這個網站馬上就變得重要一些了。佩奇把自己的姓氏同自己正在處理的這些檔案巧妙地結合在一起,為他的連結評級體系起名為“PageRank”(網頁序列等級)。

佩奇的另外一位指導老師,斯坦福大學的特里·維諾格拉德(Terry Winograd)教授稱,解決網頁排序問題的學術出路,最終取決於弄明白透過追蹤連結到底可以發現什麼。“一開始,拉里的想法是進行隨機的網路瀏覽,就像是在網路中漫無目的地漫步。這套演算法(一系列數學方程式)是為普通的網路使用者發明的。大部分時候,他們在某個網頁上點選一個連結,就會到達網路上的某個目的地。對這個過程的提煉造就了PageRank。”

布林和佩奇相信,把PageRank演算法應用於網際網路,可以作為他們博士論文的研究方向。1997年初,佩奇打造了一個叫“BackRub”的簡單的搜尋引擎。這個搜尋引擎之所以叫“BackRub”是因為它主要處理反向連結。佩奇一直善於精打細算,他把自己的左手平放在掃描器上,將自己的手紋轉化成了一種黑白的圖片,而這就是BackRub網站的標誌。布林、佩奇和莫特萬尼都為這個正在形成的專案貢獻了自己的創意。莫特萬尼說,不久,他們就清楚地意識到,這個專案不僅僅是一個繼續他們的學術研究的途徑。儘管事先並沒有想到,不過當這三個人把自己的排序方法應用於網際網路的時候,卻出其不意地解決了網際網路資訊搜尋的一個關鍵問題。

txt小說上傳分享

獨特的PageRank技術(4)

“他們從來沒有鄭重其事地坐下來,然後說,‘讓我們來發明下一個偉大的搜尋引擎吧。’他們只是想要解決有趣的問題,又碰巧想到了一些不錯的創意,”莫特萬尼說,“拉里貢獻了一些想法,謝爾蓋貢獻了一些想法,我也貢獻了一些想法,我們都參與了專案的創意。漸漸我們發現自己正在建立一個完整的搜尋引擎。”維諾格拉德也同意他們的想法是一天天逐漸發展成熟的,“他們一開始並沒有想要成立一家公司,不過他們確實想要創造更優越的搜尋方式。”

布林、佩奇和莫特萬尼一起建立了一個複雜搜尋引擎的雛形,供斯坦福大學內部使用。這個搜尋引擎以傳統的搜尋引擎技術為基礎,並引入了PageRank演算法,因此,用它在網際網路中搜尋資訊,得到的結果在相關性上比以往的引擎要優越得多。其他引

本章未完,點選下一頁繼續閱讀。

遊戲小說相關閱讀More+