使勁兒提示您:看後求收藏(第9部分,星球Google:我們的生活將怎樣被一家公司徹底改變,使勁兒,630看書),接著再看更方便。
請關閉瀏覽器的閱讀/暢讀/小說模式並且關閉廣告遮蔽過濾功能,避免出現內容無法顯示或者段落錯亂。
一宗大買賣,也無助於樹立起自己的品牌。雅虎的使用者甚至不知道谷歌才是提供搜尋結果的“批發商”,而是以為這些結果都是雅虎找到的。但是這筆交易使谷歌得到了某種比銷路和品牌意識更具戰略價值的東西:它為谷歌提供了大量的搜尋查詢的第一手資料,這是谷歌改進搜尋技術急需的原始材料,有了這項內在的能力,就可能將資料量的增長轉變為搜尋結果質量的提高。
隨著收集的資訊越來越多,佩奇和布林的技術也變得越來越“聰明”,自然,倆人遲早會開始思考如何著手處理無所不包的原始資料。如何使用這些沒有相互聯絡的具體資訊,在當時還沒有被當作最迫切的問題。先收集,後分析。如果這些資訊還沒有被數字化,那麼谷歌就不計成本將其數字化。谷歌最早的網路經驗體現在它比任何公司都更具有蒐集更多資訊的智慧上,它以多種方式讓蒐集資訊的規模受人喜愛,產生交叉檢索、相互參照的更加密集的集合,貢獻出世界上覆雜程度最高的搜尋結果。
谷歌比它的主要競爭物件雅虎和微軟更早就認識到,一個將所有資訊全部網羅殆盡的系統,依靠人工是根本無法完成的。正如人類的思維要依靠協調發展的神經系統內的連線一樣,數字化的資訊蒐集也要依靠以軟體帶動的相互對接,而不必介入人工。軟體的演算法固然是由人制定的,但最終產品的複雜程度遠遠超過了人類憑藉手工所能達到的水平。
在公司建立的過程中,佩奇和布林運用了許多不同的演算法。但在哲學定義上,這些不同的法則卻不屬於物質範疇:谷歌的所有演算法都可以說屬於總的演算法的組成部分,所謂“演算法”就是軟體公式的簡化形式,谷歌的創立者們以為它們是解決任何現存問題的最好手段。他們對演算法的力量堅信不移,因而採取了一種頗引人爭議的推論:由演算法所導致的結果無需以人工介入的方式進行編輯、調整甚至觸控。對於處理世界上的所有資訊的系統進行調節的唯一途徑是將一切過程都自動化。演算法也可以用手動的方式加以調整和改進,但是修補過程只能由演算法在進行搜尋之前自行完成。一旦他們允許對演算法進行復評,並在搜尋完成之後用搜尋結果來修補,這種人工介入就會使系統變慢,使它步履蹣跚。在谷歌,實現規模至高無上,而這必須依靠完全自動化的過程。
在谷歌成立之初,演算法的力量在搜尋業界並未得到廣泛的讚賞。在雅虎-谷歌結盟時期,谷歌似乎不想對任何人擺出競爭姿態。在它的早年,即上世紀末和本世紀初,谷歌還沒有找到明確的發展方向,也無法使人相信自己是一家能夠將全世界的資訊都組織起來的公司。倒是雅虎牢固地樹立了作為值得信賴的資訊來源的形象,似乎完全有可能將自己的任務完成好。作為入口網站,雅虎是許多網路使用者線上訪問的第一個地方,而且公司提供了一目瞭然的服務和資訊。這使它成為使用者必須訪問的最可靠的網站。它提供的內容包括電子郵件、分類廣告、遊戲、新聞、體育、天氣、股票行情以及管理員認為能吸引訪客進來並使他們留下來的一切資訊。
獨步天下的谷歌演算法(3)
如果它的使用者感到有必要搜尋網路,雅虎就能充當一個被公認為最權威的嚮導,因為它是由網站編輯親手編纂的,他們仔仔細細地做著去蕪存菁的工作,為網站整理清單,將內容分門別類層層分級。但是公司的管理層卻不將他們穩定而高質量的網站目錄系統視為值得珍視的戰略財富。公司的觀點與當時流行的看法完全相同,認為網站索引只不過是公共入口網站的一個次要組成部分,三分之二的雅虎訪客都是為了其他目的或尋求其他服務而來。
在雅虎,網路搜尋可以分為兩個互不相干的步驟,當然,其中隱藏著相當的複雜###。第一步,當搜尋詞語提交後,雅虎就對由它自己的編輯們編制的網站名錄中的主題詞表進行查詢,如果搜尋詞與它索引表中的任一詞語相匹配,那麼相關的目錄項就會顯示出來。如果沒有相匹配的結果出來,那麼搜尋就會進入第二個階段,雅虎將這個詞語送到與之訂有契約的外部搜尋引擎上,由後者在它所蒐集和整理的所有網站上的網頁的複製頁中進行查詢。這第二步幾乎被業界的每一個人都視為無趣的幕後服務,這種服務從任何可互換的提供者那裡都可以得到,他們之間並無明顯的差異。一個個看上去都十分相似,所以雅虎也定期更換為它提供幕後服務的公司。
2000年,雅虎決定將分作兩步的搜尋過程合併,並將此項業務交給新的一攬子服務提供商——谷歌。在當時還很弱小的谷歌看來,能以成立剛剛兩年的資格就得到雅虎交付的如此
本章未完,點選下一頁繼續閱讀。