網頁級別概述

網頁級別(PageRank)
Google搜尋引擎採用的核心軟體稱為 PageRank,這是由Google創始人開發出的一套用於網頁評級的系統,是Google搜索排名演算法中的一個組成部分,級別從1到10級,10級為滿分,PR值越高說明該網頁在搜索排名中的地位越重要,也就是說,在其他條件相同的情況下,PR值高的網站在Google搜索結果的排名中有優先權。網頁級別由此成為Google所有網路搜索工具的基礎。

Google對網頁級別的描述

作為組織管理工具,網頁級別利用了互聯網獨特的民主特性及其巨大的鏈結結構。實質上,當從網頁 A 鏈結到網頁 B 時,Google 就認為"網頁 A 投了網頁 B 一票"。Google 根據網頁的得票數評定其重要性。然而,除了考慮網頁得票數(即鏈結)的純數量之外,Google 還要分析投票的網頁。"重要"的網頁所投出的票就會有更高的權重,並且有助於提高其他網頁的"重要性"。

重要的、高品質的網頁會獲得較高的網頁級別。Google 在排列其搜索結果時,都會考慮每個網頁的級別。當然,如果不能滿足您的查詢要求,網頁級別再高對您來說也毫無意義。因此,Google 將網頁級別與完善的文本匹配技術結合在一起,為您找到最重要、最有用的網頁。Google 所關注的遠不只是關鍵字在網頁上出現的次數,它還對該網頁的內容(以及該網頁所鏈結的內容)進行全面檢查,從而確定該網頁是否滿足您的查詢要求。

PR值演算法原理總體上基於下面2個前提:

1、一個網頁被多次引用,則它可能是很重要的;
一個網頁雖然沒有被多次引用,但是被重要的網頁引用,則它也可能是很重要的;一個網頁的重要性被平均的傳遞到它所引用的網頁。這種重要的網頁稱為權威(Authoritive)網頁。

2、假定用戶一開始隨機的訪問網頁集合中的一個網頁,然後跟隨網頁的鏈結向前流覽網頁,不回退流覽,那麼流覽下一個網頁的概率就是被流覽網頁的PageRank值。