一级黄色视频日b片-一级A片无码高潮-欧美一级A片在线看视频-影音先锋在线亚洲丝袜|www.cinemando.net

首頁 -> 谷歌SEO -> 谷歌優化 -> SEO初探

SEO初探

2018-08-23 谷歌優化 23072

概述:

全稱: SEO是英文Search Engine Optimization的縮寫,中文意譯為"搜索引擎優化" 定義:SEO是指在了解搜索引擎自然排名機制的基礎上,對網站進行內部及外部的調整優化,改進網站在搜索引擎中的關鍵詞自然排名,獲得更多流量,從而達成網站銷售及品牌建設的目標。 通俗的來說就是優化網站以提高搜索引擎的相關搜索排名,從而達到獲取更多流量的技術與過程

為什么要做SEO?

什么是seo?

全稱: SEO是英文Search Engine Optimization的縮寫,中文意譯為"搜索引擎優化" 定義:SEO是指在了解搜索引擎自然排名機制的基礎上,對網站進行內部及外部的調整優化,改進網站在搜索引擎中的關鍵詞自然排名,獲得更多流量,從而達成網站銷售及品牌建設的目標。 通俗的來說就是優化網站以提高搜索引擎的相關搜索排名,從而達到獲取更多流量的技術與過程

為什么要做seo?

  • 搜索流量質量高:主動搜索的用戶基本上都是有相關需求的,這些流量留存率高,轉化率高,是非常優質的流量來源

  • 性價比高:相對于其他宣傳方式,付出的成本低很多

  • 可擴展性:網站可以不停的增加關鍵詞及相關流量

  • 長期有效: 一旦排名提上去,有效期較長

  • 提高網站易用性,改善用戶體驗:seo對頁面的要求很多時候和這兩點是互通的

seo分類?

seo分為白帽,黑帽和灰帽 在搜索引擎優化行業,一些不符合搜索引擎質量規范的優化手法,也就是作弊的SEO手法被稱為黑帽,英文為Blackhat。而正規的符合搜索引擎網站質量規范的就稱為白帽,Whitehat。由于搜索引擎公布的質量規范和準則比較籠統,常常有各種解釋的空間,那些不能被明確歸入黑帽或白帽,介于兩者之間的優化手法就被稱為灰帽SEO(Greyhat)。 seo主要作弊手段

搜索引擎

搜索引擎簡史

為什么要了解搜索引擎

SEO人員優化網站就是盡量減少搜索引擎的工作量、降低搜索引擎的工作難度,使搜索引擎能更輕松、快速地收錄網站頁面,更準確地提取頁面內容。

搜索引擎相關

真正的搜索引擎指的是由蜘蛛程序沿著鏈接爬行和抓取網上的大量頁面,存進數據庫,經過預處理,用戶在搜索框輸入關鍵詞后,搜索引擎排序程序從數據庫中挑選出符合搜索關鍵詞要求的頁面。蜘蛛的爬行、頁面的收錄及排序都是自動處理。(與門戶網站的區別) 發展方向

  • 抓取頁面需要快而全面

  • 海量數據儲存

  • 索引處理快速有效,具可擴展性

  • 查詢處理快速準確

  • 判斷用戶意圖及人工智能

搜索引擎工作原理

搜索引擎的工作過程大致分為三個階段:分別是爬行和抓取,預處理,排名

爬行和抓取

完成數據收集工作

  • 蜘蛛

  • 一個栗子淘寶robots

  • 防君子不防小人

  • 搜索引擎用來爬行和訪問頁面的程序被稱為蜘蛛

  • 蜘蛛程序發出頁面訪問請求后,服務器返回HTML代碼,蜘蛛程序把收到的代碼存入原始頁面數據庫。搜索引擎為了提高爬行和抓取速度,都使用多個蜘蛛并發分布爬行。

  • 蜘蛛訪問任何一個網站時,都會先訪問網站根目錄下的robots.txt文件。如果robots.txt文件禁止搜索引擎抓取某些文件或目錄,蜘蛛將遵守協議,不抓取被禁止的網站

  • 跟蹤鏈接 為了盡可能的抓取更多的頁面,蜘蛛會跟蹤頁面上的鏈接從一個頁面爬到下一個頁面 爬行策略:深度優先和廣度優先相結合

  • 地址庫

  • 人工錄入的種子網站(門戶網站)

  • 蜘蛛抓取頁面后,頁面中的外部鏈接

  • 站長自己提交的網址

  • 為了避免重復爬行和抓取網址,搜索引擎都會建立一個地址庫,記錄還沒有被抓取的網頁和已經被抓取的網頁

  • url來源

  • 大部分主流搜索引擎都提供一個表格,讓站長提交網址。不過這些提交來的網址都只是存入地址庫而已,是否收錄還要看頁面重要性如何。搜索引擎所收錄的絕大部分頁面是蜘蛛自己跟蹤鏈接得到的。可以說提交頁面基本上是毫無用處的,搜索引擎更喜歡自己沿著鏈接發現新頁面。

  • 文件儲存

  • 抓取的網頁放入原始數據庫中,每一個url都有對應的文件編號

  • 爬行時復制內容檢測

  • 蜘蛛在爬行時會進行一定程度的復制檢測,如果有權重很低的網站上有大量轉載和抄襲內容時,該網頁不會被收錄

預處理(索引)

蜘蛛獲取到的原始頁面,不能直接用于查詢排名處理,需要對其進行預處理,為最后的查詢排名做準備

  • 提取文字

  • 從html中的title,p,h1,span標簽中提取文字

  • 除文本文字外,還會提取meta標簽中的文字、圖片替代文字、Flash文件的替代文字、鏈接錨文字。

  • 中文分詞

  • 中文搜索引擎特有步驟

  • 詞典匹配和基于統計兩種方法

  • 去停止詞

  • 的,啊

  • the,of

  • 消除噪聲

  • 根據HTML標簽對頁面分塊,區分出頁頭、導航、正文、頁腳、廣告等區域,在網站上大量重復出現的區塊往往屬于噪聲。

  • 去重

  • 同一博文發布到兩個不同的博文網站

  • 頁面特征關鍵詞計算指紋,也就是說從頁面主體內容中選取最有代表性的一部分關鍵詞(經常是出現頻率最高的關鍵詞),然后計算這些關鍵詞的數字指紋

  • 正向索引

  • 把頁面轉換為一個關鍵詞組成的集合,同時記錄每一個關鍵詞在頁面上的出現頻率、出現次數、格式(如出現在標題標簽、黑體、H標簽、錨文字等)、位置(如頁面第一段文字等


  • 倒排索引

  • 將正向索引的關系轉換過來


  • 鏈接關系計算

  • 鏈接原理

  • 搜索引擎在抓取頁面內容后,必須事前計算出:頁面上有哪些鏈接指向哪些其他頁面,每個頁面有哪些導入鏈接,鏈接使用了什么錨文字,這些復雜的鏈接指向關系形成了網站和頁面的鏈接權重。

  • 特殊文件處理

  • 除了HTML文件外,搜索引擎通常還能抓取和索引以文字為基礎的多種文件類型,如PDF、Word、WPS、XLS、PPT、TXT文件等

排名

用戶在搜索框填入關鍵詞后,排名程序調用索引庫數據,計算排名顯示給用戶,排名過程是與用戶直接互動的

  • 搜索詞處理

  • 中文分詞

  • 去停止詞

  • 指令處理:搜索結果是否全部符合條件

  • 拼寫錯誤矯正

  • 整合搜索觸發:視頻,音頻,咨詢

  • 文件匹配

  • 在倒排索引數據庫中,找到同時符合多個關鍵字的文件

  • 初始子集選擇

  • 搜索出來的結果往往會有幾萬個甚至幾十萬個,當有這么多文件時,不可能計算所有文件的相關性,所有初始子集的選擇會依據于網頁的權重,先選出1000個左右的文件。

  • 相關性計算

  • 關鍵詞常用程度:越常用的關鍵詞在計算相關性時,影響力越小,停止詞就是常用詞的極端,其對頁面相關性幾乎沒有影響

  • 詞頻及密度:頁面中出現關鍵詞的次數越多,相關性越大;但由于這點太容易被鉆空子,所以這一點的重要程度越來越低

  • 關鍵詞的位置及形式:在標題,黑體,h1標簽中的關鍵詞,相關性更高

  • 關鍵詞距離:多個關鍵詞之間的距離越近,相關性越強

  • 鏈接分析及頁面權重:有其他頁面以關鍵詞為錨文字描述該頁面,自身頁面的權重和導入該頁面鏈接的頁面權重

  • 排名過濾及調整

  • 對于有作弊嫌疑的頁面排名有-11,-6,-30等名次的懲罰

  • 廣告置頂

  • 排名顯示

  • 所有排名確定后,排名程序調用原始頁面的標題標簽、說明標簽、快照日期等數據顯示在頁面上

  • 搜索緩存

  • 在搜索領域中,所謂緩存,就是在高速內存硬件設備上為搜索引擎開辟一塊存儲區,來存儲常見的用戶查詢及其結果,并采用一定的管理策略來維護緩存區內的數據。當搜索引擎再次接收到用戶的查詢請求時,首先在緩存系統中查找,如果能夠在緩存中找到,則直接返回搜索結果;否則采取正常的搜索流程來返回搜索結果。緩存技術在目前所有的搜索引擎都采用到。

  • 2/8定律

  • 查詢及點擊日志

  • 搜索用戶的IP地址、搜索的關鍵詞、搜索時間,以及點擊了哪些結果頁面,搜索引擎都記錄形成日志。這些日志文件中的數據對搜索引擎判斷搜索結果質量、調整搜索算法、預期搜索趨勢等都有重要意義。

  • 如果用戶有登錄,這些日志也會影響該用戶之后的排名。

主要優化點

物理及鏈接結構

  • 扁平化的網站結構: 蜘蛛在爬取頁面時會使用深度優先和廣度優先相結合的方式,所以如果層級過多,可能會導致蜘蛛爬不到你的頁面

  • 網站首頁是整個網站權重最高的頁面,與首頁的點擊距離越小,被 spider 爬取的概率和權重也就越大。這也是為什么我們需要將內頁(也就是具體的文章頁面)的首頁點擊距離控制得越小越好。

清晰的導航

清晰的導航系統是網站設計的重要目標。畢竟你肯定不想你的用戶進入你的網站首頁后,面對混亂的導航,難以找到想到的頁面。對于搜索引擎的 spider 也是如此,混亂的導航會降低 spider 爬行概率。 在設置網站導航應該注意下面幾點:

  • 文字導航。盡量使用 HTML 靜態文字作為導航,不要使用 JavaScript 生成的動態導航。這樣對 spider 來說,爬行阻力最小。導航系統鏈接是整個網站收錄最重要的內部鏈接

  • 點擊距離及扁平化。導航的一個目標就是讓所有的頁面與首頁點擊距離越短越好。像權重普通的網站,內頁一般不要超過首頁 4、5 次點擊。所以要盡量在鏈接結構上做到扁平化。

  • 錨文字中包含關鍵詞。導航關鍵詞盡量使用目標關鍵詞。

  • 面包屑導航。對于中大型網站,面包屑是必不可少。它是幫助用戶和搜索引擎建立頁面在網站整個結構中的位置最好的方法。

  • 避免頁腳堆積。近年來對于頁腳堆積關鍵詞的做法似乎不受搜索引擎歡迎了,盡量避免這種做法。

禁止收錄機制

meta robots 標簽 通過  也可以設置禁止搜索引擎索引本頁的內容,禁止跟蹤本頁的鏈接。其中 content 的參數有:

noindex: 不索引本頁內容
nofollow:不追蹤本頁鏈接
nosnippet:不要在搜索結果中顯示說明文字
noarchive:不要顯示快照
noodp:不要使用開放目錄中的標題和說明

每個參數中間需要已逗號隔開。 nofollow 標簽 <a href="" rel="nofollow">nofollow</follow> nofollow 標簽是由 Google 領頭創新的一個“反垃圾鏈接”的標簽,并被市場上其他主流搜索引擎廣泛支持。nofollow 是 a 標簽的一個屬性值。用于告訴搜索引擎不要追蹤此鏈接,因為這個鏈接不是作者所信任的。這里的 nofollow 與上面說的 meta 標簽上的 nofollow 區別在于:a 標簽上的 nofollow 是指單個鏈接,而 meta 上的 nofollow 是指整個頁面所有的鏈接。 nofollow 通常用于博客評論、論壇帖子、社交網站、留言板等地方。因為這些地方的內容都是用戶可以自由留下鏈接,站長并不知道這些鏈接是否可信。經過測試發現,你在 segmentfault 或者掘金發表文章時,文章的外部鏈接都會加上 rel="nofollow"。 同時對于網站內部一些重復內容的頁面或者是一些無需被收錄的鏈接都可以加上該標簽,可以防止網站權重浪費。比如像聯系我們、隱私政策等頁面,就可以使用 nofollow 標簽了。

內部鏈接及權重分配

一個網站的首頁權重是最高的,接著是二級分類頁面,與我們前面提到的鏈接結構一樣,也是成一個樹結構。內部權限分配有幾個原則:

  • 重點內頁可以通過直接鏈接到首頁提高權重

  • 非必要頁面設置 nofollow 不分散權重

錨文字對于內部權限分配也是非常重要的一個手段。這方面 維基百科絕對是做得最好的。

404頁面

當訪問的頁面不存在時,需要一個專門的 404 頁面。404 頁面的設計需要注意幾點:

  • 保持與網站統一的風格

  • 應該在醒目的位置顯示錯誤信息,明確提示用戶,訪問的頁面不存在。

  • 錯誤頁面還可以提供幾種跳轉:比如回到首頁和其他你引導讓用戶訪問的鏈接

404 頁面與外鏈的一個小技巧 由于搜索引擎并不會無緣無故得爬行一些不存在的原因的。肯定是有外部鏈接指向這些地址,比如別人的博客頁面引用等,而原文可能你已經刪除或者更換 url 了。所以我們可以通過 Google 網站站長工具發現我們網站存在的錯誤鏈接,將錯誤地址做 301 跳轉到正確的頁面或者直接在本來不存在的 URL 上新建一個頁面,接收這些外部鏈接的權重

標簽的合理使用

語義化

語義化、簡潔、結構化的代碼更加有利于突出重點和適合搜索引擎抓取。

唯一的H1標題

每個頁面都應該有個唯一的h1標題,但不是每個頁面的h1標題都是站點名稱。(但html5中h1標題是可以多次出現的,每個具有結構大綱的標簽都可以擁有自己獨立的h1標題,如header,footer,section,aside,article)

首頁的h1標題為站點名稱,內頁的h1標題為各個內頁的標題,如分類頁用分類的名字,詳細頁用詳細頁標題作為h1標題

<!-- 首頁 --><h1 class="page-tt">騰訊課堂</h1><!-- 分類頁 --><h1 class="page-tt">前端開發在線培訓視頻教程</h1><!-- 詳細頁 --><h1 class="page-tt">html5+CSS3</h1>

img設置alt屬性

蜘蛛爬取不到圖片 img必須設置alt屬性,如果寬度和高度固定請同時設置固定的值

<img src="" alt="seo優化實戰" width="200" height="100" />

TDK優化

TDK,即 title, description, keywords。

title

在SEO中,標題的優化占著舉足輕重的地位,無論是從用戶體驗的角度出發,還是從搜索引擎的排名效果出發,title都是頁面優化最最重要的因素。 title的分隔符一般有,,_,-和空格。其中_對百度比較友好,而-對谷歌比較友好,空格在英文站點可以使用但中文少用。

推薦做法:

每個網頁應該有一個獨一無二的標題,切忌所有的頁面都使用同樣的默認標題 標題要主題明確,包含這個網頁中最重要的內容 簡明精練,不羅列與網頁內容不相關的信息 如果你的文章標題不是很長,還可以加入點關鍵詞進去,如文章title_關鍵詞_網站名稱 用戶瀏覽通常是從左到右的,重要的內容應該放到title的靠前的位置 使用用戶所熟知的語言描述。如果你有中、英文兩種網站名稱,盡量使用用戶熟知的那一種做為標題描述 示例:

<title>阿里巴巴1688.com - 全球領先的采購批發平臺,批發網</title><title>京東(JD.COM)-正品低價、品質保障、配送及時、輕松購物!</title>

description

description不是權值計算的參考因素,這個標簽存在與否不影響網頁權值,只會用做搜索結果摘要的一個選擇目標。用戶極有可能通過網站的摘要來決定是否瀏覽該網站。

推薦做法:

網站首頁、頻道頁、產品參數頁等沒有大段文字可以用做摘要的網頁最適合使用description 準確的描述網頁,不要堆砌關鍵詞 為每個網頁創建不同的description,避免所有網頁都使用同樣的描述 長度合理,不過長不過短(最好在100-150個字符,對應中文就是50到75個漢字)。 示例:

<meta name="description" content="阿里巴巴(1688.com)批發網是全球企業間(B2B)電子商務的著名品牌,為數千萬網商提供海量商機信息和便捷安全的在線交易市場,也是商人們以商會友、真實互動的社區平臺。目前1688.com已覆蓋原材料、工業品、服裝服飾、家居百貨、小商品等12個行業大類,提供從原料--生產--加工--現貨等一系列的供應產品和服務。"
 /><meta name="description" content="京東JD.COM-專業的綜合網上購物商城,銷售家電、數碼通訊、電腦、家居百貨、服裝服飾、母嬰、圖書、食品等數萬個品牌優質商品.便捷、誠信的服務,為您提供愉悅的網上購物體驗!" />

keywords

  • keywords在搜索排名的權重不高,但是合理的設置,可以提高關鍵字的密度及優化搜索結果頁的體驗。通過加大關鍵詞的密度,從而提高關鍵詞在搜索引擎的排名,是SEO優化的一個常用手段。

  • SEO的核心思想是每個頁面抓住幾個關鍵字(一般不超過5個)進行核心優化,所以設定與本頁內容相關的主關鍵詞一到三個就可以了。關鍵字之間用英文狀態下的逗號分割,不要再濫用關鍵字,這會給搜索引擎不好的印象。

示例:

<meta name="keywords" content="阿里巴巴,批發網,1688,批發市場,批發,采購,微商,微店,貨源"/>

鏈接URL

統一URL

http://www.domainname.com http://domainname.com http://www.domainname.com/index.html http://domainname.com/index.html 以上四個其實都是首頁。雖然不會給訪客造成什么麻煩,但對于搜索引擎來說就是四條網址,并且內容相同,很可能會被誤認為是作弊手段。而這四個頁面的權重會被分散掉。

301跳轉

URL發生改變,一定要把舊的地址301指向新的,不然之前做的一些收錄權重什么的全白搭了。

SEO工具

  • 百度搜索風云榜

  • 百度指數

  • 百度站長平臺

  • meta seo inspector,檢查標簽的,谷歌插件

  • seo in china,百度收錄的各種數據,谷歌插件

  • check my links,檢查鏈接,谷歌插件

  • seo quake,統計各種數據,谷歌插件