白帽SEO(White hat SEO)
1
白帽SEO是通過正規優化手法,來對網站進行優化,是符合搜索引擎優化的規則。它與黑帽SEO是相反,它是業界主流的優化手法,避免了一切風險進行操作的優化手法。雖然白帽SEO見效時間周期要長,但往往成功后,就可以穩定的帶來流量,它也是SEO從業者最高道德標準。
黑帽SEO(Black hat SEO)
2
對于黑帽SEO來說,籠統的可以把任何作弊,投機取巧的優化手法成為黑帽SEO,例如:隱藏錨文本,堆砌關鍵詞,橋頁面,購買鏈接等等。
黑帽SEO來說,風險過大,一般也就只有一些暴利產品會使用,一般被發現就會面臨整站被K的風險。新手SEOer們可要千萬留意了
中文分詞
3
對于中文分詞,有些人也許很少聽說,這個一般是由技術進行操作,我們只需要懂得有這么個說法即可。
中文分詞,在搜索引擎抓取判斷頁面內容過程中,會將中間沒有空格的、連續的中文字符序列,分隔成一個一個單獨的、有意義的單詞的過程。那么搜索引擎在獲取頁面、用戶輸入的關鍵詞文章內容時都會優先進行分詞。
分詞技術運用的地方很多,只要是涉及到搜索的過程,都會運用到,例如:站內搜索,每個網站都會有搜索,只是分詞及排序的機制邏輯不一樣,本質是一樣;在網站中還有一個地方也會用到分詞搜索,那就是每個頁面的“相關推薦”,好的相關推薦,不僅僅是根據用戶習慣進行推薦,還有根據頁面主體內容,進行推薦。在技術層面都是進行搜索推薦。
網絡爬蟲
4
網絡爬蟲,在SEO中又可以叫搜索引擎蜘蛛、網絡機器人等。本質上是一種按照一定規則,來爬取互聯網信息的腳本與程序。搜索引擎蜘蛛抓取內容機制后期,在詳細講解。
排名
5
有很多朋友都不怎么清楚SEO是干什么的,聽起來挺高大上的,其實,也只有真的入了這行才知道。
排名,對于SEO來說,可以說是一個直接目標,不斷優化關鍵詞頁面在搜索結果頁面的排名,來獲取更多的流量。
搜索結果頁面
6
搜索結果頁面,就是指當用戶輸入關鍵詞,點擊搜索后,出來的結果頁面。SEO所做的一切就是讓自己網站的頁面盡可能的排在搜索結果頁面前面,讓更多的用戶看到,并點擊進來。
索引
7
索引,是搜索引擎蜘蛛在存儲互聯網每個詞及頁面位置的過程,搜索索引庫是搜索引擎的數據庫,任何一個搜索引擎都有自己獨特設計的數據庫,我們優化的每個頁面都需要先被搜索引擎索引并存儲在索引庫中,才能展現給用戶,所以,這也是關鍵的一步。
索引庫
8
在上面已經說到過索引庫,他的重要性,相信大家也有了新的認識,雖然平時接觸的不多,但也是不可忽視的存在。
索引庫,搜索引擎的數據庫,在庫中每個關鍵詞都會有很多對應的頁面,當獲取用戶搜索詞時,會對搜索詞進行分詞,在到索引庫中進行匹配,最后,按照一定規則把匹配到的內容展示給用戶。
蜘蛛程序
9
蜘蛛程序,也稱為機器人,指搜索引擎運行的程序,沿著發現的鏈接/域名/ip等進行發現和爬取更多的頁面,抓取收集相關頁面的內容,并把這些內容收錄到索引庫中。
人工智能,大家都不陌生的詞,相信將來的一天會運用到搜索引擎中,那時,不知道我們SEOer該何去何從。
蜘蛛程序通道
10
蜘蛛程序通道,這個通道也就是URL,蜘蛛程序是順著URL來發現新頁面的,所以,我們為了讓蜘蛛能夠發現我們網站更多頁面,一般我們會做網站地圖(html、xml、txt等格式)、網站外鏈(友情鏈接也包含),百度URL自動推送程序等等,這些都是建立一個讓搜索引擎蜘蛛程序通道,讓它盡可能快的發現網站的頁面。
蜘蛛陷阱
11
蜘蛛陷阱,指由于網站結構或程序邏輯技術等特征,使蜘蛛陷入無限循環無法停止抓取,并返回。以前最典型的就是萬年歷,讓蜘蛛無限制的抓取下去,但并不能把抓取的內容返回到搜索數據庫中。
robots協議
12
Robots協議(也稱為爬蟲協議、機器人協議等)的全稱是“網絡爬蟲排除標準”(Robots Exclusion Protocol),網站通過Robots協議告訴搜索引擎哪些頁面可以抓取,哪些頁面不能抓取。
文件寫法
User-agent: * 這里的*代表的所有的搜索引擎種類,*是一個通配符
Disallow: /admin/ 這里定義是禁止爬尋admin目錄下面的目錄
Disallow: /ask/ 這里定義是禁止爬尋ask目錄下面的目錄
Disallow: /ABC/ 這里定義是禁止爬尋ABC目錄下面的目錄
Disallow: /cgi-bin/*.htm 禁止訪問/cgi-bin/目錄下的所有以".htm"為后綴的URL(包含子目錄)。
Disallow: /*?* 禁止訪問網站中所有包含問號 (?) 的網址
Disallow: /.jpg$ 禁止抓取網頁所有的.jpg格式的圖片
Disallow:/ab/adc.html 禁止爬取ab文件夾下面的adc.html文件。
Allow: /cgi-bin/ 這里定義是允許爬尋cgi-bin目錄下面的目錄
Allow: /tmp 這里定義是允許爬尋tmp的整個目錄
Allow: .htm$ 僅允許訪問以".htm"為后綴的URL。
Allow: .gif$ 允許抓取網頁和gif格式圖片
Sitemap: 網站地圖 告訴爬蟲這個頁面是網站地圖
沙盒效應
13
沙盒效應,這主要是搜索引擎對于新站處理觀察的方法,往往新站流量過于快速增長,就會觸發沙盒效應。
目前百度站長工具中,只要是認證的新站,都有一個新站保護功能,這個功能可以包含新站的頁面快速被收錄,但是頁面排名還需觀察,可以說百度現在功能越來越完善化了,以前往往為新站收錄而發愁,還沒有試的同學可以去試試。
Cloaking-障眼法
14
隱藏頁(Cloaking)、偽裝、障眼法,這是一個典型的作弊手法,在SEO中指做兩套頁面,一個只給搜索引擎抓取,另一個給用戶查看,典型的欺騙用戶和搜索引擎,目前搜索引擎對此類手法已經有很高的識別度,所以,同學千萬別以身試法哦。
隱藏文本
15
一種作弊手法,通過技術讓網站頁面上的內容不被用戶看到,例如:相關文字可以把字號變的極小,文字顏色與背景顏色一致,或是用某個頁面元素覆蓋在上面等手法,達到欺騙用戶,提高頁面關鍵詞密度,提升頁面排名。
此方法,百度已經能夠準確的識別出來,所以,此方法不能使用哦。
頁面劫持
16
頁面劫持也是一種作弊手法,通常為用戶本應該訪問A頁面,但訪問進去后卻跳轉到其他頁面,302跳轉或是js跳轉等通常是用來實現頁面劫持的手法。
現在頁面劫持,新生出來的名詞有:域名劫持、快照劫持、權重劫持、瀏覽器劫持、寬帶劫持等。
隱藏的鏈接
17
隱藏鏈接,跟隱藏文本差不多,也是作弊的手法之一,現在黑鏈一直都存在,利用黑帽SEO手段,在其他高權重網站隱藏自己網站的鏈接,到達權重傳遞,引蜘蛛抓取。
所以,網站安全、服務器安全一定要注意,定期查看網站友情鏈接,及百度快照,發現異常時,及時處理。
整合搜索
18
整合搜索即內容搜索、圖片、視屏搜索等搜索結果整理在一起,在搜索引擎的顯示區塊內顯示出來。
對于整合搜索,我在這可以強調下,并不僅僅應用到搜索引擎,我們自己站內的搜索,也是可以這樣操作,這種頁面往往要比其他頁面更有價值,但前提要有技術支持,要不然出來的頁面很可能是低級垃圾頁面。
鏈接
19
對于這個大家應該都好理解。鏈接也稱超級鏈接,是指從一個網頁指向一個目標的連接關系,所指向的目標可以是另一個網頁,也可以是相同網頁上的不同位置,還可以是圖片、電子郵件地址、文件、甚至是應用程序。
鏈接分析
20
對于鏈接分析,我只想說,當蜘蛛發現一個鏈接時,都會該鏈接指向頁面進行綜合分析,這種分析不僅僅依靠該鏈接錨文本、還有該頁面TDK、頁面內容,其他指向該頁面的鏈接及頁面綜合分析(也許還有其他判斷邏輯)
鏈接農場
21
在SEO中,鏈接農場是很早的一種作弊手法,就是在一個頁面中存在大量的鏈接,很早處于googleSEO中,讓谷歌認為被鏈接的頁面很有價值,從而提升排名,現在也多用于引導蜘蛛抓取被鏈接的頁面,從而提高頁面被收錄的幾率。
目前百度也對鏈接農場有很強的識別能力,所以,別以身犯險,也要注意,一個頁面的導出鏈接數量,要控制在一定數量內哦。
雙向鏈接
22
雙向鏈接,也可以稱為相互鏈接,是指一個頁面不僅僅鏈接了另一個頁面,另一個頁面也同樣鏈接該頁面。最典型的就是友情鏈接。
反向鏈接
23
反向鏈接,是指一個頁面B鏈接到頁面A,那么A的反向鏈接就是B頁面。在SEO實際應用中,也是很有價值的存在,通過頁面B的錨文本及頁面內容的描述,可以讓搜索引擎快速知道頁面A主要講的是什么內容,由于這個因素的存在,我們在做外鏈時,就應該時刻注意錨文本及該頁面內容或是該網站主要是什么類型/意思。
單向鏈接
24
單向鏈接,指一個頁面上的鏈接指向另一個頁面,但另一個頁面并沒有回源鏈接。
在早期時,單向鏈接是很受歡迎的一種外鏈形式。因為鏈接是可以傳遞權重,參與權重投票,這也是我們原來外鏈為皇的時代,大量發布外鏈的因素之一。(平時做的外鏈也是單向鏈接)
付費鏈接
25
付費連接,是指用金錢去購買鏈接?,F在多數是指購買友情鏈接,雖然百度嚴厲打擊買賣友情鏈接,但現在還是有很多網站在購買鏈接,這種購買的鏈接都是單向鏈接。
競價排名
26
競價排名,是用戶向搜索引擎付一定費用后,保證付費結果在搜索結果頁面有一定的排名展示。就是我們常說的SEM競價推廣,該排名由于是付費,所以展現出來的位置,形式,都有別于自然排名(SEO排名)。
競價排名,速度快,流量大,效果立竿見影。所以,現在一般企業都會做競價推廣。
自然排名
27
自然排名,與付費排名及廣告無關,是依靠頁面自身相關性,權重,重要性展現在搜索結果頁面。
自然排名與付費排名,在搜索結果頁面上有一個很大的區別就是:付費排名網站有“廣告”兩個字,而自然排名沒有。
站點地圖(site map)
28
站點地圖,一般有三種形式:Html、TXT和XML形式。
HTML格式,一般都是直接展示在網站中,該頁面聚合整站所有重要頻道、目錄、分類等內容的頁面,也可以稱為導航頁面。
TXT與XML格式,一般是通過技術手段,把整站的所有鏈接,存放在一個或多個TXT/XML格式的文件中,在有我們通過站長平臺向搜索引擎提交該文件,再由搜索引擎派蜘蛛通過文件中的鏈接對頁面進行爬取。
網站日志(web log)
29
網站日志,是記錄服務器接收處理請求及運行狀態等各種原始信息的以log結尾的文件,準確的來說也是服務器日志。
網站日志對于做SEO來說,可以清楚的看到用戶和蜘蛛的訪問情況,瀏覽了哪些頁面、及哪些頁面有問題,是否是404、是否是500、301等,當網站出現嚴重問題時,就可以查看網站日志,進行分析。
當然了,平時也可以通過分析網站日志得出蜘蛛抓取每個頻道頁面的次數,抓取數量占比,抓取狀態如何等等,為后期做優化調整提供有利的數據支撐。
著陸頁
30
著陸頁,一般是指潛在用戶點擊廣告或者利用搜索引擎搜索后顯示給用戶的網頁。一般這個頁面會顯示和所點擊廣告或搜索結果鏈接相關的擴展內容,而且這個頁面應該是針對某個關鍵字(或短語)做過搜索引擎優化的頁面。
網頁快照(Cache)
31
搜索引擎在收錄網頁時,對網頁進行備份,存在自己的服務器緩存里,當用戶在搜索引擎中點擊“網頁快照”鏈接時,搜索引擎將Spider系統當時所抓取并保存的網頁內容展現出來,稱為“網頁快照”。
網頁快照,對于SEO優化者來說是一個重要的參考因素,所以,有些網站屏蔽搜索引擎建立網頁快照的方法是不可取的。通過網頁快照,我們可以知道搜索引擎抓取頁面時,該頁面的情況,也可以通過網頁快照來分析網站索引下降、被K等問題。
內部優化
32
內部優化,一般是指針對網站頁面進行SEO優化的行為,例如:優化頁面TDK、頁面布局、版塊邏輯及用戶體驗等。
網站標簽(TAG)
33
網站標題(Tag)是互聯網組織內容的一種方式,通過相關性很強的關鍵詞聚合網站所有相關的內容形成的TAG頁面,便于用戶閱讀和分享。
網站標簽頁面,也是SEO優化中一個非常重要的手段之一,也稱為聚合頁面,通過很多關鍵詞,利用技術,把整站相關的內容都聚合到一起,展示給用戶。由于網站標簽頁面相關性很強,往往在搜索引擎排名中占據靠前的位置。
標題、關鍵詞及描述
34
學SEO時,首先接觸到的就是這個頁面標題、關鍵詞和描述的優化。在這里我主要說以下幾點,需要大家平時要多注意:
1、標題,一定要跟頁面內容主體相符合,百度對標題作弊查的很嚴,大家可以參考我最近寫的【思考】百度新推出“網頁標題作弊詳解”文章,也許會給你帶來想不到的靈感。
2、關鍵詞,一定要圍繞標題來進行選擇,且不宜過多,并選擇的關鍵詞之間要有所關聯(除非你是大型網站的首頁,例如:騰訊首頁,關鍵詞之間沒有什么關聯)
3、描述,一定是圍繞關鍵詞來進行描述的一段話,這里不要堆砌關鍵詞,語句要通順。
4、針對有些頁面,不知道怎么寫關鍵詞和描述,那么這兩個地方可以為空,例如:分頁、翻頁的關鍵詞及描述。
關鍵詞密度
35
關鍵詞密度(Keyword Density)與關鍵詞頻率(Keyword Frequency)所闡述的實質上是同一個概念,用來量度關鍵詞在網頁上出現的總次數與其他文字的比例,一般用百分比表示。相對于頁面總字數而言,關鍵詞出現的頻率越高,關鍵詞密度也就越大。
在剛開始興起SEO優化時,堆砌關鍵詞,提高頁面關鍵詞密度,是提高頁面排名有效的方法之一。不斷目前隨著搜索引擎技術的提高,此方法已經漸漸失效,甚至會起到反效果。
因此,同學們就不用在打關鍵詞密度的主意了,做到頁面關鍵詞出現自然,而不是刻意出現。
錨文本
36
錨文本,在剛學SEO時,就會重點提到的一個詞匯。錨文本又稱錨文本鏈接,是鏈接的一種形式。和超鏈接類似,超鏈接的代碼是錨文本,把關鍵詞做一個鏈接,指向別的網頁,這種形式的鏈接就叫作錨文本。
錨文本其實是在告訴搜索引擎和用戶,該鏈接頁面主要講的是什么內容,也是搜索引擎判斷鏈接頁面內容重要參考因素之一,因此,要好好利用,但不能作弊哦。
關鍵詞堆積
37
關鍵詞堆積,是在一個頁面中多次無意義的出現同一個詞,來提高關鍵詞密度,從而讓搜索引擎誤認為該頁面主要內容與關鍵詞相關性很高,來提高搜索排名。
目前,搜索引擎對關鍵詞堆積識別能力有所提升,所以,同學可別犯這種低級的錯誤了。
META標簽
38
通常所說的META標簽,是在HTML網頁源代碼中一個重要的html標簽。META標簽用來描述一個HTML網頁文檔的屬性,例如作者、日期和時間、網頁描述、關鍵詞、頁面刷新等。
META都是在頁面Html的HEAD中,以“<meta”為開頭,以“>”為結尾,中間放相關屬性。
Meta標簽,在SEO實際優化中,也占據很重要的位置,例如防止頁面被轉碼,告訴搜索引擎該頁面是移動/PC頁面等,都需要添加相對應的Mtea標簽。
301永久重定向
39
頁面永久性移走(301重定向)是一種非常重要的“自動轉向”技術。網址重定向最為可行的一種辦法。當用戶或搜索引擎向網站服務器發出瀏覽請求時,服務器返回的HTTP數據流中頭信息(header)中的狀態碼的一種,表示本網頁永久性轉移到另一個地址。
在SEO優化實際應用中,301重定向,是一個很重要的功能。例如:URL變化、域名改變等,只要涉及到URL變動時,都需要做301重定向,指向新的URL。
往往技術修改URL后,就會忘記做該操作,或是用302,而不是用301重定向進行頁面跳轉。
302臨時重定向
40
302重定向又稱之為302代表暫時性轉移,也被認為是暫時重定向,一條對網站瀏覽器的指令來顯示瀏覽器被要求顯示的不同的URL,當一個網頁經歷過短期的URL的變化時使用。一個暫時重定向是一種服務器端的重定向,能夠被搜索引擎蜘蛛正確地處理。
302一般應用到頁面臨時需要跳轉到某個頁面時,才會使用。當搜索引擎識別是302時,搜索引擎會過段時間再來識別,如果是301,則搜索引擎會把新的URL在它自己的數據庫中替換掉舊的URL。
域名解析
41
域名解析是把域名指向網站空間IP,讓人們通過注冊的域名可以方便地訪問到網站的一種服務。IP地址是網絡上標識站點的數字地址,為了方便記憶,采用域名來代替IP地址標識站點地址。域名解析就是域名到IP地址的轉換過程。域名的解析工作由DNS服務器完成。
域名解析也叫域名指向、服務器設置、域名配置以及反向IP登記等等。說得簡單點就是將好記的域名解析成IP,服務由DNS服務器完成,是把域名解析到一個IP地址,然后在此IP地址的主機上將一個子目錄與域名綁定。
域名解析一般做SEO的應該都會遇到,因為想做SEO,一定會有自己的網站,那時候就會遇到域名解析操作,網上有很多教程,在這就不多說了。
死鏈接
42
死鏈接是網站建設中的專業術語,也就是無效鏈接,就是那些不可達到的鏈接。通常訪問該頁面時,會返回一個404頁面。
對于死鏈接,在SEO實際操作中,要注意,當你訪問死鏈接時,網站一定要返回一個404頁面,并且要查詢該死鏈接的HTTP狀態碼是否為404。如果不是,則需要技術盡快修改。
網站優化過程中,會經過多次改版優化,就很容易出現原有的頁面404,但該頁面還在其他頁面存在入口,那么這時,一定要讓技術,把該入口給刪除,避免搜索引擎進行抓取。
網站鏡像
43
網站鏡像,通過技術手段復制整個網站或部分網頁內容并分配以不同域名和服務器,以此欺騙搜索引擎對同一站點或同一頁面進行多次索引的行為,這既是為什么有的網站注明禁止未授權不得做網站鏡像的原因了,兩個網站的內容完全一樣,相似度過高必然會導致自己的網站受到影響。
網站降權
44
是指搜索引擎對網站評定的級別下降,是搜索引擎對網站進行的一種處罰方式。通常多為網站自身作弊導致的,改正錯誤一段時間后會自行恢復。
網站降權,通常表現為,關鍵詞排名大幅度下降,流量急劇下降,但搜索頁面還是存在,這說明指是輕度懲罰,如果更嚴重的則是網站被K,則在搜索該網站時,是看不到該網站(也就是該網站的頁面內容,已經在搜索引擎數據庫中除名)
404頁面
45
404頁面是客戶端在瀏覽網頁時,服務器無法正常提供信息,相關信息已經不存在,而返回的頁面。
404頁面的優化,有利于減少網站用戶的流失,引導用戶訪問其他頁面。
XML
46
可擴展標記語言,標準通用標記語言的子集,是一種用于標記電子文件使其具有結構性的標記語言。
對于SEO來說,該文件一般都是應用在網站地圖上,需要技術進行編寫,我們只需要把該文件的URL,提交給百度,讓百度去抓取該文件里面的URL即可。
Cookie
47
Cookie(通常叫瀏覽器緩存),有時也用其復數形式 Cookies,指某些網站為了辨別用戶身份、進行 session 跟蹤而儲存在用戶本地終端上的數據(通常經過加密)。
對應SEOer只需要知道即可,方便我們在與技術進行溝通,多掌握些技術術語也是非常有必要的。
Css、Js
48
CSS,層疊樣式表是一種用來表現HTML(標準通用標記語言的一個應用)或XML(標準通用標記語言的一個子集)等文件樣式的計算機語言。CSS不僅可以靜態地修飾網頁,還可以配合各種腳本語言動態地對網頁各元素進行格式化。
JS,JavaScript一種直譯式腳本語言,是一種動態類型、弱類型、基于原型的語言,內置支持類型。它的解釋器被稱為JavaScript引擎,為瀏覽器的一部分,廣泛用于客戶端的腳本語言,最早是在HTML(標準通用標記語言下的一個應用)網頁上使用,用來給HTML網頁增加動態功能。
HTTP狀態碼
49
HTTP狀態碼(HTTP Status Code)是用以表示網頁服務器HTTP響應狀態的3位數字代碼。
最常見的都有:200、301、302、404、500,這幾種。在SEO實際應用中,分析網站日志,查看代碼時都要注意該狀態碼。
用戶體驗度優化(UEO)
50
用戶體驗優化就是把你的網站針對于用戶的體驗來進行優化,面對用戶層面的網站內容性優化,本著為訪客服務的原則,改善網站功能、操作、視覺等網站要素,從而獲得訪客的青睞,通過優化來提高流量轉換率。
用戶體驗優化,在SEO實際應用中,尤其要重點關注,在SEO優化中已經逐漸占據主導地位。