最近有朋友問我,他們的網站上線一個月了,但只被百度收錄了首頁,讓我幫忙看看在SEO方面有什么問題。我粗略看了一下,就發現了好幾個致命問題,比如robots.txt不規范、頁面title重復度過高以及網頁h1標簽存在濫用,不經過SEO優化就上線的網站當然不會有好的收錄和排名,那么一個網站上線前應該做哪些SEO工作呢?
新網站上線的第1個月,百度是會給予特別關照的,也就是說如果上線前做好了SEO優化并且在這一個月好好表現,百度是會給這個網站很好的展現機會的。對于上線前,除了網站BUG的檢查之外,下面這些SEO注意事項一定要把好關。
1、網站服務器(砸錢)
服務器是網站的載體,服務器的穩定性影響著網站的打開體驗,同樣也影響著網站在搜索引擎蜘蛛前的表現。一個穩定快速的服務器是網站體驗好的前提,這個錢一定不能舍不得花。
選擇服務器,需要考慮的是服務器空間大小、服務器帶寬,以及域名解析服務器(DNS服務器)的選擇。服務器空間影響的是網頁文件的存儲和數據庫的數據量,帶寬越大則網站打開速度越快(前提是網頁已經做過優化,不然一個BUG也會讓極速的服務器慢如蝸牛),DNS服務器影響的是域名指向服務器網頁的時間。一般情況下DNS服務器我們不用額外花費,使用空間商默認的就好;空間大小視網頁文件量而定,不用提前買太大,后期隨時可以升級擴容;寬帶是越高越好但是也越貴,這個量力而行吧。
2、網站結構檢查
網站上線前要對結構和URL進行檢查,不能有死鏈,也最好不要有層次特別深的頁面。搜索引擎喜歡扁平化的網站,所以盡量不要讓文件夾層次超過三層,URL深度也盡量保證在三層以內,不然蜘蛛會找不到回家的路哦?。╰ips:三層文件夾指:wwwroot/a/b/index.html;三層鏈接深度指www.abc.com/a/b/index.html)
死鏈是絕對禁止的,尤其要保證首頁不出現死鏈。
3、網頁代碼檢查
這里面分兩部分。一是關鍵詞標簽檢查,另一部分是代碼規范檢查。
(1)關鍵詞標簽
影響SEO效果的關鍵詞標簽主要有:title標簽、meta中的keywords和description標簽,body中的h1、h2標簽,以及鏈接a標簽、加粗strong標簽和圖片說明alt屬性。
最重要的則是頁面標題title和頁面H1兩個標簽了,每個網頁只允許出現一次title和h1,并且title和h1要內容一致且全站唯一(tips:一個網站中不要有2個以上網頁使用相同的title和h1)。title一定要包含關鍵詞,這個會顯示在搜索引擎結果頁面。description要與頁面主題保持一致并且包含頁面關鍵詞,也是有機會出現在搜索結果頁面的,keywords可有可無,但不要亂寫。
圖片alt屬性是用于給搜索引擎解釋圖片含義的,這里可以加關鍵詞,但是也盡量和圖片內容保持一致。
需要注意的是,任何位置的關鍵詞都不要連續重復出現,堆砌關鍵詞是有風險的,我們完全可以通過正規優化手段來達到我們想要的排名。
(2)代碼規范檢查
代碼規范,一是要保證代碼精練不冗余,再就是保證加載先后不沖突。前端多余的代碼不要保留,注釋代碼能刪就刪,CSS要先載入,JS要盡量后置(一些特效或交互功能的JS除外)。
4、網站速度優化
第一步我們選擇服務器的時候,就提過網站速度的問題。不過除了服務器硬件和帶寬對網站速度的影響,還有這些也影響網站的打開速度。
(1)網站程序
我們的網站通常都是動態網站,用戶看到的網頁都是用程序動態生成的,程序運行的速度(時間復雜度)會影響網頁生成的時間,從而對用戶看到頁面的時間也會產生影響,所以我們需要對程序運行速度優化。
通常情況下靜態網頁會比動態網頁打開速度快,靜態網頁是用戶訪問前就生成的,比動態網頁在用戶訪問量才生成少了一個過程。不過靜態網頁在修改時比較麻煩(需要覆蓋原網頁),而且占據服務器空間更多。
(2)網頁元素體積和數量
用戶輸入域名找到服務器后,服務器會打開指定的網頁同時根據網頁的代碼引用相關的元素(CSS、JS、圖片、視頻等)我們需要對這些內容進行合并或復用以減少請求次數。
(3)網站壓縮
這個很簡單,一般服務器都是支持一鍵開啟網站GZIP壓縮的,開啟后可以大大減少網頁的傳輸量,省流量的同時還可以提升打開速度。
5、URL優化
上面我們提到過URL深度不要超過三層,也提到了靜態網頁打開速度快。沒錯,搜索引擎更偏愛靜態的URL,動態的URL因為帶有太多的參數而讓蜘蛛頭昏腦脹。所以我們要盡量減少URL中的包含的參數并盡可能讓搜索引擎認為是一個靜態網頁,如何做呢?URL偽靜態。
URL偽靜態是把動態的URL靜態化,從而去掉URL中的"?"、"&"等符號,生成以.html或.shtml結尾或以文件夾結尾的URL結構,就像本網頁一樣(http://www.xaszfyks.com/16.html)
當然可能會有一些不方便進行URL偽靜態的網站,也要一定保證URL唯一,不要多個URL對應同樣的網頁內容,會被判定為過多重復頁面從而被降權的。必要的時候使用rel="canonical" 來規范頁面的標準版本,該代碼指向的網頁將會被搜索引擎計算權重。
另外,如果網站同時有PC版和移動版,要在移動版中使用rel="canonical"指向其PC版本(URL適配),從而讓移動版也獲得PC版的權重。
6、網站內容
上線的時候,網站一定不能是空的。內容要事先填寫一部分,同時要保證內容的原創度和時效性。首頁和每個欄目頁都要保證一定的內容量,并且每個網頁的文字量不要太少。
7、網站地圖
我們雖然強調內鏈通暢,但還是建議給網站生成一份網站地圖放在根目錄,方便向搜索引擎提交和被主動抓取。網站地圖主要有三種:xml格式的、html格式的和txt格式的,推薦使用xml格式的地圖文件。這個地圖文件是要經常更新的,地圖中的鏈接要和網頁中的鏈接保持一致。
8、robots協議(蜘蛛文件)檢查
robots.txt是蜘蛛發現網站域名后首先檢查的文件,該文件可以聲明網站中哪些頁面允許被搜索引擎抓取,哪些不允許,同時可以指定搜索引擎。所以我們一定要把想被用戶搜到的網頁設成允許被抓取,即使用User-agent: * allow: /。同時建議把上一節提到的sitemap.xml網站地圖文件引用進來:Sitemap: sitemap.xml(這里的地圖文件要用地圖的URL,即http://域名/sitemap.xml)
9、HTTP響應碼(狀態碼)檢查(上線當天)
前面說的所有步驟都是本機調試,這一步是上線后要查的,許多網站因為這里出問題而導致網站不被收錄。HTTP響應碼反應的是網頁打開后的狀態。我們需要注意的有這幾個:200、301、302、404。HTTP5xx通常是程序問題或服務器問題,這個不在SEO的范圍內,在此不談。
HTTP200是網頁正常打開,只要網站沒問題就會是這個響應碼。
HTTP301和302是網頁重定向(跳轉),301是永久重定向,是可以傳遞權重的;302是臨時重定向,并不傳遞權重。所以我們在網站換域名,或網頁換目錄的時候都要用301重定向。而302重定向比較少用,通常是臨時引流使用。這里需要提一點的是,搜索引擎是以URL為單位區分網頁并計算權重的,而大多數網站都有一級域名和www開頭的二級域名,所以同一個頁面有著兩個url,我們需要將兩個URL權重合二為一,就需要使用301重定向功能,(前面提到的canonical也是這個意思,但不跳轉)。
HTTP404是網頁不存在,死鏈通常是這個提示。
這里容易出問題的有兩個,301重定向和302重定向混用(可能是設置不當),這個影響不大,頂多就是不傳權重;再就是404頁面返回了200狀態碼,此種情況非常容易被K站。因為搜索引擎認為這個網頁是正常的,但實際它是沒內容的且千篇一律高度相似的,我們盡可能避免死鏈,但是也一定要讓404頁面返回404狀態才行。
10、瀏覽器適配
為了讓各種用戶才能正常打開網頁,我們有必要對多種瀏覽器(尤其是手機、微信瀏覽器)進行測試,看是否錯位。這個雖然不是SEO的范疇但用戶體驗(訪問深度、訪問時長、回頭客)也是對SEO有影響的,所以這一關也要把握好。
以上就是謝比特原創的網站上線前的SEO準備所有需要注意的了,雖然現在SEO的風口已過,但來自搜索引擎的免費流量還是很香的,為何不讓自己的網站贏在起跑線上呢?