POST TIME:2018-12-03 17:42
如何設(shè)置SEO關(guān)鍵詞當(dāng)然重要,但SEO優(yōu)化技術(shù)如果只是機械式的說該做什麼不做什麼,而涉及的步驟又非常死板,例如:將焦點關(guān)鍵詞設(shè)定放在標(biāo)題一,關(guān)鍵詞在首段重覆出現(xiàn)三次等等 ,會是何等枯燥乏味。
過去二十年搜索引擎優(yōu)化是圍繞關(guān)鍵詞為基礎(chǔ),理由是計算機無法有效分析自然語言輸入,從而理解搜索用戶的目的,退而求其次依賴搜索用戶輸入簡單詞組作為導(dǎo)向,就是所謂關(guān)鍵詞。關(guān)鍵詞研究 Keyword Research 是指利用工具,例如 :Google Adwords Planner 分析個別關(guān)鍵字的搜索量和競爭度。由于傳統(tǒng)搜索引擎優(yōu)化是以關(guān)鍵字為對象,關(guān)鍵字研究得出來的一籃子關(guān)鍵字會按照和內(nèi)容的相關(guān)性被分配到網(wǎng)站內(nèi)差別網(wǎng)頁用作所瞄準(zhǔn)的關(guān)鍵字。
SEO關(guān)鍵字 – 基本概念
多了解一些關(guān)鍵字設(shè)定基本概念和基礎(chǔ)理論會令SEO優(yōu)化變得更有趣味。例如:SEO關(guān)鍵字的出現(xiàn)密度的基礎(chǔ)理論是TF-IDF。搜索引擎希望從頁面出現(xiàn)的關(guān)鍵字密度決定該SEO關(guān)鍵字和內(nèi)容的相關(guān)性 Relevance 有多大。用淺白語言排除數(shù)學(xué)其實不難理解:
關(guān)鍵字在網(wǎng)頁出現(xiàn)的頻率就是 TF (Term Frequency)。如果關(guān)鍵字 K 在網(wǎng)頁出現(xiàn) 4 次, TF 值看似應(yīng)該是4。
問題是如果A頁的內(nèi)容長度是 B頁的兩倍,某關(guān)鍵字 K 在A頁的出現(xiàn)次數(shù)是B頁兩倍時就不能斷言關(guān)鍵字 K 與A頁更相關(guān)。所以 TF 被修正為 出現(xiàn)次數(shù) / 長度。例如,出現(xiàn) 4 次文件章度為 100 個字:
TF 值 = 4 / 100 = 0.04
問題是例如一編介紹 “網(wǎng)上生意” 文章的描述中,有些字像 “客戶”,”網(wǎng)上” 的 TF 就顯然要比 “網(wǎng)上生意” 的 TF 為高。但說該文章跟 “網(wǎng)上” 或 “生意” 的相關(guān)性較 “網(wǎng)上生意” 為高,明顯違反常識。當(dāng)文章是談?wù)?“網(wǎng)上生意”,”云端運算”,”網(wǎng)上繳費”,”網(wǎng)上教學(xué)”等等時 “網(wǎng)上” 都很可能被提及。結(jié)論是 “網(wǎng)上” 一詞是一般文章中更普及出現(xiàn)。單純利用 TF 計算相關(guān)性會出現(xiàn)以上的偏差。
解決的方法是對愈普及的關(guān)鍵字給出愈低的權(quán)重 Weight,倒如在 10,000 文章中關(guān)鍵字 “網(wǎng)上” 出現(xiàn) 100 次,權(quán)重釀成倒數(shù) (所以叫 IDF 或 Inverse Document Frequency) 10,000/100 = 100 , 如關(guān)鍵字 “網(wǎng)上推廣” 在 10,000 文章中出現(xiàn)一次,權(quán)重釀成 10,000/1 = 10,000. 為了令這權(quán)重值變革不要不急,所以以 log base 10 計算。
“網(wǎng)上” IDF 值 = log (10,000 / 100) = 2
“網(wǎng)上推廣” IDF 值 = log (10,000 / 1) = 5
將 TF 乘以 IDF 就是相關(guān)性的評分。當(dāng)然今天的搜索引擎采用的 TF-IDF 更復(fù)雜,但原理是一樣。今天搜索引擎已經(jīng)進化到非常復(fù)雜,除了 Google 內(nèi)部從事 SEO 研究的資深工程師外,外面從事SEO優(yōu)化的人只能按照一些如專利申請和Google人員差別埸合的闡述等符嘗試?yán)斫馄渲械木?。Google 搜索引擎計算關(guān)鍵字相關(guān)性的算法是以 TF-IDF 為基礎(chǔ),但已經(jīng)進化到更為先進。
長尾關(guān)鍵字
長尾關(guān)鍵字 Long tail keyword 指基于通用關(guān)鍵字在前或在后或同時在前后加入更多字眼作更精準(zhǔn)標(biāo)示所要找的產(chǎn)品、辦事或信息,長尾關(guān)鍵字 IDF 值高。例如:“大碼衣服婚禮用”,“防敏感化妝品”等等。長尾關(guān)鍵字特色是搜索量小,但同時提供和該關(guān)鍵字相關(guān)的產(chǎn)品、辦事或信息的網(wǎng)站亦小,所以該長尾關(guān)鍵字的搜索排名競爭亦小,更容易獲得高搜索排名。
焦點關(guān)鍵字
焦點關(guān)鍵字 Focus Keyword 指網(wǎng)頁內(nèi)容是以該關(guān)鍵字為爭取排名目標(biāo),焦點關(guān)鍵字 IDF 值低。所以在頁內(nèi)重要的元素中會加入該焦點關(guān)鍵字以便通知搜索引擎網(wǎng)頁內(nèi)容和焦點關(guān)鍵字的相關(guān)性。SEO 優(yōu)化工具如 Yoast SEO, SEOpressor 的排名優(yōu)化建議都需要先設(shè)定焦點關(guān)鍵字。一般網(wǎng)頁內(nèi)容只應(yīng)瞄準(zhǔn)一兩個焦點關(guān)鍵字,不然可能造成文理欠亨,降低可讀性。
單頁相關(guān)還是多頁相關(guān)
某些網(wǎng)站接受游客發(fā)帖 Guest Posting, 單獨一個頁面和某關(guān)鍵字有高相關(guān)性不及和好幾頁面展現(xiàn)高相關(guān)性來得重要。利用 ITF 可以偵測到整個網(wǎng)站 (或者更正確是整個網(wǎng)站中被搜索引擎索引的頁面) 和某關(guān)鍵字的相關(guān)性。例如“韓國時裝” 在一般網(wǎng)站的 ITF 是 0.0003,便是在一萬頁中只有 3 頁提及,而某網(wǎng)站是 0.05,即一百頁中有五頁提及,就體現(xiàn)該網(wǎng)站以 “韓國時裝” 為主題的可能性極高。也就是該網(wǎng)站對 “韓國時裝” 的權(quán)威性高,亦便是 Google Rater Guideline 所闡述優(yōu)質(zhì)內(nèi)容 E.A.T 里內(nèi)的 A,代表 Authority。搜索引擎是偏好來自權(quán)威性高的內(nèi)容。
直接相關(guān)還是間接相關(guān)
上一篇:配色方法論:不雅觀感謎題