谷歌SEO工作者只有先了解谷歌搜索引擎的主題模型和語義連接,才能了解越來越智能的谷歌搜索引擎的運(yùn)行原理,這樣才能夠有的放矢地對(duì)網(wǎng)站進(jìn)行谷歌SEO優(yōu)化。
搜索引擎,尤其是谷歌,能夠很好地理解人們的意圖,盡管目前還不是十分精確。那么,搜索引擎是如何做到這一點(diǎn)的呢?接下來杰欣網(wǎng)絡(luò)營銷機(jī)構(gòu)將為大家詳細(xì)說明。
這其中就牽涉到主題模型(Topic Modeling)和語義連接(Semantic Connectivity),這兩個(gè)詞聽起來很難理解,但實(shí)際上,他們是幫助我們了解搜索引擎運(yùn)行原理的重要部分,而且他們對(duì)于SEO的某些方面有很大的影響。因此,必須先了解這兩個(gè)詞。
其實(shí),搜索引擎對(duì)于人們搜索所使用的詞匯、短語的理解更智能。比如搜索“超級(jí)瑪麗”這個(gè)詞,人們可能認(rèn)為只能搜索到以“超級(jí)瑪麗”為標(biāo)題的網(wǎng)頁,而實(shí)際上,只要標(biāo)題或文章中含有“超級(jí)瑪麗”的網(wǎng)頁都可以搜索出來。而這就是SEO的真正目的,就是為搜索者提供所有的最佳答案。但搜索引擎實(shí)際上遠(yuǎn)比這個(gè)更加智能。
還有一個(gè)最好的例子,就是谷歌的電影搜索。例如,在谷歌上搜索“一部講花花公子的電影”,你會(huì)看到“The Big Lebowski”排在第一位。那么谷歌是怎么知道的?谷歌把“電影”和“花花公子”結(jié)合在一起,發(fā)現(xiàn)和兩者最為密切相關(guān)的是“The Big Lebowski”這部電影。而這部電影正是用戶要找的,沒有一個(gè)網(wǎng)站會(huì)將“一部講花花公子的電影”作為標(biāo)題。
還是以“超級(jí)瑪麗”為例,“超級(jí)瑪麗”會(huì)涉及到很多相關(guān)詞匯或者短語。因此,搜索引擎更多是從語義上對(duì)這個(gè)詞進(jìn)行理解,它可能優(yōu)先將這個(gè)詞與“馬里奧”聯(lián)系在一起,而后是“路易吉”,再然后是“庫巴大王”,就是那只背部長滿釘子的反派烏龜。
從以上例子我們就可以看出,搜索引擎有著一套自己的主題模型算法,類似于早期的潛在語義索引,以及后來的潛在的狄利克雷分布。模式并不重要,尤其是對(duì)于我們所要達(dá)到的目標(biāo)。
最重要的是了解搜索引擎是怎樣聯(lián)系的。比如谷歌和必應(yīng)就能夠很好地理解“超級(jí)瑪麗”這個(gè)詞,不會(huì)將其和其他方面聯(lián)系在一起。它們會(huì)將“超級(jí)瑪麗”和“電子游戲”聯(lián)系在一起,而不是和“貓糧”聯(lián)系在一起。如果我們恰巧發(fā)現(xiàn)搜索結(jié)果的網(wǎng)頁標(biāo)題中含有“超級(jí)瑪麗”,但是大部分內(nèi)容卻是跟貓糧相關(guān)。那么即使這些網(wǎng)頁中的很多內(nèi)鏈和包含“超級(jí)瑪麗”的錨文本相連,或者排名很高,權(quán)重很高,我們也不會(huì)對(duì)這些網(wǎng)頁進(jìn)行排名。
因此,谷歌等搜索引擎對(duì)于語義連接的理解越來越智能化了,這與
谷歌的蜂鳥算法有關(guān)。蜂鳥是去年秋季新推出的一種算法,這種算法改變了搜索引擎對(duì)詞語及短語的理解。
所以如果想知道搜索引擎怎樣理解我們的意圖,就要先理解谷歌和必應(yīng)對(duì)于詞語、短語和主題之間的連通性的理解。這個(gè)問題會(huì)涉及到很多方面,也可能來自于共同出現(xiàn)的網(wǎng)頁文檔。
關(guān)鍵詞之間的距離。我的意思是,如果很多網(wǎng)頁都有“超級(jí)瑪麗”和“馬里奧”這兩個(gè)詞,那谷歌是怎么從“馬里奧”這個(gè)詞當(dāng)中找到“超級(jí)瑪麗”的?“超級(jí)瑪麗”的詞義和“馬里奧”的詞義有什么關(guān)系?也許“超級(jí)瑪麗”會(huì)出現(xiàn)在很多“貓糧”中,但是“超級(jí)瑪麗”和“貓糧”的詞義相去甚遠(yuǎn)。但提及“超級(jí)瑪麗”,搜索結(jié)果中會(huì)出現(xiàn)很多頁面,搜索引擎可能關(guān)注文件之間的互相引用和鏈接,同時(shí)也會(huì)將這些網(wǎng)頁與“馬里奧”、“路易吉”、“任天堂”等聯(lián)系起來。
搜索引擎會(huì)理解這些鏈接的錨文本之間的聯(lián)系,也會(huì)通過協(xié)調(diào)語料庫以及主域名的偏向理解這些詞的同現(xiàn)。因此,搜索引擎只關(guān)注那些網(wǎng)站、博客、新聞網(wǎng)站,或者高權(quán)重的域名上更新的內(nèi)容,而不是關(guān)注這些網(wǎng)站的全部內(nèi)容。因此,搜索引擎可能會(huì)通過不同的方式來理解。
搜索引擎會(huì)分析用戶提出的問題,而這個(gè)是人類所不具備的能力。搜索引擎會(huì)分析那些使用“馬里奧”、“路易吉”、“任天堂”等詞匯搜索“超級(jí)瑪麗”的行為習(xí)慣。
搜索引擎也會(huì)通過谷歌瀏覽器、安卓,以及谷歌搜索引擎等方面的數(shù)據(jù),來分析用戶點(diǎn)擊量、訪問頁面,并把這些數(shù)據(jù)作為聯(lián)系詞組和短語的調(diào)和資源。
搜索引擎可能也會(huì)通過其他途徑獲得相關(guān)數(shù)據(jù),并通過這些數(shù)據(jù)建立起一個(gè)非常龐大的數(shù)據(jù)庫,用來聯(lián)系詞匯和短語。對(duì)于SEO工作者來說,這個(gè)數(shù)據(jù)庫因不得而知而貌似不重要。
假如以“超級(jí)瑪麗”作為關(guān)鍵詞,那么那些和“超級(jí)瑪麗”語義上相關(guān)的詞匯短語都可以加以利用。如果知道搜索引擎會(huì)將哪些詞匯和短語與“超級(jí)瑪麗”相聯(lián)系,就可以使用那些詞匯和短語??梢詫⑦@些詞匯和短語寫入網(wǎng)頁中,讓搜索引擎知道你的網(wǎng)頁內(nèi)容和“超級(jí)瑪麗”相關(guān),因?yàn)榫W(wǎng)頁中包含了“馬里奧”、“路易吉”、“碧奇公主”、“庫巴大王”、“任天堂”等,而不是“貓糧”、“狗糧”、“T恤”、“玻璃”等。
網(wǎng)站獲得了一個(gè)鏈接,通常是因?yàn)槟莻€(gè)鏈接的錨文本中含有和網(wǎng)站主題相關(guān)的詞匯和短語,鏈接的錨文本潛在地指向你的網(wǎng)站,這樣就可以從命名規(guī)定和品牌角度考慮網(wǎng)站建設(shè)。所以,在考慮產(chǎn)品名稱和產(chǎn)品內(nèi)容描述時(shí),可以將這些詞匯編入正式的名稱和描述中,以此來提高搜索量。
對(duì)于網(wǎng)站上的有關(guān)介紹頁面,大部分要考慮有關(guān)個(gè)人或者公司的正式介紹內(nèi)容,包括要使用的詞匯,所以介紹就必須根據(jù)網(wǎng)站、書本提供的詞匯或者會(huì)議內(nèi)容來編輯相關(guān)內(nèi)容,這些詞匯不一定必須是相關(guān)的。因此,當(dāng)人們搜索“超級(jí)瑪麗”這個(gè)詞時(shí),搜索引擎往往會(huì)指向“任天堂”網(wǎng)站。
當(dāng)然你也可以考慮使用其他關(guān)鍵詞。這些可以在你進(jìn)行網(wǎng)頁優(yōu)化和
鏈接建設(shè)時(shí),作為關(guān)鍵詞研究的一部分。
現(xiàn)在有各種各樣的工具來完成這些步驟,這里就不詳細(xì)說明了。
網(wǎng)上有很多可以下載的工具以及數(shù)據(jù)庫。Code.google.com就是一種主題建模工具,而這也是谷歌搜索引擎常用的工具。
在網(wǎng)上搜索主題建模工具,但是大部分建模工具都需要網(wǎng)站發(fā)展背景。許多工具依靠Python 數(shù)據(jù)庫或者API,大部分還需要一個(gè)語料庫。你可以下載維基百科數(shù)據(jù)庫作為語料庫,或者使用谷歌搜索引擎排名前十的結(jié)果作為語料庫。
整個(gè)過程會(huì)非常艱難,這也是我熱衷于嘗試的原因所在。我們?cè)诖嗽敿?xì)說明,希望能夠幫大家盡快熟悉這些工具,以用于
網(wǎng)站優(yōu)化和關(guān)鍵詞研究。
現(xiàn)在你就可以獨(dú)立完成這些步驟了??梢匀ゾW(wǎng)站上看看那些搜索結(jié)果,仔細(xì)研究那些在谷歌搜索排名前十網(wǎng)站所使用的關(guān)鍵詞和短語。然后仔細(xì)想想這些關(guān)鍵詞和短語是否相關(guān),錨文本中是否包含了這些關(guān)鍵詞和短語?人們?cè)谒阉鞯臅r(shí)候會(huì)用到這些關(guān)鍵詞和短語嗎?它們局部相關(guān)嗎?仔細(xì)想想,然后學(xué)會(huì)利用。這樣,在進(jìn)行SEO時(shí),就能夠熟練使用這些工具。