昨天百度升級了藍天算法,升級這個算法主要是打擊垃圾目錄發(fā)布低質(zhì)量虛假和站點主題無關(guān)的內(nèi)容,百度在公告上已經(jīng)說的很清楚了,這種做法嚴重干擾秩序,侵害了優(yōu)質(zhì)開發(fā)者的權(quán)益,所以百度才不得不升級算法來遏制作弊者。
百度在這篇公告中,順便發(fā)了一張違規(guī)行為案例,從最新的案例來看,這個網(wǎng)站的違規(guī)頁面已經(jīng)被刪除,可見這個網(wǎng)站的運營者求生欲很強,但是違規(guī)目錄依舊沒有刪除。
那么我們從百度發(fā)的公告當中,我們需要注重2點:
一、低質(zhì)量內(nèi)容被打壓
事實上百度算法可以識別內(nèi)容的質(zhì)量度,行業(yè)內(nèi)有不少的同學依舊認為,百度是無法識別質(zhì)量的,事實上,百度是有算法,可以辨別質(zhì)量度的,具體書籍請參考搜索引擎相關(guān)原理。
二、跟站點主題無關(guān)的內(nèi)容
我個人分析,百度算法是有能力通過你的內(nèi)容來辨別主題的,也就是說我們在發(fā)布的內(nèi)容之后,百度是可以通過算法來判斷你的網(wǎng)站屬于什么領(lǐng)域,這個沒有實質(zhì)性的證據(jù),但是我們可以看一下頭條在這一塊是怎么做的,我之前研究過頭條的算法,因為頭條之前有選擇領(lǐng)域,那個時候是因為頭條算法上還不夠成熟,所以只能靠人工去選擇領(lǐng)域才能判斷賬號的領(lǐng)域,但是隨著后期頭條算法的迭代,人工選擇領(lǐng)域已經(jīng)沒有什么實際意義了,這里舉個例子,比如說你的內(nèi)容中包含劉德華,周星馳或者某些明星的名字或電影,頭條會根據(jù)算法判斷為你的賬號屬于娛樂領(lǐng)域,所以我個人認為頭條都可以,從內(nèi)容判斷領(lǐng)域,百度應(yīng)該也可以實現(xiàn)的。
從行業(yè)內(nèi)不少人來看,百度升級藍天算法,目的在打擊目錄站和b2b行業(yè),因為這些行業(yè)基本上就是低質(zhì)量內(nèi)容的孵化池,所以也有不少人猜測,百度這波操作,是不是要推出什么產(chǎn)品?如果站長不幸中的算法還有什么辦法可以挽救嗎?答案是有的,因為百度藍天算法打擊的主要就是低質(zhì)量和站點無關(guān)內(nèi)容,所以我們只需要目錄結(jié)構(gòu)轉(zhuǎn)成二級域名結(jié)構(gòu)就可以了,但這些做法之前要保證內(nèi)容質(zhì)量。