常見的文檔低質(zhì)問題

2023-08-02 19:01:52 人氣:1189

一、標(biāo)題違規(guī)

1.1 在標(biāo)題批量加無關(guān)的關(guān)鍵詞/字、數(shù)字、字母、符號(hào)

例如【】、...、abc、1、20XX 、網(wǎng)址、等和文本標(biāo)題沒有任何關(guān)系的文檔。上傳用戶為逃避重復(fù)過濾機(jī)制故意為之或者沒有對(duì)自己的文檔進(jìn)行整理,不利于seo優(yōu)化。

?

1.2 在標(biāo)題中添加格式、頁數(shù)

例如標(biāo)題后加.pdf、.doc、(共XX頁)逃避重復(fù)過濾機(jī)制,文檔經(jīng)過系統(tǒng)處理后,會(huì)自動(dòng)識(shí)別到文檔格式和頁數(shù)并在網(wǎng)站顯示,自行添加影響用戶體驗(yàn)和降低網(wǎng)站文檔質(zhì)量。

?

1.3 標(biāo)題不完整、缺字漏字、表意不明,標(biāo)題關(guān)鍵詞堆砌、閱讀不通順,使用戶難以理解,且易造成誤導(dǎo)。

例如“第三章.DOC、我們的世界 改成 我們世界” 等故意添加或者刪除字詞,造成文檔標(biāo)題意思不明確,影響用戶體驗(yàn)和不利于seo優(yōu)化。


1.4 標(biāo)題與實(shí)際內(nèi)容不符合

標(biāo)題寫著有答案實(shí)際沒有答案、標(biāo)題寫著有圖紙實(shí)際沒有圖紙、標(biāo)題寫著2023/2024年內(nèi)容實(shí)際是往年的(假年份)、標(biāo)題寫著有視頻實(shí)際沒有視頻、標(biāo)題寫著全套實(shí)際只有一部分、標(biāo)題與內(nèi)容不相關(guān)(標(biāo)題是工作總結(jié),但內(nèi)容中卻是試題)等,容易遭到下載用戶投訴、舉報(bào)至相關(guān)部門且中招百度清風(fēng)算法導(dǎo)致網(wǎng)站被搜索引擎處罰。

2023年傳的2024年的內(nèi)容)

1.5 標(biāo)題批量添加影響用戶判斷的詞

如在標(biāo)題前面或后面批量加“精品、最新、精選、7A、5A、整理、優(yōu)質(zhì)、優(yōu)秀、新、熱門、推薦、菁選、優(yōu)選、完美、免費(fèi)、完整版、高清版、全套、滿分、100分”引導(dǎo)性形容詞,會(huì)誤導(dǎo)用戶,使網(wǎng)站遭到投訴并遭受搜索引擎處罰。

1.6 標(biāo)題批量添加影響用戶判斷的詞

標(biāo)題字?jǐn)?shù)不能少于6個(gè)漢字(如標(biāo)題確實(shí)不足6個(gè)漢字,可適當(dāng)添加內(nèi)容相關(guān)的關(guān)鍵詞);建議標(biāo)題長度在8-20個(gè)漢字。

二、惡劣采集文檔

2.1 采集網(wǎng)頁進(jìn)行制作

采集網(wǎng)頁新聞、軟文、論壇、博客等,制作成文檔上傳,文檔排版混亂、內(nèi)容價(jià)值較低。

2.2 采集目錄,簡介內(nèi)容

?僅僅是目錄、簡介、封面沒有實(shí)際內(nèi)容的文檔,或者文檔內(nèi)容不全(此類內(nèi)容大多為采集其他收費(fèi)平臺(tái)內(nèi)容,免費(fèi)采集的只有前面部分的目錄等信息),容易引起用戶投訴、退款,影響網(wǎng)站信譽(yù)

2.3 采集內(nèi)容中含有明顯網(wǎng)址等信息

一些采集的文檔中,含有明顯的采集方的信息,網(wǎng)址,水印logo,二維碼,聯(lián)系方式

等,用戶體驗(yàn)較差。

2.4 采集內(nèi)容為廣告軟文

有明顯的引導(dǎo)性,對(duì)具體的某個(gè)產(chǎn)品/服務(wù)進(jìn)行介紹推薦,引導(dǎo)購買等;

三、違規(guī)內(nèi)容

3.1 內(nèi)容中故意添加大段內(nèi)容

使用軟件或其他方式在文檔里批量添加與主題無關(guān)的內(nèi)容。降低網(wǎng)站權(quán)重且影響用戶體驗(yàn)。比如贈(zèng)送范文、詩歌、小故事、勵(lì)志語句、拼音等、PPT母版中加無關(guān)內(nèi)容;


3.2 文檔里大量亂碼字,內(nèi)容用背景色字體隱藏、或?qū)⒆峙暮苄‰[藏,或在一個(gè)字上面實(shí)際是兩個(gè)同樣的字(文字重疊)。

導(dǎo)致預(yù)覽無法判斷內(nèi)容,且易造成投訴。


3.3 在文檔首頁,文檔中或末尾添加空白頁/重復(fù)頁,圖片,或者使用圖片覆蓋內(nèi)容。

封面沒有任何文字內(nèi)容;使用戶體驗(yàn)感極差,容易被投訴或舉報(bào)至相關(guān)部門。

?

惡意插入重復(fù)封面,使用戶體驗(yàn)感極差。


3.4 內(nèi)容排版混亂

內(nèi)容排版不正常、亂碼文字、段落不整齊、首頁空白多、過密或過于稀疏,字體過大/過小、顏色(幾乎看不到)完全不符合常規(guī)。


3.5 內(nèi)容堆砌

大量文字重復(fù),有些用戶為了逃避重復(fù)機(jī)制的檢測,或者為了湊頁數(shù)字?jǐn)?shù),同樣的一段或者一篇內(nèi)容,重復(fù)出現(xiàn)在一個(gè)文檔中。甚至是同樣的內(nèi)容復(fù)制2次或多次組成一個(gè)文檔。(尤其是PPT中存在較多)

?

3.6 內(nèi)容空短不全

1-3頁空短內(nèi)容,統(tǒng)一格式,無實(shí)際內(nèi)容、或內(nèi)容不全。

3.7 PPT內(nèi)容與實(shí)際文字內(nèi)容不符

PPT的內(nèi)容與實(shí)際的文字內(nèi)容沒有任何關(guān)聯(lián),PPT為純圖片與無關(guān)文字內(nèi)容組成,惡意逃避網(wǎng)站關(guān)鍵詞的篩查。例如:PPT內(nèi)容是學(xué)習(xí)團(tuán)課的PPT,文字內(nèi)容是建筑相關(guān)的。



?

?

?