常見的文檔低質問題

2023-08-02 19:01:52 人氣:1372

一、標題違規(guī)

1.1 在標題批量加無關的關鍵詞/字、數(shù)字、字母、符號

例如【】、...、abc、1、20XX 、網址、等和文本標題沒有任何關系的文檔。上傳用戶為逃避重復過濾機制故意為之或者沒有對自己的文檔進行整理,不利于seo優(yōu)化。

?

1.2 在標題中添加格式、頁數(shù)

例如標題后加.pdf、.doc、(共XX頁)逃避重復過濾機制,文檔經過系統(tǒng)處理后,會自動識別到文檔格式和頁數(shù)并在網站顯示,自行添加影響用戶體驗和降低網站文檔質量。

?

1.3 標題不完整、缺字漏字、表意不明,標題關鍵詞堆砌、閱讀不通順,使用戶難以理解,且易造成誤導。

例如“第三章.DOC、我們的世界 改成 我們世界” 等故意添加或者刪除字詞,造成文檔標題意思不明確,影響用戶體驗和不利于seo優(yōu)化。


1.4 標題與實際內容不符合

標題寫著有答案實際沒有答案、標題寫著有圖紙實際沒有圖紙、標題寫著2023/2024年內容實際是往年的(假年份)、標題寫著有視頻實際沒有視頻、標題寫著全套實際只有一部分、標題與內容不相關(標題是工作總結,但內容中卻是試題)等,容易遭到下載用戶投訴、舉報至相關部門且中招百度清風算法導致網站被搜索引擎處罰。

2023年傳的2024年的內容)

1.5 標題批量添加影響用戶判斷的詞

如在標題前面或后面批量加“精品、最新、精選、7A、5A、整理、優(yōu)質、優(yōu)秀、新、熱門、推薦、菁選、優(yōu)選、完美、免費、完整版、高清版、全套、滿分、100分”引導性形容詞,會誤導用戶,使網站遭到投訴并遭受搜索引擎處罰。

1.6 標題批量添加影響用戶判斷的詞

標題字數(shù)不能少于6個漢字(如標題確實不足6個漢字,可適當添加內容相關的關鍵詞);建議標題長度在8-20個漢字。

二、惡劣采集文檔

2.1 采集網頁進行制作

采集網頁新聞、軟文、論壇、博客等,制作成文檔上傳,文檔排版混亂、內容價值較低。

2.2 采集目錄,簡介內容

?僅僅是目錄、簡介、封面沒有實際內容的文檔,或者文檔內容不全(此類內容大多為采集其他收費平臺內容,免費采集的只有前面部分的目錄等信息),容易引起用戶投訴、退款,影響網站信譽

2.3 采集內容中含有明顯網址等信息

一些采集的文檔中,含有明顯的采集方的信息,網址,水印logo,二維碼,聯(lián)系方式

等,用戶體驗較差。

2.4 采集內容為廣告軟文

有明顯的引導性,對具體的某個產品/服務進行介紹推薦,引導購買等;

三、違規(guī)內容

3.1 內容中故意添加大段內容

使用軟件或其他方式在文檔里批量添加與主題無關的內容。降低網站權重且影響用戶體驗。比如贈送范文、詩歌、小故事、勵志語句、拼音等PPT母版中加無關內容;


3.2 文檔里大量亂碼字,內容用背景色字體隱藏、或將字弄的很小隱藏,或在一個字上面實際是兩個同樣的字(文字重疊)。

導致預覽無法判斷內容,且易造成投訴。


3.3 在文檔首頁,文檔中或末尾添加空白頁/重復頁,圖片,或者使用圖片覆蓋內容。

封面沒有任何文字內容;使用戶體驗感極差,容易被投訴或舉報至相關部門。

?

惡意插入重復封面,使用戶體驗感極差。


3.4 內容排版混亂

內容排版不正常、亂碼文字、段落不整齊、首頁空白多、過密或過于稀疏,字體過大/過小、顏色(幾乎看不到)完全不符合常規(guī)。


3.5 內容堆砌

大量文字重復,有些用戶為了逃避重復機制的檢測,或者為了湊頁數(shù)字數(shù),同樣的一段或者一篇內容,重復出現(xiàn)在一個文檔中。甚至是同樣的內容復制2次或多次組成一個文檔。(尤其是PPT中存在較多)

?

3.6 內容空短不全

1-3頁空短內容,統(tǒng)一格式,無實際內容、或內容不全。

3.7 PPT內容與實際文字內容不符

PPT的內容與實際的文字內容沒有任何關聯(lián),PPT為純圖片與無關文字內容組成,惡意逃避網站關鍵詞的篩查。例如:PPT內容是學習團課的PPT,文字內容是建筑相關的。



?

?

?