版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
3YD/Txxx-xxxx基于人工智能的移動應(yīng)用視頻推薦服務(wù)技術(shù)要求1范圍本文件規(guī)定了基于人工智能的移動應(yīng)用視頻推薦服務(wù)的技術(shù)框架、人工智能通用要求業(yè)務(wù)流程。本文件適用于對基于人工智能的移動應(yīng)用視頻推薦服務(wù)進(jìn)行設(shè)計(jì)、研發(fā)和測評,也可為監(jiān)管部門第三方評估機(jī)構(gòu)對基于人工智能的視頻推薦服務(wù)活動進(jìn)行監(jiān)督、管理、評估提供參考。2規(guī)范性引用文件下列文件對于本標(biāo)準(zhǔn)的應(yīng)用是必不可少的,凡是凡是不注日期的引用文件,其最新版本(包括所有的修改單)適用于本標(biāo)準(zhǔn)。GB/T35273-2020信息安全技術(shù)個人信息安全規(guī)范3術(shù)語和定義下列術(shù)語和定義適用于本文件。采用人工智能技術(shù),分析、評估、預(yù)測用戶的特征,分析視頻服務(wù)平臺的視頻內(nèi)容,選將對象轉(zhuǎn)換為多維向量,用以表示對象的特征。索引池indexpool與業(yè)務(wù)場景匹配的,可推薦視頻的全集4縮略語下列縮略語適用于本文件。光學(xué)字符識別OpticalCharacterRecognitionIntellectualPro相互獨(dú)立,完全窮盡MutuallyExclusive,Collectively4YD/Txxx-xxxx基于人工智能的移動應(yīng)用視頻推薦服務(wù)系統(tǒng)的技術(shù)框架如圖1所示基于人工智能的移動應(yīng)用視頻推薦服務(wù)系統(tǒng)的技術(shù)框架如圖1所示百動圖1技術(shù)框架人工智能在視頻推薦服務(wù)中可應(yīng)用于:a)智能分析模塊:b)搜索查詢處理模塊:c)視頻推薦決策模塊:d)視頻內(nèi)容呈現(xiàn)模塊;視頻內(nèi)容理解模塊、搜索查詢處理模塊、視頻召回、視頻排序應(yīng)部署于平臺側(cè)實(shí)現(xiàn)用戶分析模塊、決策生成、視頻內(nèi)容呈現(xiàn)模塊可部署于APP側(cè),也可部署于平臺側(cè),也可在APP側(cè)和平臺側(cè)同時部署實(shí)現(xiàn)。6視頻推薦服務(wù)人工智能通用要求對人工智能算法處理的數(shù)據(jù),應(yīng)滿足如下要求:a)應(yīng)對訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)處理,包括識別并刪除惡意樣本、識別并修復(fù)或過濾被污染數(shù)據(jù):b)宜對訓(xùn)練數(shù)據(jù)集采取必要的保護(hù)措施,確保數(shù)據(jù)的保密性、完整性c)當(dāng)采用對比學(xué)習(xí)時,應(yīng)減少負(fù)樣本訓(xùn)練數(shù)據(jù)的隨機(jī)性,如將目標(biāo)用戶沒有正向反饋但其他用戶有正向反饋的視頻作為單獨(dú)的負(fù)樣本訓(xùn)練數(shù)據(jù)集;d)宜構(gòu)建不同于訓(xùn)練數(shù)據(jù)集的標(biāo)準(zhǔn)測試數(shù)據(jù)集,模型上線前應(yīng)通過標(biāo)準(zhǔn)測試數(shù)據(jù)集的測試e)應(yīng)構(gòu)建合理的訓(xùn)練數(shù)據(jù)集,包括但不限于數(shù)據(jù)集的規(guī)模、均衡性、準(zhǔn)確性等56YD/Txxx-xxxx結(jié)構(gòu)化分析基于人工智能的結(jié)構(gòu)化分析應(yīng)滿足以下要求a)應(yīng)支持多級類目標(biāo)簽,宜遵循MECE原則,同級類目標(biāo)簽之間相互獨(dú)立,同級類目標(biāo)簽之和無遺漏的覆蓋上一級的相應(yīng)類目標(biāo)簽;b)應(yīng)支持多維特征標(biāo)簽,如內(nèi)容主題標(biāo)簽、內(nèi)容元素標(biāo)簽、風(fēng)格標(biāo)簽、內(nèi)容形式標(biāo)簽、展示形式標(biāo)簽、IP標(biāo)簽、商品標(biāo)簽、興趣點(diǎn)標(biāo)簽、實(shí)效性標(biāo)簽等。不同維度的特征標(biāo)簽可交叉重疊可存在同義關(guān)系、相關(guān)關(guān)系、上下位關(guān)系等;如強(qiáng)/弱/無等。c)應(yīng)支持重復(fù)視頻的識別,并進(jìn)行相應(yīng)的處理;d)宜支持對知識視頻的識別,通過知識圖譜(多模態(tài)實(shí)體鏈接、層次聚類、知識點(diǎn)匹配)等技術(shù),構(gòu)建體系化的詞條上下位關(guān)系、知識點(diǎn)關(guān)系,形成結(jié)構(gòu)化知識視頻并進(jìn)行相應(yīng)掛載e)宜支持百萬級別訓(xùn)練數(shù)據(jù);f)模型宜支持多任務(wù);g)宜支持百億規(guī)模參數(shù)內(nèi)容統(tǒng)一建模。7.1.2用戶分析模塊基于人工智能進(jìn)行用戶分析時,應(yīng)滿足以下要求:a)對用戶的個人信息保護(hù)應(yīng)滿足GB/T35273-2020的要求;b)應(yīng)告知向用戶提供視頻推薦服務(wù)的場景、相應(yīng)所需處理的個人信息、處理方式和目的;c)處理未成年人個人信息,應(yīng)公開專門處理規(guī)則,明示未成年人個人信息處理的目的、方式和范圍;d)處理兒童個人信息,應(yīng)征得兒童的父母或其他監(jiān)護(hù)人同意;e)應(yīng)以顯著方式告知用戶拒絕提供視頻推薦服務(wù)所必需個人信息時的后果;f)宜使用基于用戶群體特征標(biāo)簽的簡介畫像信息進(jìn)行視頻推薦服務(wù);g)應(yīng)以顯著便捷的方式向用戶提供偏好選擇的功能,宜提供給用戶不同級別的推薦強(qiáng)度選擇;h)應(yīng)以顯著方式向用戶提供個人信息獲取權(quán)限的打開或關(guān)閉方式;1)應(yīng)支持用戶關(guān)閉個性化視頻推薦服務(wù)基于人工智能的用戶分析應(yīng)滿足以下要求:a)支持用戶選擇、刪除標(biāo)簽;b)生成針對用戶個人特征的標(biāo)簽;c)用戶標(biāo)簽不應(yīng)包含有對民族、種族、宗教、殘疾、疾病、人群行為等歧視的內(nèi)容;d)注:人群行為如低消費(fèi)水平用戶等。e)用戶標(biāo)簽不應(yīng)包含負(fù)面含義的內(nèi)容;f)應(yīng)對訓(xùn)練數(shù)據(jù)中涉及用戶個人敏感信息的數(shù)據(jù)進(jìn)行脫敏處理;g)用戶標(biāo)簽涉及敏感個人信息的,應(yīng)建立脫敏處理機(jī)制。7.2搜索查詢處理模塊7YD/Txxx-xxxx搜索查詢處理模塊應(yīng)支持以下功能:a)應(yīng)支持文本、語音等形式的搜索查詢;b)對于語音搜索查詢,通過自動語音識別轉(zhuǎn)換為文本;應(yīng)保持搜索查詢的一致性,即語音搜索查詢的結(jié)果,與直接以同樣文本進(jìn)行搜索查詢的結(jié)果保持一致:c)應(yīng)支持搜索查詢的糾錯:d)應(yīng)支持搜索查詢的意圖分析,包括以用戶為搜索查詢目標(biāo)的意圖和以視頻內(nèi)容為搜索查詢目標(biāo)的意圖。7.3視頻推薦決策模塊視頻展示推薦對于展示推薦的視頻推薦召回,應(yīng)滿足以下要求:a)從索引池海量視頻中檢索篩選出匹配用戶興趣的視頻b)應(yīng)支持多因素召回,包括視頻內(nèi)容、視頻類別、用戶、作者、用戶與作者的關(guān)系等c)應(yīng)支持主流的協(xié)同過濾方案,包括基于物品(視頻)的協(xié)同、基于用戶的協(xié)同、用戶到物品注:實(shí)踐中通常以用戶到物品(視頻)的協(xié)同為主要召回通路d)宜支持基于用戶與視頻交互行為生成嵌入向量:注:實(shí)踐中通常將顯式正反饋(如點(diǎn)贊、轉(zhuǎn)發(fā)等)交互行為設(shè)置更高的權(quán)重,將隱式正反饋(如觀看)o)應(yīng)支持多路召回,可靈活配置各路召回的召回規(guī)模,如直接設(shè)置個數(shù),或是閥值設(shè)置等0宜支持在線實(shí)時的召回搜索;g)宜支持實(shí)時訓(xùn)練、實(shí)時更新h)應(yīng)提供業(yè)務(wù)規(guī)模匹配的召回處理能力。視頻搜索推薦對于搜索推薦的視頻推薦召回、應(yīng)滿足以下要求:a)從索引池海量視頻中檢索篩選出匹配用戶輸入的搜索查詢的視頻b)應(yīng)支持主流的召回方式,包括倒排素引、向量檢索、協(xié)同過濾等;c)應(yīng)支持多路召回,應(yīng)具備配置各路召回規(guī)模上限的能力;d)在倒排索引中,視頻特征應(yīng)包括視頻的自包含文本(如封面文本、標(biāo)簽文本、描述文本等)、0CR識別文本、內(nèi)容理解標(biāo)簽等;e)應(yīng)支持基于用戶歷史行為序列的個性化視頻搜索推薦;f)宜支持在線實(shí)時的召回搜索;g)宜支持實(shí)時訓(xùn)練、實(shí)時更新。視頻排序模型基于人工智能的視頻排序模型,應(yīng)根據(jù)業(yè)務(wù)特點(diǎn),采用滿足需求的排序模型:YD/Txxx-xxxxa)當(dāng)用于粗排時,為了確保資源能夠支撐快速從召回視頻池中進(jìn)行篩選,宜采用復(fù)雜度相對較低的模型,例如基于物品(視頻)的協(xié)同相似度分析、雙塔模型等。模型使用特征相對較少耗時較短,吞吐量較高b)當(dāng)用于精排時,為了確保能夠從粗排視頻池中進(jìn)行精準(zhǔn)篩選,宜采用復(fù)雜度相對較高的模型。模型使用特征相對較多,結(jié)果精確度較高;c)宜支持百億規(guī)模的用戶行為序列樣本特征規(guī)模d)宜支持實(shí)時訓(xùn)練、實(shí)時更新e)對于視頻搜索,模型特征應(yīng)包括視頻、視頻自包含的文本、視頻內(nèi)容理解標(biāo)簽、視頻內(nèi)容理解嵌入向量、視頻自包含圖片信息(如封面)、以及搜素查詢向量等:f)對于視頻搜索,應(yīng)支持不同類目的視頻按類目相關(guān)性排序,宜支持不同類目視頻推薦數(shù)量的視頻排序策略基于人工智能的視頻排序,應(yīng)滿足以下要求a)對于視頻展示推薦業(yè)務(wù),應(yīng)支持多因素排序,如內(nèi)容理解、作者表征、關(guān)注關(guān)系、用戶行b)應(yīng)支持多目標(biāo)排序。應(yīng)包括時長類(如播放時長、完成度、有效播放率、完播率等)、互動類(如點(diǎn)贊率、關(guān)注率、分享率、評論率等)、營收類(如打賞率、下單率、商品交易總額)等;對于視頻搜索的業(yè)務(wù),還應(yīng)包括搜素查詢相關(guān)性、權(quán)威性、時效性等c)應(yīng)支持多目標(biāo)的動態(tài)優(yōu)化調(diào)整d)應(yīng)支持個性化排序策略;e)應(yīng)支持多目標(biāo)的融合,采取歸一化等方法消除不同目標(biāo)量級差異、分布差異等影響。f宜支持內(nèi)容風(fēng)控策略7.3.3決策生成決策生成模塊根據(jù)不同的服務(wù)類型進(jìn)行決策,應(yīng)滿足以下要求。a)應(yīng)支持人工干預(yù),包括但不限于基于業(yè)務(wù)規(guī)則和價值觀的扶持、排名排序干預(yù)、內(nèi)容打壓b)應(yīng)支持識別相似視須內(nèi)容,減少相似內(nèi)容的重復(fù)推送;c)對于非搜索推薦業(yè)務(wù),應(yīng)支持多準(zhǔn)度的打散干預(yù)。如減少重復(fù)類型內(nèi)容的推送,確保視頻類目的多樣性;控制同一作者內(nèi)容推薦的頻率;控制類似特征標(biāo)簽的視頻內(nèi)容的推送等;d)對于非搜索推薦業(yè)務(wù),宜支持適量引入隨機(jī)內(nèi)容;e)對于非搜索推薦業(yè)務(wù),宜支持根據(jù)網(wǎng)絡(luò)環(huán)境進(jìn)行推薦視頻的緩存,并在網(wǎng)絡(luò)異常時對緩存視頻進(jìn)行排序,按序向用戶推送緩存的視頻;播放過的視頻宜從緩存中清除;宜優(yōu)先推送上一次網(wǎng)絡(luò)異常后緩存的視頻;f)不應(yīng)設(shè)置誘導(dǎo)用戶沉迷、過度消費(fèi)的人工智能模型;g)不應(yīng)惡意屏蔽信息、不應(yīng)惡意操縱榜單以及搜索結(jié)果等;h)應(yīng)支持推薦視頻的重排;i)宜支持端側(cè)重排調(diào)整j0宜支持生成輔助展示信息,如熱度、推薦理由等;k)宜支持針對未成年人模式、適老模式等提供符合該人群特點(diǎn)的視頻內(nèi)容;1)應(yīng)支持重排后原生視頻與其他領(lǐng)域場景(如廣告營銷服務(wù)、電商推薦服務(wù)等)的混排1)原生視頻可包括自然流量短視頻、冷啟推薦、關(guān)系鏈推薦等YD/Txxx-xxxx2)混排應(yīng)考慮業(yè)務(wù)約束規(guī)則、用戶標(biāo)簽、用戶體驗(yàn)等:3)混排宜考慮原生視頻與其他服務(wù)的關(guān)系,支持過濾及重計(jì)算4)應(yīng)設(shè)置其他服務(wù)與原生視頻的最大比值:m)應(yīng)支持的視頻推薦服務(wù)包括但不限于:1)視頻內(nèi)容的個性化推送2)視頻內(nèi)容的排序精選:3)視頻內(nèi)容的檢索過濾。7.4視頻內(nèi)容呈現(xiàn)模塊基于人工智能的視頻內(nèi)容呈現(xiàn)應(yīng)滿足以下要a)應(yīng)顯著標(biāo)示個性化呈現(xiàn)的內(nèi)容:b)應(yīng)提供退出、關(guān)閉個性化視頻內(nèi)容呈現(xiàn)的方式:c)應(yīng)根據(jù)用戶設(shè)置的時間管理或時間提醒,在設(shè)置的條件觸發(fā)時向用戶推送提醒內(nèi)容7.5評估反饋模塊應(yīng)設(shè)計(jì)合理的評價體系,觀測評價指標(biāo),反饋改進(jìn)人工智能模型。a)應(yīng)在模型上線部署前進(jìn)行評估,并在上線后定期進(jìn)行評估反饋。必要時觸發(fā)模型的優(yōu)化:b)宜支持實(shí)時訓(xùn)練和優(yōu)化;c)對于內(nèi)容理解模塊的類目標(biāo)簽。應(yīng)根據(jù)準(zhǔn)確率和覆蓋率進(jìn)行反饋和優(yōu)化:d)對于內(nèi)容理解模塊的特征標(biāo)簽。應(yīng)根據(jù)準(zhǔn)確率、覆蓋率、豐富度進(jìn)行反饋和優(yōu)化;e)對于內(nèi)容理解模塊的特征標(biāo)簽。宜對不同視頻類型設(shè)置不同的反饋優(yōu)化指標(biāo);f)對于視頻推薦決策,應(yīng)支持綜合考慮正向、反向反饋進(jìn)行優(yōu)化;應(yīng)綜合考慮顯式反饋、隱式g)對于視頻搜索推薦,應(yīng)支持客觀指標(biāo)進(jìn)行準(zhǔn)確性的評估反饋;h)對于視頻推薦結(jié)果,宜從效率指標(biāo),用戶體驗(yàn)指標(biāo),內(nèi)容新穎度指標(biāo)等角度進(jìn)行推薦結(jié)果的視頻搜索推薦業(yè)務(wù)由用戶的搜索查詢輸入觸發(fā),結(jié)合對用戶偏好的理解,向用戶返回搜
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 四川省內(nèi)江市(2024年-2025年小學(xué)六年級語文)部編版綜合練習(xí)(上學(xué)期)試卷及答案
- 農(nóng)村集體用地項(xiàng)目可行性研究報告
- 安全生產(chǎn)宣傳活動總結(jié)
- 定量資料案例分析
- 電商個人實(shí)習(xí)心得體會
- 山東省臨沂市(2024年-2025年小學(xué)六年級語文)部編版期中考試((上下)學(xué)期)試卷及答案
- 優(yōu)化教學(xué)常規(guī)管理
- 保安個人工作計(jì)劃2022大全5篇
- 四川省攀枝花市(2024年-2025年小學(xué)六年級語文)部編版隨堂測試((上下)學(xué)期)試卷及答案
- 校園常規(guī)與安全
- JJF(新) 106-2023 微波消解儀溫度、壓力參數(shù)校準(zhǔn)規(guī)范
- 小學(xué)期末復(fù)習(xí)班會課課件
- 新建子公司規(guī)劃方案
- 文創(chuàng)店室內(nèi)設(shè)計(jì)方案
- 裝修公司安全生產(chǎn)規(guī)章制度
- 超聲波探傷儀350 操作手冊-1
- 肺膿腫小講課
- 【基于eNsp平臺的小學(xué)無線網(wǎng)絡(luò)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)18000字(論文)】
- 小學(xué)六年級上冊音樂知識復(fù)習(xí)匯總
- 平潭君山生態(tài)水系及河道整治工程環(huán)境影響評價報告書
- 外研社小學(xué)五年級上冊英語期末試卷
評論
0/150
提交評論