人工智能倫理導(dǎo)論 課件 lecture7-技術(shù)濫用問題、lecture8-責(zé)權(quán)歸屬問題_第1頁
人工智能倫理導(dǎo)論 課件 lecture7-技術(shù)濫用問題、lecture8-責(zé)權(quán)歸屬問題_第2頁
人工智能倫理導(dǎo)論 課件 lecture7-技術(shù)濫用問題、lecture8-責(zé)權(quán)歸屬問題_第3頁
人工智能倫理導(dǎo)論 課件 lecture7-技術(shù)濫用問題、lecture8-責(zé)權(quán)歸屬問題_第4頁
人工智能倫理導(dǎo)論 課件 lecture7-技術(shù)濫用問題、lecture8-責(zé)權(quán)歸屬問題_第5頁
已閱讀5頁,還剩110頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

技術(shù)濫用問題Lecture72024/7/2412024/7/242如果我們繼續(xù)在不夠明智和審慎的情況下發(fā)展技術(shù),我們的傭人可能最終成為我們的劊子手?!既R德雷(OmarNelsonBradley)人工智能倫理技術(shù)濫用概念目錄技術(shù)濫用案例技術(shù)濫用方式1232024/7/243人工智能倫理技術(shù)濫用概念2024/7/2447.1技術(shù)濫用概念濫用④多而質(zhì)量低劣。技術(shù)濫用是是指人們在利用技術(shù)進行分析、決策、協(xié)調(diào)、組織等一系列的活動中,其使用目的、使用方式、使用范圍等出現(xiàn)偏差并引發(fā)不良影響的行為或情形。濫用是指胡亂地或過度地使用,指程度、數(shù)量等,或者,不恰當(dāng)?shù)奈镔|(zhì)(如,酒精或藥物)使用,可損害健康或增加對健康損害的危險性。人工智能倫理①江河、湖泊的水溢出;②過度,沒有節(jié)制;③浮泛不合實際;①實行,施行;②治理,管理;③辯用,聽從;④

出力,效命。例如,遠古時期,人類發(fā)明了取火技術(shù),用火烤制食物、照明、取暖、冶煉等,為人類生活提供了便利,也改善了人類的生活質(zhì)量?!盎鸢选庇糜谠缙诘娜祟惙榛鹜ㄐ牛藗兛梢约皶r得到信息,防止外敵入侵;縱火,可以引發(fā)森林大火、樓宇火災(zāi),給人民生命和財產(chǎn)帶來巨大損失。⑤

功能。2024/7/2457.1技術(shù)濫用概念濫用人工智能倫理技術(shù)濫用的誘因主要有如下三個方面:技術(shù)設(shè)計者出于自身利益,產(chǎn)生對人類不利的行為。例如,金融機構(gòu)從自身利益出發(fā),推薦不符合用戶利益的產(chǎn)品,或者是為了自身局部利益,不顧整體利益,產(chǎn)生了系統(tǒng)性風(fēng)險;娛樂平臺為了自身的商業(yè)利益,利用技術(shù)誘導(dǎo)用戶進行娛樂或信息消費,導(dǎo)致用戶沉迷?!凹夹g(shù)至上”的內(nèi)容推薦會導(dǎo)致用戶價值觀扭曲、視野狹窄等問題。過度依賴技術(shù)本身,技術(shù)缺陷引發(fā)不良后果和影響。即使人工智能的使用者出于正當(dāng)?shù)哪康?,在一些極端的場景中,盲目相信技術(shù)、過度依賴人工智能,也可能因為技術(shù)的缺陷而產(chǎn)生嚴重后果。例如,醫(yī)療誤診導(dǎo)致醫(yī)療事故、安防和犯罪誤判導(dǎo)致安全問題等,都直接關(guān)系到公民的人身安全與自由。盲目擴大技術(shù)的應(yīng)用范圍,導(dǎo)致超出人們預(yù)期結(jié)果。任何人工智能技術(shù)都有其特定的應(yīng)用場景和應(yīng)用范圍。超出原定場景和范圍的使用可能會導(dǎo)致技術(shù)濫用。例如,在校園中應(yīng)用人工智能技術(shù),可以幫助學(xué)校和教師提高教學(xué)效率,但如果盲目擴大到對特定學(xué)生行為的全面監(jiān)控,會對學(xué)生造成不良的心理影響。技術(shù)濫用概念目錄技術(shù)濫用案例技術(shù)濫用方式1232024/7/246人工智能倫理數(shù)據(jù)關(guān)涉的濫用算法關(guān)涉的濫用應(yīng)用關(guān)涉的濫用2024/7/2477.2技術(shù)濫用方式人工智能倫理數(shù)據(jù)關(guān)涉的濫用-數(shù)據(jù)過度采集人工智能應(yīng)用存在的主要技術(shù)濫用方式:數(shù)據(jù)關(guān)涉的濫用、算法關(guān)涉的濫用、應(yīng)用關(guān)涉的濫用。數(shù)據(jù)關(guān)涉的濫用是指在數(shù)據(jù)的采集和分析中惡意使用人工智能技術(shù),損害他人利益或造成不良影響的行為。主要包括數(shù)據(jù)過度采集問題和數(shù)據(jù)過度分析問題。數(shù)據(jù)采集主要方式包括現(xiàn)場無差別采集、直接在線采集、網(wǎng)上公開數(shù)據(jù)源和商務(wù)采購等方式。在現(xiàn)場無差別采集時,由于無法提前預(yù)知采集的用戶,難以獲得用戶授權(quán)的充分同意。在直接在線采集時,需要對用戶數(shù)據(jù)進行連續(xù)性的處理分析,因此很難保障用戶的修改、撤回等權(quán)益。在網(wǎng)上公開數(shù)據(jù)源和商務(wù)采購時,目前數(shù)據(jù)共享、交易和流通的市場化機制不健全,因此存在一部分企業(yè)通過灰色渠道獲得用戶數(shù)據(jù),而這些數(shù)據(jù)缺乏用戶知情同意。在公開環(huán)境尤其是公共空間進行現(xiàn)場數(shù)據(jù)采集時,將不可避免地因采集范圍擴大而帶來數(shù)據(jù)過度采集問題。如,在無人駕駛場景中,自動駕駛汽車的傳感器需要采集街景數(shù)據(jù)來支持智能駕駛系統(tǒng)的決策從而控制汽車行駛,但是這種無差別的街景數(shù)據(jù)采集必然會采集到行人的個人數(shù)據(jù),甚至可能會采集到路邊重要基礎(chǔ)設(shè)施分布、軍事營區(qū)等重要數(shù)據(jù)給國家安全帶來風(fēng)險。機器學(xué)習(xí)技術(shù)提升了數(shù)據(jù)采集的效率和自動化水平,也加劇了數(shù)據(jù)過度采集的風(fēng)險。如,一些公司運用爬蟲技術(shù)獲取用戶的信息,如購物流水、通訊錄聯(lián)系人、銀行卡賬單,支付寶和微信交易記錄,以及公積金和社保等數(shù)據(jù),然后打包出售,被非法用于不合理和不正當(dāng)?shù)哪康?,損害用戶的利益。人臉、基因、體態(tài)、語音等生物特征數(shù)據(jù)均屬于個人敏感數(shù)據(jù),對此類數(shù)據(jù)的采集和處理存在較大的法律合規(guī)和隱私保護風(fēng)險2024/7/2487.2技術(shù)濫用方式人工智能倫理數(shù)據(jù)過度分析是指超出數(shù)據(jù)中原有使用目的的使用。理論上在現(xiàn)有法律框架,個人數(shù)據(jù)在知情同意收集后的使用環(huán)節(jié)是沒有受到任何限制和規(guī)避的。數(shù)據(jù)挖掘是一種重要的人工智能數(shù)據(jù)分析形式,可以從大量數(shù)據(jù)中揭示出隱含的、先前未知的并有潛在價值的信息。關(guān)于這些具有潛在價值的信息,用戶并沒有足夠的意識和警覺,并不能形成事實上的“知情”,當(dāng)然就難免導(dǎo)致表象的“知情同意”,往往造成用戶的潛在信息在實際不知情情況下被惡意使用。隨著人工智能關(guān)聯(lián)分析技術(shù)的發(fā)展,通過對公民分散的、單個無意義的數(shù)據(jù)項進行組合關(guān)聯(lián)分析,能夠形成對特定個體識別和特征畫像的數(shù)據(jù)集(如,活動場所、行動習(xí)慣、政治態(tài)度、宗教信仰等)。這種技術(shù)不但本身會直接威脅到用戶的人身安全和隱私,若被用于政黨競選和政治宣傳,將對現(xiàn)行的國家政治制度產(chǎn)生極大的沖擊和顛覆。隨著大數(shù)據(jù)分析和用戶畫像技術(shù)的快速發(fā)展,個性化服務(wù)變得越來越普遍,各類平臺和企業(yè)對于用戶“數(shù)字軌跡”數(shù)據(jù)的采集成為其提供精準(zhǔn)化產(chǎn)品服務(wù)的核心基礎(chǔ),這種對于用戶習(xí)慣行為的長期跟蹤和深度分析將使得公民隱私面臨安全風(fēng)險。數(shù)據(jù)關(guān)涉的濫用-數(shù)據(jù)過度分析2024/7/2497.2技術(shù)濫用方式人工智能倫理算法關(guān)涉的濫用“人為開發(fā)造成”和“機器自我學(xué)習(xí)”兩類人為開發(fā)造成的濫用,是指為了某些自身特殊利益或者惡意目的而開發(fā)出的算法技術(shù)和算法實現(xiàn)。例如,使用機器學(xué)習(xí)讓網(wǎng)絡(luò)攻擊自動進行,并且通過自我學(xué)習(xí)不斷提升,來增強攻擊能力,提高攻擊的命中率。機器自我學(xué)習(xí)的濫用,是指機器在學(xué)習(xí)的過程中會自我學(xué)習(xí)到數(shù)據(jù)的多維不同特征或者多種關(guān)聯(lián),造成不良影響或惡意后果。機器學(xué)習(xí)的過程中,代碼和算法存在著難以理解的技術(shù)“黑箱”,導(dǎo)致人們無法控制和預(yù)測的結(jié)果。例如,算法能夠幫助提升惡意軟件的適應(yīng)能力,能夠幫助攻擊者迅速收集、組織并處理大型數(shù)據(jù)庫,從而對信息進行關(guān)聯(lián)與識別,最終簡化攻擊實施門檻并加快攻擊執(zhí)行速度。人為開發(fā)造成的算法濫用包括以下幾個方面:算法設(shè)計。算法開發(fā)者利用個人信息、瀏覽記錄、消費記錄等信息,通過數(shù)據(jù)和算法實施價格歧視,追求自身利潤最大化;通過數(shù)據(jù)和算法向用戶進行個性化推薦,有些內(nèi)容甚至違背法律和公序良俗;通過數(shù)據(jù)和算法對流量分配、搜索排名、評價等級設(shè)置障礙,限制經(jīng)營者開展交易,降低消費者選擇的可能性。模型訓(xùn)練。算法開發(fā)者通過使用對抗生成網(wǎng)絡(luò)來操縱或生成人類、甚至技術(shù)解決方案都難以立即與真實內(nèi)容區(qū)分的視覺、音頻和文本內(nèi)容。算法開發(fā)者基于缺陷數(shù)據(jù)訓(xùn)練算法,所得到的模型會產(chǎn)生偏見和不公平?jīng)Q策。算法模型是由數(shù)據(jù)訓(xùn)練出來的,給它什么樣的數(shù)據(jù),就可能產(chǎn)生什么樣的結(jié)果,算法模型會放大已有的偏見或不公正。2024/7/24107.2技術(shù)濫用方式人工智能倫理應(yīng)用關(guān)涉的濫用-網(wǎng)絡(luò)安全人工智能技術(shù)可提升網(wǎng)絡(luò)攻擊的智能化水平,可以利用人工智能技術(shù)自動鎖定目標(biāo),進行數(shù)據(jù)勒索攻擊;可以通過人工智能技術(shù)自動生成大量虛假威脅情報,對分析系統(tǒng)實施攻擊;可以采用人工智能技術(shù)自動識別圖像驗證碼,竊取系統(tǒng)數(shù)據(jù)。通過人工智能進行惡意攻擊的行為和個人的類別正在激增。同時,針對人工智能系統(tǒng)的新的攻擊形式(在性質(zhì)上與傳統(tǒng)的網(wǎng)絡(luò)攻擊不同)以一種指數(shù)級的、有時無法衡量的方式增加了連接系統(tǒng)的攻擊面。人工智能在網(wǎng)絡(luò)安全的濫用存在如下具體影響:擴大現(xiàn)有威脅。廉價且日益有效的人工智能系統(tǒng)可用于攻擊,意味著各類團體和個人有可能成為惡意行為者。由于廉價計算硬件的普及,通過云計算能力的不斷增加和成本的降低,以及大多數(shù)可以促進模型訓(xùn)練和潛在惡意活動工具的開源,惡意行為者的范圍正在擴大。引入新的威脅。除了現(xiàn)有的威脅在規(guī)模和范圍上的擴大,人工智能的進步意味著可能會引入全新的威脅。人工智能不受人類能力限制的特點,可以讓行動者執(zhí)行原本不可行的攻擊,例如深度造假、破解驗證碼、蜂擁式攻擊。改變威脅的特征。針對人工智能系統(tǒng)的攻擊也經(jīng)常以竊取信息或破壞系統(tǒng)為目的,但以更微妙的形式和更長遠的方向精心設(shè)計。試圖為一個特有的目的獲得對目標(biāo)系統(tǒng)的控制,或者通過入侵系統(tǒng)讓模型揭示其內(nèi)部工作原理,然后改變其行為。攻擊將會更加高效、更有針對性、難于歸因且難以防守,這將在很大程度上改變傳統(tǒng)網(wǎng)絡(luò)安全的典型特征。2024/7/24117.2技術(shù)濫用方式人工智能倫理應(yīng)用關(guān)涉的濫用-軍事防恐人工智能軍事競爭觸發(fā)新一輪軍備競賽

人工智能將是大國塑造軍事優(yōu)勢新杠桿,通過推進智能武器部署,實現(xiàn)作戰(zhàn)能力的迭代升級,維持或打造軍事能力優(yōu)勢和新代差。對中小國家而言,人工智能的巨大賦能效應(yīng)可能會彌補其在領(lǐng)土、人口、經(jīng)濟等方面的劣勢,獲得挑戰(zhàn)大國的實力和機會。智能技術(shù)的易擴散性加劇非傳統(tǒng)風(fēng)險

人工智能技術(shù)與以往核武器、生化武器等最顯著不同是易擴散性。由于智能技術(shù)的低成本、高賦能,易于被恐怖組織、個人等非國家行為體掌握和運用,成為恐怖分子、犯罪組織、黑客等進行破壞和犯罪的工具。如,委內(nèi)瑞拉總統(tǒng)馬杜羅出席活動遭無人機爆炸襲擊事件。人工智能軍事應(yīng)用顯著降低戰(zhàn)爭門檻軍事智能發(fā)展催生出認知戰(zhàn)、失能戰(zhàn)、網(wǎng)絡(luò)戰(zhàn)等非殺傷性作戰(zhàn)手段,可能不再以消滅對手為目的,而是以控制對方認知、行動等方式取勝,加大了戰(zhàn)爭“零傷亡”的可能。智能化條件下的殺傷性行動主要由自主機器實施,作戰(zhàn)樣式以自主式遠程無人攻擊為主,降低了戰(zhàn)爭成本。這些因素都能夠使戰(zhàn)爭看起來更“人道”、“廉價”,減輕戰(zhàn)爭決策者發(fā)動戰(zhàn)爭的道義責(zé)任和政治壓力部署在網(wǎng)絡(luò)、太空、深海等新型作戰(zhàn)空間的智能武器更具有隱蔽性,難以判定誰是發(fā)起者,成為軍事對抗的“灰色地帶”。技術(shù)濫用概念目錄技術(shù)濫用案例技術(shù)濫用方式1232024/7/2412人工智能倫理數(shù)據(jù)關(guān)涉的濫用算法關(guān)涉的濫用應(yīng)用關(guān)涉的濫用機器學(xué)習(xí)的技術(shù)濫用搜索引擎的技術(shù)濫用語音識別的技術(shù)濫用計算機視覺技術(shù)濫用自然語言處理的濫用生物識別技術(shù)的濫用2024/7/24137.3技術(shù)濫用案例人工智能倫理機器學(xué)習(xí)的技術(shù)濫用-暗網(wǎng)交易深網(wǎng)(DeepWeb):除了表層網(wǎng)之外的,其實都可以被稱為深網(wǎng)。深網(wǎng)就是互聯(lián)網(wǎng)上不能被搜索引擎抓取到內(nèi)容。如,和同事微信聊天的記錄;存在網(wǎng)盤里的僅自己可見的音頻視頻;設(shè)置了僅顯示三天的朋友圈,那三天之外的朋友圈內(nèi)容就是屬于搜索引擎無能為力的范圍。這部分的數(shù)據(jù)量比搜索引擎能夠抓取到的多得多。據(jù)估計,深網(wǎng)的內(nèi)容要比表面網(wǎng)站大幾個數(shù)量級。暗網(wǎng)(Darknet或DarkWeb)就是不能通過普通方式來訪問的網(wǎng)絡(luò),屬于深網(wǎng)的一部分,但是是更深一層的,暗網(wǎng)是通過非常規(guī)協(xié)議和端口進行連接的私有網(wǎng)絡(luò)。暗網(wǎng)的數(shù)據(jù)傳輸是匿名進行的。暗網(wǎng)是深網(wǎng)的一個子集,而且是很小的一部分子集。2019年2月,卡巴斯基實驗室的欺詐偵查小組搗毀了名為“創(chuàng)世紀(jì)(Genesis)”的暗網(wǎng)市場。該市場出售“數(shù)字身份”(互聯(lián)網(wǎng)用戶的電子身份信息),每條信息起價5美元,最高達200美元?;ヂ?lián)網(wǎng)并不是我們看到的只有一層,實際上是分為明網(wǎng)(表層網(wǎng))、深網(wǎng)和暗網(wǎng):明網(wǎng)是我們平時可以隨意訪問的網(wǎng)絡(luò),但是它只是互聯(lián)網(wǎng)的最表層,大約只占據(jù)了4%-20%的內(nèi)容,搜索引擎就是我們訪問明網(wǎng)的關(guān)鍵,不需要再使用其他的特殊工具和方式。出價取決于所購買信息的價值,例如,一個包含用戶銀行登錄信息完整配置文件的數(shù)字掩碼,會比一個瀏覽器指紋的價格要高的多。數(shù)字掩碼是指用戶設(shè)備指紋(設(shè)備ID、硬件、操作系統(tǒng)、IP地址、屏幕分辨率、固件版本、瀏覽器、瀏覽器插件、時區(qū)、GPU信息、TCP/IP指紋、Cookie等)及其個人行為屬性(在特定網(wǎng)上商店花費的時間、與興趣相關(guān)的行為、鼠標(biāo)/觸摸屏行為等)的唯一組合。2024/7/24147.3技術(shù)濫用案例人工智能倫理機器學(xué)習(xí)的技術(shù)濫用-暗網(wǎng)交易黑客們通常會用惡意軟件攻擊他人電腦,找到并復(fù)制個人數(shù)據(jù)以及其他個人身份識別信息。有了這些信息,通過特定瀏覽器和代理服務(wù)器來模仿真實用戶的活動。再加上盜取的互聯(lián)網(wǎng)用戶的帳戶信息,攻擊者就可以自由地以該用戶的名義進行新的、可信的交易——包括使用信用卡消費。在打擊“暗網(wǎng)”犯罪的過程中,人工智能也正成為一把利器。消失速度極快是“暗網(wǎng)”犯罪的一大特征,因為它們可能遭到其他黑客的攻擊、安全部門的突擊搜查,或者本身就被設(shè)計成一個“退出騙局”,顧客為未完成的訂單付費后,該網(wǎng)站會故意關(guān)閉。林肯實驗室(MITLincolnLaboratory)人工智能技術(shù)與系統(tǒng)集團研究員達格利(CharlieDagli)就表示:“暗網(wǎng)交易市場的‘彈出式’特性使得跟蹤參與者及其活動變得十分困難?!辟u家和買家在網(wǎng)絡(luò)的多個層面(從表面到黑暗)及黑暗網(wǎng)絡(luò)論壇上進行聯(lián)系。“這種網(wǎng)站之間的不斷切換現(xiàn)在已經(jīng)成為暗網(wǎng)市場運作方式的既定組成部分?!贬槍@一情況,林肯實驗室正在開發(fā)新的人工智能軟件工具來分析表面和暗網(wǎng)數(shù)據(jù),他們訓(xùn)練機器學(xué)習(xí)算法來計算不同論壇上用戶之間的相似度,自動形成人物角色鏈接?!霸谶@一點上,黑客們已經(jīng)能夠收集、管理和維護他們所侵入的用戶的大量數(shù)據(jù),”一家基于機器學(xué)習(xí)的技術(shù)公司的產(chǎn)品經(jīng)理說到,“這意味著,如果你的筆記本電腦被黑客入侵,黑客的戰(zhàn)利品不一定是被入侵的電腦,而是你電腦上的所有數(shù)據(jù),包括所有的身份識別信息。”2024/7/24157.3技術(shù)濫用案例人工智能倫理機器學(xué)習(xí)的技術(shù)濫用-暗網(wǎng)交易機器學(xué)習(xí)算法首先從一個論壇A的用戶那里獲取數(shù)據(jù),并為每個用戶創(chuàng)建一個著作權(quán)模型。然后,將論壇B上用戶的數(shù)據(jù)與論壇A上的所有用戶模型進行對比,以尋找簡單的線索,比如在兩個論壇中一個叫“sergeygork”,另一個叫“sergeygorkin”,或者把“joenightmare”拼寫為“joeknight”。算法關(guān)注的另一個特性是內(nèi)容相似性。達格利表示,“因為很多內(nèi)容都是復(fù)制粘貼的,所以類似的話可能會來自同一個用戶?!毕到y(tǒng)查找用戶網(wǎng)絡(luò)中的相似點,即用戶交叉的區(qū)域,以及用戶討論的主題。然后將配置文件、內(nèi)容和網(wǎng)絡(luò)特性融合為一個輸出:兩個論壇中的兩個人物角色代表同一個現(xiàn)實生活中的人物的概率,這個匹配正確率高達95%。安全部門及相關(guān)公司利用機器學(xué)習(xí)打擊“暗網(wǎng)”犯罪的同時,黑客也開始利用機器學(xué)習(xí)進行對抗和犯罪。比如,前文中提及的“創(chuàng)世紀(jì)”,黑客利用“數(shù)字孿生”作為數(shù)字面具模仿真實的用戶,并選擇網(wǎng)絡(luò)安全技術(shù)來通過欺詐檢測協(xié)議?!叭绻贿吺菣C器學(xué)習(xí),那么另一邊也是機器學(xué)習(xí),”“現(xiàn)在,黑客和惡意人員們正在實施他們自己的方案,作為一種對抗性的機器學(xué)習(xí)訓(xùn)練?!?024/7/24167.3技術(shù)濫用案例人工智能倫理機器學(xué)習(xí)的技術(shù)濫用-“快啊”打碼平臺2017年2月9日晚,紹興市公安局越城區(qū)分局城南派出所接到公民虞某報案稱,他收到好友王某的一條QQ信息:王某正在購買一件價值1922元的商品,因手機支付不成功,請虞某幫忙代付。虞某通過手機為好友支付貨款后,對方再次要求付款,她疑心被騙因而報案。結(jié)果證明,王某的賬號被盜,有人冒充王某對其好友實施詐騙。接到報警后,越城分局警方在哈爾濱抓獲這個利用社交軟件冒充好友實施代付詐騙的犯罪團伙。團伙成員共十余人,頭目鄭某負責(zé)招募人員、培訓(xùn)和購買作案工具,其他成員登錄不同種類社交軟件實施詐騙。在這個團伙的電腦中,警方發(fā)現(xiàn)大量公民個人信息?!靶畔⒆疃嗟囊慌_電腦中有300多GB的個人信息,包括多個郵箱、社交軟件的賬號和密碼,而且都很準(zhǔn)確。”這些信息從何而來?團伙頭目鄭某稱:他以一組2元左右的價格,共花40多萬元從吳某等人手中買來的。而吳某手中的信息則來自一個黑客犯罪團伙,該團伙利用超級SQL注入工具、網(wǎng)站漏洞掃描軟件,批量掃描網(wǎng)站程序漏洞,非法獲取網(wǎng)站后臺用戶注冊數(shù)據(jù),這被稱為“脫庫”。一起普通的網(wǎng)絡(luò)代付詐騙,牽出一個利用人工智能技術(shù)、一秒鐘盜取2000組公民信息數(shù)據(jù)的犯罪團伙。通過深挖公民個人信息賬號密碼買賣這條線索,浙江紹興警方發(fā)現(xiàn)一條涉及利用黑客技術(shù)非法獲取網(wǎng)站后臺用戶注冊數(shù)據(jù)、數(shù)據(jù)撞庫、繞開互聯(lián)網(wǎng)公司安全策略的打碼平臺、網(wǎng)絡(luò)詐騙、非法信息推廣的互聯(lián)網(wǎng)黑色產(chǎn)業(yè)鏈。這一黑產(chǎn)鏈條中,參與到數(shù)據(jù)泄露環(huán)節(jié)的人工智能技術(shù)頗為關(guān)鍵,使得非法獲取個人信息的成本大幅降低。黑客團伙將包含各類郵箱和密碼的數(shù)據(jù)分門別類進行銷售,以每10萬條數(shù)據(jù)50元到100元的價格賣給吳某等人。獲取數(shù)據(jù)后,吳某等人用“撞庫”軟件進行批量撞庫、匹配,進而將各類賬號與密碼匹配成功的賬戶以1.2元到2元一個的價格,販賣給網(wǎng)絡(luò)詐騙犯罪團伙。2024/7/24177.3技術(shù)濫用案例人工智能倫理機器學(xué)習(xí)的技術(shù)濫用-“快啊”打碼平臺很多用戶習(xí)慣在不同網(wǎng)站使用相同的郵箱賬號登錄,甚至登錄賬號密碼也和郵箱一樣。黑客可以通過獲取用戶在A網(wǎng)站的賬戶從而嘗試登錄B網(wǎng)址,這就完成一次“撞庫”嘗試。為了防止黑客批量測試賬戶密碼,各網(wǎng)站和平臺動了不少腦筋,“驗證碼”是常用防范手段之一。網(wǎng)絡(luò)用戶在各大網(wǎng)站或者平臺注冊、登錄賬號時,經(jīng)??梢砸姷桨ā白址薄ⅰ皵?shù)字”、“字符+點選”、“滑塊拼圖”、“圖片人工答題”等驗證碼,其中“字符型驗證碼”是互聯(lián)網(wǎng)行業(yè)普遍采用的驗證碼形式。驗證碼的防范機制是:提出的問題要容易被人類解答,而讓機器無法解答?!懊搸臁备`取到的郵箱、社交軟件等賬號密碼信息大多是單一的、無效的,需要將這些信息進行“清洗”。與之對應(yīng)的概念為“撞庫”:黑客通過收集互聯(lián)網(wǎng)已泄露的用戶和密碼信息,生成對應(yīng)的字典表,嘗試批量登陸其他網(wǎng)站后,得到一系列可以登錄的賬號信息。經(jīng)過“撞庫”清洗后,一些賬號關(guān)聯(lián)的其他平臺賬號被順利登錄,完成“清洗”后的數(shù)據(jù)更為豐富,可以精準(zhǔn)獲知該用戶的許多平臺注冊信息,這在犯罪分子眼中極有價值,價格也隨之漲高。2016年山東女大學(xué)生徐玉玉被詐騙分子以發(fā)放助學(xué)金的名義,騙走全部學(xué)費9900元,在報警回家的路上猝死,就是由于騙子掌握了徐玉玉準(zhǔn)確的錄取信息、手機號碼等個人信息,精準(zhǔn)實施詐騙。2024/7/24187.3技術(shù)濫用案例人工智能倫理機器學(xué)習(xí)的技術(shù)濫用-“快啊”打碼平臺當(dāng)賬號登錄存在異常的時候,為了保護賬號安全,系統(tǒng)會提示輸入驗證碼。其目的是防止犯罪團伙批量惡意登錄——他們可以利用機器大量輸入賬號和密碼,但是機器無法識別驗證碼。由此,對于想要獲取精準(zhǔn)個人賬戶信息的犯罪團伙,在“撞庫”環(huán)節(jié),如何進行批量驗證就成為關(guān)鍵。由于無法規(guī)避驗證碼,黑客們?nèi)粢嚦鲇行艽a,需要人工逐條輸入信息和識別驗證碼,比對、驗證并成功匹配個人信息的賬號密碼,確認信息準(zhǔn)確可以使用,再交給數(shù)據(jù)商。這些人在圈內(nèi)被稱為“碼奴”,這一環(huán)節(jié)也被稱為“打碼”。某“碼奴”向《財經(jīng)》記者透露,根據(jù)驗證碼的復(fù)雜程度和輸入的準(zhǔn)確率,打1000個驗證碼會掙取1元至25元不等,每天工作12小時,最多可以輸入2萬個驗證碼,掙到300多元。最熟練的“碼奴”輸入一個驗證碼也需要一秒鐘時間。在傳統(tǒng)的信息泄露相關(guān)犯罪中,因高昂的人力資本和較為漫長的工作周期,被“清洗”的數(shù)據(jù)相對有限。因此在查獲巨量個人信息后,越城分局警方意識到,這一系列案件中的“打碼”絕非人工識別完成。隨后警方調(diào)查發(fā)現(xiàn),該案中,拿到原始數(shù)據(jù)的數(shù)據(jù)商,通過一個名為“快啊”的打碼平臺進一步進行深加工。工商信息顯示,“快啊”平臺是沈陽納信科技有限公司旗下產(chǎn)品,該公司經(jīng)營范圍為計算機科學(xué)技術(shù)研究、計算機軟件開發(fā)、網(wǎng)絡(luò)技術(shù)研究、網(wǎng)絡(luò)工程設(shè)計、計算機軟件銷售等。警方在調(diào)查中發(fā)現(xiàn),該平臺專為網(wǎng)絡(luò)黑產(chǎn)和灰產(chǎn)識別破解字符型驗證碼提供技術(shù)幫助。2024/7/24197.3技術(shù)濫用案例人工智能倫理機器學(xué)習(xí)的技術(shù)濫用-“快啊”打碼平臺打碼平臺上有多種針對不同互聯(lián)網(wǎng)產(chǎn)品進行“撞庫”的軟件,數(shù)據(jù)商將驗證碼傳給“快啊”打碼平臺的某一“撞庫”軟件識別接口,打碼平臺將驗證碼發(fā)給后端的“碼奴”進行識別,并獲取識別結(jié)果。越城分局警方對“快啊”平臺的數(shù)據(jù)分析獲知,接入該平臺提供驗證碼識別服務(wù)的“撞庫”軟件有100多款,接入平臺的用戶達1.1萬余人,從2016年6月到2017年3月,平臺資金進賬累計達1650萬元,為國內(nèi)最大的“打碼”平臺。“打碼”平臺游走在法律邊緣,界定并不清晰?!笆裁礃拥娜诵枰孔R別驗證碼?往往都是從事網(wǎng)絡(luò)黑產(chǎn)和灰產(chǎn)的人員?!背谏a(chǎn)業(yè)的詐騙人員,打碼平臺的通常使用者是“羊毛黨”、搶票的“黃?!奔罢搲⑻八姟薄R浴把蛎h”為例,一些網(wǎng)貸平臺為吸引投資者常推出一些收益豐厚的活動,如注冊認證獎勵、充值返現(xiàn)、投標(biāo)返利等,催生了以此寄生的投機群體“羊毛黨”。“羊毛黨”去某網(wǎng)站刷活動優(yōu)惠券,但該網(wǎng)站有較復(fù)雜的驗證碼,通?!把蛎h”會在打碼平臺注冊賬號并充值,并通過打碼平臺提供的接口,提交驗證碼識別。打碼平臺將驗證碼分發(fā)到各個“碼奴”客戶端里,獲取識別結(jié)果,并最終反饋給“羊毛黨”。據(jù)辦案民警介紹,“快啊”平臺被查的前三個月,已提供驗證碼識別服務(wù)259億次。在人力資源有限的情況下,“快啊”平臺如何做到可以提供巨量的驗證碼識別服務(wù)呢?越城分局警方發(fā)現(xiàn)了隱藏在其背后的一個無需“碼奴”的高級“打碼”技術(shù)。2024/7/24207.3技術(shù)濫用案例人工智能倫理機器學(xué)習(xí)的技術(shù)濫用-“快啊”打碼平臺隨著偵查深入,越城分局警方發(fā)現(xiàn):為“快啊”打碼平臺提供驗證碼識別服務(wù)的是一個名為NID的軟件系統(tǒng),這一人工智能程序由廈門人楊某設(shè)計。楊某稱,他使用伯克利大學(xué)開發(fā)的Caffe框架創(chuàng)建了一個神經(jīng)網(wǎng)絡(luò)模型,之后從網(wǎng)絡(luò)上下載了幾乎全世界所有字體,對模型進行訓(xùn)練,使它具有圖文轉(zhuǎn)換的能力,再將這個神經(jīng)網(wǎng)絡(luò)與具有圖像接受和處理結(jié)果返回功能的服務(wù)端進行網(wǎng)絡(luò)連接,構(gòu)成一個系統(tǒng)。楊某像教育兒童一樣訓(xùn)練NID學(xué)習(xí)識別各種驗證碼。在他的“培養(yǎng)”下,NID破解驗證碼的能力越來越強。通過運用人工智能機器深度學(xué)習(xí)技術(shù)訓(xùn)練機器,可以讓NID如AlphaGo一樣自主操作識別,有效識別圖片驗證碼,輕松繞過互聯(lián)網(wǎng)公司設(shè)置的賬戶登錄安全策略——驗證碼。在機器學(xué)習(xí)技術(shù)的助力下,NID“打碼”速度很快,平均一秒可以識別出2000個驗證碼,是人工“打碼”的2000倍;且正確率很高,可以識別出98%以上的驗證碼。楊某稱,NID程序剛編寫完成,正確率就高達95%,基本能正確識別所有清晰圖片中的文本,他不斷充實樣本庫,給NID程序輸入大量的圖片文件讓其進行識別,NID程序本身就具備很高的識別應(yīng)對能力;此外,NID系統(tǒng)也會自動學(xué)習(xí),它每秒鐘會從用戶反饋的識別錯誤樣本庫中抽取一張比對正確答案進行學(xué)習(xí),這個學(xué)習(xí)過程從編寫出程序到案發(fā)前,時刻進行。驗證碼被NID系統(tǒng)識別出后,黑客竊取半成品信息,相當(dāng)于完成了深加工。數(shù)據(jù)商拿到這些精準(zhǔn)信息,打包組合,出售給個人信息產(chǎn)業(yè)鏈下游的詐騙集團、廣告商,一條精準(zhǔn)的個人信息,甚至可以賣到幾百元。2024/7/24217.3技術(shù)濫用案例人工智能倫理機器學(xué)習(xí)的技術(shù)濫用-“快啊”打碼平臺“快啊”打碼平臺收取信息處理費用,收入的50%給了撞庫軟件開發(fā)者,50%由平臺開發(fā)商平分。短短一年內(nèi),平臺牟利1300多萬元,楊某分得300多萬元。利用NID程序,多的時候,楊柯一個月可以掙六七十萬元。2017年3月23日,“快啊”打碼平臺涉案被越城分局警方偵查。由于該案犯罪手法新穎、社會危害大,成立了由網(wǎng)警牽頭,刑偵、特警、派出所等多部門配合組成的專案組。圍繞該產(chǎn)業(yè)鏈的上下游,專案組輾轉(zhuǎn)福建、廣東、江西、黑龍江、遼寧、山東等13個省展開了偵查、抓捕,抓獲利用黑客技術(shù)非法獲取網(wǎng)站后臺數(shù)據(jù)的嫌疑人4人,使用撞庫軟件獲取賬戶密碼的嫌疑人19人,提供圖片驗證服務(wù)的“快啊”打碼平臺嫌疑人2人,制作“撞庫”軟件的9人,利用公民個人信息實施網(wǎng)絡(luò)犯罪的團伙28個,共159人。一位數(shù)據(jù)安全專家介紹,“快啊”打碼平臺利用NID程序?qū)ψ址万炞C碼的破解,是基于人工智能的深度學(xué)習(xí)框架,使用相關(guān)的網(wǎng)絡(luò)模型訓(xùn)練學(xué)習(xí),來實現(xiàn)對字符型驗證碼的海量快速識別破解。由于字符型驗證碼是互聯(lián)網(wǎng)通用的安全策略,一旦被破解攻陷,將會給包括政企網(wǎng)站在內(nèi)的互聯(lián)網(wǎng)行業(yè)用戶數(shù)據(jù)安全帶來風(fēng)險?;谏疃葘W(xué)習(xí)原理,只要樣本庫足夠豐富,這一智能程序可以識別的東西會越來越多——即使復(fù)雜如鐵路訂票平臺12306的驗證碼,也只是物品種類多、形態(tài)多樣的圖片識別,假以時日,NID程序一樣可以破解。2024/7/24227.3技術(shù)濫用案例人工智能倫理機器學(xué)習(xí)的技術(shù)濫用-“快啊”打碼平臺基于深度學(xué)習(xí),極大降低了網(wǎng)絡(luò)黑產(chǎn)的犯罪成本。如NID程序?qū)ψ址万炞C碼的識別破解已快到毫秒級,“打碼”平臺的效率和業(yè)務(wù)量借此呈指數(shù)級別增長。而作為“驗證”這一重要的網(wǎng)絡(luò)安全環(huán)節(jié),被攻陷后可被不法分子用于多個不同場景作惡,如撞庫、竊取信息、惡意灌水發(fā)帖、刷單、刷點擊量等,危害互聯(lián)網(wǎng)生態(tài)?!耙酝暮诳凸翎槍W(wǎng)站漏洞入侵,相當(dāng)于‘開鎖式進入’,而借助于機器學(xué)習(xí),進攻方式變成了‘硬闖’?!痹摪讣夹g(shù)門檻高,復(fù)雜程度也很大,辦案機關(guān)扣留涉案設(shè)備后需要將“撞庫”軟件、“打碼”平臺程序、神經(jīng)網(wǎng)絡(luò)圖片驗證碼識別程序三個不同功能的軟件重新搭建,模擬現(xiàn)實環(huán)境,全程錄像取證,協(xié)同作業(yè)后,才能認定為一個能完整實現(xiàn)破解識別字符型驗證碼、“撞庫”、“洗庫”的軟件系統(tǒng)。檢察機關(guān)懲治計算機網(wǎng)絡(luò)犯罪遇到取證和證明的難點——網(wǎng)絡(luò)空間所有行為通過數(shù)字化的形式完成,沒有目擊證人,網(wǎng)絡(luò)犯罪證據(jù)多以電子數(shù)據(jù)為主要形態(tài),偵查取證主要依賴技術(shù)手段完成;此外,網(wǎng)絡(luò)犯罪的取證、鑒定、定性等都需要很強的專業(yè)知識,但從目前的實際情況看,既精通法律業(yè)務(wù)又熟悉網(wǎng)絡(luò)技術(shù)的復(fù)合型檢察人才十分缺乏。目前人類已經(jīng)掌握了“弱人工智能”,即能制造出真正推理和解決問題的智能機器,這些機器不會有自主意識,同在各方面能和人類比肩的“強人工智能”和比人類大腦聰明許多的“超人工智能”相比,“弱人工智能”只是人工智能的初級階段,NID系統(tǒng)屬于此列。此案件中,“人工智能”只是輔助犯罪嫌疑人實施犯罪的工具和手段,犯罪主體仍然是人而非機器,尚在中國刑法規(guī)制范圍內(nèi)。2024/7/24237.3技術(shù)濫用案例人工智能倫理機器學(xué)習(xí)的技術(shù)濫用-亞馬遜解雇員工亞馬遜公司一名女員工奧利維蘿因罹患腸易激綜合征,所以每天最多要上六次廁所。但她的主管得知后,要求她在五天內(nèi)取得醫(yī)院證明,否則就要將她解雇。最后,奧利維蘿因為無法在時限內(nèi)取得醫(yī)師證明遭開除。她事后認為,亞馬遜此舉是歧視員工生理問題,違反當(dāng)?shù)亍斗雌缫暦ā罚瑺罡鎭嗰R遜求償7.5萬美元。貝索斯認為,機器學(xué)習(xí)算法比人類更快,更能做出準(zhǔn)確的評斷,并且可以降低大量的成本,所以在管理線上商店、系統(tǒng)派工,以及人資管理系統(tǒng)中引入了新的機器學(xué)習(xí)算法機制以監(jiān)視員工。一位前亞馬遜經(jīng)理級員工認為,目前亞馬遜的算法并沒有足夠的能力去準(zhǔn)確地分析、應(yīng)對突發(fā)狀況,而且亞馬遜內(nèi)部也明白其算法有問題,會誤判。但即便如此,亞馬遜還是認為使用機器算法所需的費用遠遠低于請人調(diào)查之后來解雇員工的成本。這并非是亞馬遜首次因為開除員工而遭遇訴訟,在亞馬遜引入機器學(xué)習(xí)算法判定機制后,不少員工都因為莫名的原因而遭到開除,因此亞馬遜目前也面臨大量類似的訴訟。2024/7/24247.3技術(shù)濫用案例人工智能倫理搜索引擎的技術(shù)濫用-網(wǎng)絡(luò)爬蟲網(wǎng)絡(luò)爬蟲,是一種自動獲取網(wǎng)頁內(nèi)容的程序,是搜索引擎的重要組成部分。網(wǎng)絡(luò)爬蟲為搜索引擎從萬維網(wǎng)下載網(wǎng)頁?;ヂ?lián)網(wǎng)行業(yè)中用戶生產(chǎn)內(nèi)容平臺(UserGeneratedContent,UGC)中數(shù)據(jù)造假情況長期存在,尤其是網(wǎng)絡(luò)“爬蟲”技術(shù)的濫用不僅侵犯相關(guān)平臺知識產(chǎn)權(quán)和消費者合法權(quán)益,還可導(dǎo)致平臺上的用戶敏感信息泄露。2018年10月,微信公號“小聲比比”發(fā)布題為《估值175億的旅游獨角獸,是一座僵尸和水軍構(gòu)成的鬼城?》的文章,援用乎睿數(shù)據(jù)團隊所供數(shù)據(jù)稱,作為馬蜂窩核心資產(chǎn)之一的2100萬“真實點評”中,有1800萬條是通過機器人從攜程等競爭對手那里抄襲過來的。其中,超過7000個抄襲賬號,合計抄襲572萬條餐飲點評,1221萬條酒店點評,占總點評數(shù)的85%。隨著事件日益發(fā)酵,UGC平臺數(shù)據(jù)造假這一行業(yè)問題引發(fā)關(guān)注。業(yè)內(nèi)人士認為,從其它平臺抓數(shù)據(jù)的目的,就是為了制造流量很大的假象,既給用戶看、商家看,更要給投資人看,獲取不同輪次的投資以便上市。而從其它網(wǎng)站抓取商家內(nèi)容頁面和用戶點評數(shù)據(jù)非常簡單,使用“爬蟲”技術(shù)和人工編輯就能做到。2024/7/24257.3技術(shù)濫用案例人工智能倫理搜索引擎的技術(shù)濫用-網(wǎng)絡(luò)爬蟲一位App研發(fā)者李某介紹,爬蟲最早應(yīng)用在搜索引擎領(lǐng)域,爬取網(wǎng)站頁面提供給其用戶進行快速搜索和訪問,當(dāng)前爬蟲技術(shù)已是“大數(shù)據(jù)”概念的重要組成部分,爬取對象也從一些種子擴充至整個網(wǎng)絡(luò)數(shù)據(jù)。一些公司開始利用“爬蟲”技術(shù)從其他平臺惡意抓取數(shù)據(jù)。例如2018年7月,生活分享平臺“小紅書”官微發(fā)布聲明指責(zé)大眾點評大量抄襲小紅書用戶的內(nèi)容,隨后,大眾點評道歉;2018年2月,視頻彈幕網(wǎng)站嗶哩嗶哩大量用戶的視頻、昵稱、頭像及用戶評論,出現(xiàn)在某新成立的視頻網(wǎng)站上;而航空公司的官網(wǎng)上的機票、訂座等信息,長期被代理公司將機票信息爬取、占座,然后在其他網(wǎng)站上加價銷售。網(wǎng)宿科技發(fā)布的《2018上半年中國互聯(lián)網(wǎng)安全報告》顯示,2018年上半年,Web應(yīng)用攻擊總數(shù)環(huán)比增長了97.82%,惡意“爬蟲”攻擊數(shù)量環(huán)比增長了55.79%。另有數(shù)據(jù)顯示,交通出行類惡意“爬蟲”流量占比居首位,其次是電商、社交、點評、運營商、公共行政等,網(wǎng)絡(luò)爬蟲非法使用給互聯(lián)網(wǎng)競爭環(huán)境帶來諸多負面影響?!笆忻嫔洗蟮幕ヂ?lián)網(wǎng)公司都會推出自己的刷票軟件,目的是為了分享12306網(wǎng)站的‘流量紅利’。”“這些刷票軟件用‘爬蟲’等技術(shù)刷新12306網(wǎng)站頁面,截取官網(wǎng)車次、票量等數(shù)據(jù)制作成自己的網(wǎng)站頁面,再使用程序進行搶票,收取不合法的差價。其中,大約一半的12306訂票網(wǎng)站流量來自‘爬蟲’技術(shù)支撐的刷票軟件,不僅給網(wǎng)站服務(wù)器造成巨大壓力,也擾亂了正常的訂票秩序,由此帶來的購票難是鐵路部門一直頭疼的問題。”2024/7/24267.3技術(shù)濫用案例人工智能倫理搜索引擎的技術(shù)濫用-網(wǎng)絡(luò)爬蟲搜狐視頻高級主管閔博認為,濫用網(wǎng)絡(luò)“爬蟲”還有可能對網(wǎng)絡(luò)安全造成影響,引發(fā)網(wǎng)站服務(wù)器宕機?!耙恍老x’工具的使用者在采取‘全站爬取’的模式時,相當(dāng)于模擬大量用戶在短時間內(nèi)對源站服務(wù)器發(fā)起訪問請求,一旦訪問量在瞬間達到承載極值,就會引起服務(wù)器宕機,從而威脅網(wǎng)絡(luò)空間的安全?!边€有業(yè)內(nèi)人士指出,濫用網(wǎng)絡(luò)“爬蟲”抓取的信息不僅可以用于同類型平臺制作,還可能被轉(zhuǎn)售或者可能用于釣魚網(wǎng)站制作等其他違法行為,不但會給平臺帶來重大損失,還可能導(dǎo)致平臺上的用戶敏感信息泄露,進而使用戶遭遇各類網(wǎng)絡(luò)和電信詐騙。在社交網(wǎng)站和購物網(wǎng)站檢索時,一些賣家堂而皇之地售賣“爬蟲”自動評價軟件或進行個人隱私信息爬取的接派單任務(wù)。在QQ群搜索中輸入關(guān)鍵詞“網(wǎng)絡(luò)爬蟲”,也會出現(xiàn)多個涉及外包網(wǎng)絡(luò)“爬蟲”技術(shù)的群組。業(yè)內(nèi)人士透露,這些群組中進行的網(wǎng)絡(luò)“爬蟲”任務(wù)大部分都屬于未獲授權(quán)而進行的違規(guī)爬取操作,由于該項技術(shù)具有一定的隱秘性,在爬取普通用戶隱私數(shù)據(jù)時較難被識別。山東日中律師事務(wù)所律師陳某表示,公司未經(jīng)許可或授權(quán)的情況下利用“爬蟲”技術(shù)獲得可能帶來商業(yè)利益的信息可以被判定構(gòu)成不正當(dāng)競爭。新華每日電訊記者梳理相關(guān)案件發(fā)現(xiàn),法院往往認為,技術(shù)作為一種工具手段在價值上具有中立性,但這并不意味著技術(shù)本身可以作為豁免當(dāng)事人法律責(zé)任的依據(jù)。2024/7/24277.3技術(shù)濫用案例人工智能倫理“一個技術(shù)如何使用,責(zé)任主體都應(yīng)捫心自問,這是否侵犯個人隱私,是否破壞言論自由,是否損害公共利益,是否損害其他數(shù)據(jù)財產(chǎn)擁有者的財產(chǎn)所有權(quán),是否涉及不正當(dāng)競爭。許多大的互聯(lián)網(wǎng)公司,會同時有‘爬蟲’部門和‘反爬蟲’部門。‘爬蟲’技術(shù)在互聯(lián)網(wǎng)行業(yè)已被廣泛使用,但‘爬蟲’絕不能成為害蟲?!本W(wǎng)絡(luò)蜘蛛(WebSpider),是一個很形象的名字。把互聯(lián)網(wǎng)比喻成一個蜘蛛網(wǎng),那么Spider就是在網(wǎng)上爬來爬去的蜘蛛。從網(wǎng)站某一個頁面(通常是首頁)開始,讀取網(wǎng)頁的內(nèi)容,找到在網(wǎng)頁中的其它鏈接地址,然后通過這些鏈接地址尋找下一個網(wǎng)頁,這樣一直循環(huán)下去,直到把這個網(wǎng)站所有的網(wǎng)頁都抓取完為止。如果把整個互聯(lián)網(wǎng)當(dāng)成一個網(wǎng)站,那么網(wǎng)絡(luò)蜘蛛就可以用這個原理把互聯(lián)網(wǎng)上所有的網(wǎng)頁都抓取下來。網(wǎng)絡(luò)蜘蛛就是一個爬行程序,一個抓取網(wǎng)頁的程序。網(wǎng)絡(luò)爬蟲(Webcrawler),是一種按照一定的規(guī)則,自動地抓取萬維網(wǎng)信息的程序或者腳本,它們被廣泛用于互聯(lián)網(wǎng)搜索引擎或其他類似網(wǎng)站,可以自動采集所有其能夠訪問到的頁面內(nèi)容,以獲取或更新這些網(wǎng)站的內(nèi)容和檢索方式。從功能上來講,爬蟲一般分為數(shù)據(jù)采集,處理,儲存三個部分。傳統(tǒng)爬蟲從一個或若干初始網(wǎng)頁的URL開始,獲得初始網(wǎng)頁上的URL,在抓取網(wǎng)頁的過程中,不斷從當(dāng)前頁面上抽取新的URL放入隊列,直到滿足系統(tǒng)的一定停止條件?!胺磁老x”技術(shù)有兩種:一種是限制同一IP、同一電腦在一定時間內(nèi)訪問網(wǎng)站的次數(shù),另一種是設(shè)置復(fù)雜驗證碼機制,讓“爬蟲”不好識別。但對一些網(wǎng)站來說,封IP的做法可能誤傷真實用戶,而設(shè)置一個非常復(fù)雜的驗證碼,又可能損失用戶。因此,除了加大技術(shù)防范力度之外,要運用好法律手段,克服取證難的盲點,明確使用紅線。搜索引擎的技術(shù)濫用-網(wǎng)絡(luò)爬蟲2024/7/24287.3技術(shù)濫用案例人工智能倫理搜索引擎的技術(shù)濫用-魏則西事件2014年4月,正在西安電子科技大學(xué)讀大二的魏則西檢查出滑膜肉瘤,這是一種惡性軟組織腫瘤,尙沒有有效的治療手段,生存率極低,五年生存率是20%-50%!之后魏則西在百度上搜索滑膜肉瘤,并通過百度推薦找到武警北京第二醫(yī)院的生物免疫療法。2014年9月至2015年底,魏則西先后在武警北京第二醫(yī)院進行了4次生物免疫療法的治療,花了二十多萬元,結(jié)果卻是未能如愿,治病的巨額花費將家里積蓄掏空。2015年8月,絕望的魏則西在知乎上發(fā)帖提問:“二十一歲癌癥晚期,自殺是否是更好的選擇?”2016年4月12日上午8時17分,魏則西在咸陽的家中去世,終年22歲。魏則西去世當(dāng)天,在一則“魏則西怎么樣了?”的知乎帖下,魏則西父親用魏則西的知乎賬號回復(fù)稱:“我是魏則西的父親魏海全,則西今天早上八點十七分去世,我和他媽媽謝謝廣大知友對則西的關(guān)愛,希望大家關(guān)愛生命,熱愛生活?!?016年2月,知乎上有人提問:“你認為人性最大的‘惡’是什么?”魏則西將自己的故事作為回答:“醫(yī)院,是在百度上搜的,排名領(lǐng)先,療法‘說得特別好’,然而在該醫(yī)院治療后致病情耽誤,更可悲的是被網(wǎng)友告知生物免疫療法是被國外臨床淘汰的技術(shù)?!痹撎?,他還質(zhì)疑百度競價排名的醫(yī)療信息有誤導(dǎo)之嫌。該網(wǎng)帖引發(fā)網(wǎng)友廣泛關(guān)注,有言論稱武警二院生物診療中心早已被“莆田系醫(yī)院”外包。莆田人以治療皮膚病的游醫(yī)起家,莆田人在全國建立的民營醫(yī)院已經(jīng)占到中國民營醫(yī)院的80%左右,被稱為“莆田系醫(yī)院”。2024/7/24297.3技術(shù)濫用案例人工智能倫理搜索引擎的技術(shù)濫用-魏則西事件2016年5月2日,國家網(wǎng)信辦會同國家工商總局、國家衛(wèi)生計生委成立聯(lián)合調(diào)查組進駐百度公司,對此事件進行調(diào)查并依法處理。對此,百度公司發(fā)布聲明,表示百度將全力配合主管部門調(diào)查,接受監(jiān)督,不給互聯(lián)網(wǎng)虛假信息和違法行為留下可乘之機。例如,企業(yè)在百度注冊提交“推薦系統(tǒng)”這個關(guān)鍵詞,當(dāng)消費者或網(wǎng)民尋找“推薦系統(tǒng)”的信息時,企業(yè)就會被優(yōu)先找到,顯示在搜索結(jié)果頁面的顯著位置,百度按照點擊量(潛在客戶訪問數(shù))收費,每次有效點擊收費從幾毛錢到幾塊錢不等,由企業(yè)產(chǎn)品的競爭激烈程度決定。此項營銷策略每年可以給百度公司帶來大量的營收。用戶在使用百度搜索引擎搜索關(guān)鍵詞時,百度公司利用自己對網(wǎng)頁數(shù)據(jù)的壟斷地位,在向網(wǎng)民呈現(xiàn)搜索結(jié)果時,并不是按照信息的重要性來對搜索結(jié)果進行排序,而是把一些百度推廣的營銷內(nèi)容放在了搜索結(jié)果頁面的最顯著位置。魏則西事件更是使得百度這一營銷做法備受爭議。由此,眾多網(wǎng)友質(zhì)疑百度推廣提供的醫(yī)療推薦信息有誤導(dǎo)之嫌,耽誤了魏則西的病情和最佳治療時機,最終導(dǎo)致魏則西失去生命。百度是國內(nèi)最大的搜索引擎服務(wù)供應(yīng)商,從某個角度而言,已經(jīng)在一定程度上形成了數(shù)據(jù)壟斷。百度推廣是百度公司推出的網(wǎng)絡(luò)營銷服務(wù),企業(yè)在向百度公司購買該項服務(wù)后,通過注冊提交一定量數(shù)量的關(guān)鍵詞,其推廣消息就會率先在網(wǎng)民相應(yīng)的搜索結(jié)果中。亦即,當(dāng)用戶利用某一關(guān)鍵詞進行信息檢索時,在檢索結(jié)果頁面會出現(xiàn)該關(guān)鍵詞相關(guān)的內(nèi)容。2024/7/24307.3技術(shù)濫用案例人工智能倫理語音識別的技術(shù)濫用-語音機器人2019年4月,鄭州市公安局破獲的一起詐騙案,某公司先從網(wǎng)上購買AI機器人電話軟件,由電話機器人自動操作,以每天1000-1500個的速度撥打客戶電話,一旦客戶沒有拒絕接聽,人工智能語音機器人就會記下該電話號碼,然后,由業(yè)務(wù)員主動添加該客戶的微信吸引他們充值投資,一旦資金到賬,就迅速拉黑對方。2018年,美國聯(lián)邦委員會向四家在全美境內(nèi)提供非法機器人呼叫電話投放服務(wù)的運營商發(fā)起了訴訟。這些公司會向人們推銷虛假的能減免債務(wù)的服務(wù),或者,偽裝成慈善機構(gòu)欺騙大家捐贈汽車等財務(wù),再把它們賣掉。2019年,美國境內(nèi)民眾接到的“機器人騷擾電話”總數(shù)超過500億個,也就是說,平均一個美國人每個月會接到15個“機器人騷擾電話”。艾媒咨詢(iiMediaResearch)的統(tǒng)計數(shù)據(jù)顯示,僅2018年,中國的騷擾電話撥打數(shù)量已經(jīng)超過500億,生活中騷擾電話占到全部通話量一半以上的用戶超20%,每周都受到騷擾電話困擾的用戶超80%。2018年12月,中國工業(yè)和信息化部就收到了8.6萬起關(guān)于“騷擾電話”的公眾投訴——這是2017年同期的3倍。2021年10月,河南省安陽市的劉小姐反映,她最近這段時間內(nèi)經(jīng)常接到不同地區(qū)不同號碼的國美金融的人工智能機器人催債電話,但在接到電話之后,劉小姐向國美金融官方客服核實自己的手機號是否在國美金融有貸款記錄或注冊信息的時候發(fā)現(xiàn),劉小姐的手機號在國美金融沒有任何的貸款記錄或注冊信息。2024/7/24317.3技術(shù)濫用案例人工智能倫理語音識別的技術(shù)濫用-語音機器人南京硅基智能(SiliconIntelligence)科技有限公司是一家語音機器人開發(fā)商,據(jù)報道去年他們總收入為1億元人民幣。該公司的核心機器人“硅語”有中文、英文和日文三個版本。硅基智能科技稱,該公司主要向銷售公司出售“硅語”的技術(shù),平均售價為1萬元。銷售公司則利用“硅語”與消費者進行互動,包括給他們打電話。硅基智能創(chuàng)始人司馬華鵬表示:“我們基本上是在打造一個電話版的Siri?!薄肮枵Z”機器人背后的技術(shù)包括:對話開始時,“硅語”會識別出顧客所說的內(nèi)容,并將其以文本的形式寫出來——這被稱為“自動語音識別”。接著,機器人通過查閱包含大量短語和句子的數(shù)據(jù)庫來理解文本,這一過程被稱為“自然語言理解”,然后對其做出反應(yīng)。最后,在一種被稱為“文本轉(zhuǎn)成語音”的機制中,“硅語”將它的書面反應(yīng)轉(zhuǎn)化為語音?!肮枵Z”的效率大約是人類呼叫中心接線員的25倍,“它每天可以打1000個電話,這是人類的5倍,并且成本只有雇傭一名員工的五分之一”,司馬華鵬補充道,假設(shè)中國呼叫中心人員的平均年薪5萬元左右,那么機器人每年通常僅需要1萬元左右花費。硅基智能與人力資源的差別遠不止工作效率這一項。該公司表示,機器人不需要培訓(xùn),從不抱怨工作,而且工作效率高、不帶感情?!暗侥壳盀橹?,我們的機器人可能已經(jīng)打了數(shù)十億個電話了”。據(jù)《中國新聞》2018年11月的報道,2016年至2017年,中國智能語音產(chǎn)業(yè)的增長速度是70%,而全球的速度僅為30%。2017年,中國智能語音市場價值約159億元人民幣(合23億美元);根據(jù)錫安市場研究(ZionMarketResearch)的數(shù)據(jù),2017年全球市場價值僅62億美元。2024/7/24327.3技術(shù)濫用案例人工智能倫理語音識別的技術(shù)濫用-語音機器人在世界消費者權(quán)益日315晚會上,央視曝光了多家企業(yè)幕后的智能騷擾電話的灰色產(chǎn)業(yè)鏈。這些企業(yè)會為有商業(yè)營銷需要的公司提供機器人電話撥打服務(wù)。有些甚至?xí)苯愉N售這樣的機器,每個價值3000元,機器系統(tǒng)是專門為電話營銷服務(wù)的。這樣的機器一天能打5000個電話,一年能打超過40億個電話。有些公司為了提高可信度,還特意配備了專業(yè)的錄音棚,提供不同的聲音。大多數(shù)機器人會記錄每一次通話,以供參考,但客戶很少被告知這種做法——實際上,很少有人知道打電話的是機器人。2019年1月,南方周末報道稱,許多購買語音機器人服務(wù)的公司將它們與網(wǎng)絡(luò)抓取工具結(jié)合起來,這些工具在未經(jīng)所有者同意的情況下非法收集電話號碼和其它個人數(shù)據(jù)。有些甚至從保險公司或房地產(chǎn)公司非法購買聯(lián)系方式,并向機器人提供盡可能多的個人信息。專門從事隱私保護和網(wǎng)絡(luò)安全的律師認為,“如果一家機器人公司將其收集的個人數(shù)據(jù)用于除最初聲明的用途外的任何其他目的,他們也侵犯了消費者根據(jù)《消費者法》所享有的知情權(quán)?!惫杌悄芘c人力資源的差別遠不止工作效率這一項。該公司表示,機器人不需要培訓(xùn),從不抱怨工作,而且工作效率高、不帶感情?!暗侥壳盀橹梗覀兊臋C器人可能已經(jīng)打了數(shù)十億個電話了”2024/7/24337.3技術(shù)濫用案例人工智能倫理語音識別的技術(shù)濫用-語音模仿軟件據(jù)《每日郵報》報道,一名詐騙犯利用人工智能語音模仿軟件冒充公司大老板,成功讓一家英國能源公司的首席執(zhí)行官相信自己正在與德國母公司的老板通電話。在電話中,詐騙犯要求這位首席執(zhí)行官立即將22萬歐元轉(zhuǎn)到匈牙利一家供應(yīng)商的銀行賬戶,以避免繳納“滯納金”,并將轉(zhuǎn)賬信息以郵件形式發(fā)送,這位高管毫不猶豫地照做了。最終,這22萬歐元一去不復(fù)返。這家能源公司承保人裕利安宜公司(EulerHermes)向媒體透露了此案的細節(jié)。據(jù)報道,此案被認為是全球首例涉及人工智能的詐騙案,這再度引發(fā)了人們對人工智能軟件被用于犯罪的擔(dān)憂。據(jù)《華盛頓郵報》(TheWashingtonPost)報道,這位首席執(zhí)行官后來在一封電子郵件中指出,這個要求相當(dāng)“奇怪”,但“大老板”的德國口音非常逼真,他覺得自己別無選擇,只能服從。2024/7/24347.3技術(shù)濫用案例人工智能倫理語音識別的技術(shù)濫用-語音模仿軟件裕利安宜公司指出,這位公司高管當(dāng)時以為自己是在和他的德國老板談話,于是按照要求在一個小時內(nèi)電匯了這筆錢,為的是幫助公司避免拖欠罰款。這家保險公司表示:“騙子使用的人工智能軟件,不僅能夠模仿他人的聲音、語調(diào),甚至還能模仿帶德國口音的英語?!睋?jù)悉,騙子一共打了三次電話。第二次電話是在22萬歐元匯出后,對方打電話告訴這位高管,母公司會轉(zhuǎn)移資金償還英國公司的費用。在當(dāng)天晚些時候,當(dāng)這位高管接到第三次電話,對方故技重施冒充德國老板要求第二次付款時,他才意識到不對勁。由于對方承諾的轉(zhuǎn)賬償還資金并沒有收到,且這次的電話號碼顯示來自奧地利,出于懷疑,他沒有支付第二筆款項,而是直接致電德國老板本人,結(jié)果發(fā)現(xiàn)自己被騙?!埃俚模s翰內(nèi)斯’甚至在我正與真正的約翰內(nèi)斯通話時,要求跟我通話!”這位首席執(zhí)行官在一封電子郵件中說道。然而,裕利安宜公司表示,等發(fā)現(xiàn)真相時,第一筆匯出22萬歐元已通過匈牙利和墨西哥的賬戶被轉(zhuǎn)移分散到了多個賬戶,目前還沒有查到嫌疑人,這筆錢已無法找回。最終,保險公司承諾將承擔(dān)全部的損失費用。2024/7/24357.3技術(shù)濫用案例人工智能倫理計算機視覺技術(shù)濫用深度偽造技術(shù)(Deepfake)是通過深度學(xué)習(xí)偽造數(shù)字內(nèi)容的人工智能技術(shù),實質(zhì)上是一種聲音、圖像與視頻的智能處理技術(shù),能夠模仿特定人物或者讓特定人物看起來在做特定的事件,其效果可以達到以假亂真的程度。

“Deepfake”詞是一個Reddit網(wǎng)站的Deepfake用戶名,該用戶在2017年12月使用深度學(xué)習(xí)技術(shù)在色情視頻剪輯中編輯名人的面孔。2018年4月,網(wǎng)絡(luò)黑客運用深度偽造技術(shù)偽造了美國前總統(tǒng)奧巴馬(BarackObama)語言侮辱特朗普(DonaldTrump)的視頻,該視頻在推特上短時間內(nèi)被點擊了200多萬次,對美國政府形象造成了極大的不良影響。2018年10月,加蓬世襲總統(tǒng)邦戈(AliBongo)生病出國治療,此后很長一段時間都沒有在公眾面前露面,而政府未對總統(tǒng)的情況作出聲明,導(dǎo)致陰謀論四起,甚至有人認為總統(tǒng)已經(jīng)故去。但很快,新的一年要來了,按舊例,總統(tǒng)要在這個時候發(fā)表新年致辭,許多人都期待著總統(tǒng)的出現(xiàn)。結(jié)果,讓人萬萬沒想到的是,加蓬政府玩了一回不尋常操作:放了一段深度偽造的總統(tǒng)新年致辭視頻。視頻中,這位總統(tǒng)全程就沒眨眼,誰都能看出這個視頻不太對勁。一周后,加蓬的一些軍方人士認為總統(tǒng)的真實狀態(tài)一定非常不好,于是發(fā)動了一次政變。幸好,政變最終沒能成功。深度偽造技術(shù)門檻不斷降低,部分人將深度偽造技術(shù)用于煽動網(wǎng)絡(luò)暴力、破壞政治選舉、擾亂外交關(guān)系、偽造虛假證據(jù)等不法用途,在“所見即真實”的認知定律下,虛假視頻及新聞在社交媒體的加持下加速傳播,使得深度偽造技術(shù)濫用后果不斷加劇。2024/7/24367.3技術(shù)濫用案例人工智能倫理計算機視覺技術(shù)濫用2019年9月的一檔意大利諷刺節(jié)目里,播出了一段意大利前總理倫齊(MatteoRenzi)侮辱其他意大利政客的視頻。雖然視頻中前總理的身體是演員的,節(jié)目組只是把頭部深度偽造了一下,但是居然有民眾信了,看完之后民眾深深的懷疑自己所生活的這個國家。2020年2月,在印度德里邦議會選舉中,提瓦里(ManojTiwari),為了拉攏小語種選民,便利用視頻深度偽造技術(shù),“說”了一段自己并不會的語言進行拉票。這段視頻取得了不錯的效果,一般人根本看不出破綻,所以一開始不僅沒被懷疑,而且反響一度十分熱烈,為候選人爭取到了更多選票。深度偽造技術(shù)的濫用還極大影響了個人生活,2019年6月,基于深度偽造技術(shù)開發(fā)的應(yīng)用程序DeepNude走紅網(wǎng)絡(luò),該應(yīng)用可以自動消除圖片中女性衣物,被應(yīng)用于制作名人的虛假色情視頻,對女性隱私以及日常生活造成嚴重影響,引發(fā)了全社會對于人工智能技術(shù)不正當(dāng)利用的擔(dān)憂,目前該應(yīng)用已被開發(fā)者禁用。2024/7/24377.3技術(shù)濫用案例人工智能倫理計算機視覺技術(shù)濫用2019年8月,一款名為“ZAO”的換臉軟件在中文網(wǎng)絡(luò)中推出,只要上傳一張正面照片,就能將影視作品中的明星換成自己的臉?!癦AO”瞬時引起網(wǎng)絡(luò)狂歡,但隨即因?qū)駛€人信息的過度搜集以及可能的社會安全風(fēng)險而受到工信部門的約談。深度偽造技術(shù)還可以從零開始創(chuàng)建令人信服但完全是虛構(gòu)的照片。2019年,領(lǐng)英(LinkedIn)上出現(xiàn)了一個疑似間諜的賬號。她的名字是瓊斯(KatieJones),頭像是一個典型的白人女性,畢業(yè)于密歇根大學(xué),在美國國際戰(zhàn)略研究中心(CenterforStrategicandInternationalStudies,CSIS)工作。她的職場網(wǎng)絡(luò)雖然只有50多人,但里面有美國參議員助理、副助理國務(wù)卿,以及美聯(lián)儲席位候選人兼經(jīng)濟學(xué)家溫德福(PaulWindfree)。根據(jù)調(diào)查,CSIS根本沒有這樣一個員工,密歇根大學(xué)也沒有她的學(xué)位記錄,而且她聯(lián)系網(wǎng)內(nèi)的人都不認識她。肖像審查專家判斷,她的頭像很可能是用AI技術(shù)生成的,很多特征與AI偽造頭像高度吻合。再結(jié)合她添加的人都是政府重要人物,專家普遍認為,其目的很可能是隱藏自己,從他們身上獲取信息,甚至添加更多位高權(quán)重的人物,將領(lǐng)英作為從事隱秘間諜活動的渠道。2024/7/24387.3技術(shù)濫用案例人工智能倫理計算機視覺技術(shù)濫用深度偽造技術(shù)的濫用風(fēng)險已經(jīng)引起美國國家高層的高度重視。美國眾議院議長佩羅西的虛假合成視頻在社交媒體上的廣泛流傳更是加劇了美國立法者對深度偽造技術(shù)的擔(dān)憂。在美國2020年大選來臨之際,美國立法者開始尋求措施,意圖從根源上阻止深度偽造技術(shù)的不當(dāng)利用。在此背景下,2019年6月12日,美國國會提出《深度偽造責(zé)任法案》,旨在通過限制深度偽造合成技術(shù),打擊虛假信息的傳播。美國《深度偽造責(zé)任法案》的主要內(nèi)容包括:①深度偽造內(nèi)容制作者具有披露義務(wù)。利用深度偽造技術(shù)合成虛假內(nèi)容放置于網(wǎng)絡(luò)上傳播,制作者應(yīng)當(dāng)采用嵌入數(shù)字水印、文字、語音標(biāo)識等方式披露合成信息。違反披露義務(wù)的制作者或者惡意刪除披露信息的行為人需承擔(dān)民事責(zé)任,行為惡劣、造成嚴重后果的還會面臨罰金、人身監(jiān)禁等刑事處罰。②受害主體享有私人訴權(quán)。自然人或者法人因深度偽造內(nèi)容遭受實際損害的,可以向法院申請禁令救濟,或者對深度偽造內(nèi)容制作者提起民事訴訟,要求其承擔(dān)損害賠償責(zé)任。在民事訴訟中,如果原告請求且有證據(jù)證明訴訟涉及個人隱私,法院應(yīng)允許訴訟不公開審理。③假冒行為應(yīng)包括采用深度偽造技術(shù)實施的冒充身份的行為。法案修訂美國法典第18章第1028節(jié)關(guān)于假冒身份的現(xiàn)有法律規(guī)定,利用深度偽造技術(shù)實施數(shù)字冒名頂替行為也應(yīng)視為假冒身份行為。④政府應(yīng)采取措施開發(fā)相關(guān)檢測識別技術(shù)。法案要求政府成立深度偽造特別小組,其職責(zé)包括研究開發(fā)對包括深度偽造在內(nèi)的圖像、音視頻操縱技術(shù)的檢測識別和反制技術(shù),為研究此類技術(shù)的其他政府部門提供行政和科學(xué)支持,與私營企業(yè)或?qū)W術(shù)機構(gòu)合作開發(fā)檢測識別工具等。2024/7/24397.3技術(shù)濫用案例人工智能倫理計算機視覺技術(shù)濫用“ZAO”軟件的火爆給“深度偽造”蒙上了陰影。為了防范深度偽造的危害,2018年3月,原國家新聞出版廣電總局下發(fā)通知規(guī)定:“堅決禁止非法抓取、剪拼改編視聽節(jié)目的行為,并嚴格管理包括網(wǎng)民上傳的類似重編節(jié)目,不給存在版權(quán)問題、內(nèi)容問題等的剪拼改編視聽節(jié)目提供傳播渠道?!眹一ヂ?lián)網(wǎng)信息辦公室、文化和旅游部、國家廣播電視總局于2019年11月18日發(fā)布,并于2020年1月1日起生效實施的《網(wǎng)絡(luò)音視頻信息服務(wù)管理規(guī)定》亦對深度偽造做出了回應(yīng)。2020年3月1日起施行的國家互聯(lián)網(wǎng)信息辦公室《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》第23條再次重申相關(guān)主體不得利用深度學(xué)習(xí)、虛擬現(xiàn)實等新技術(shù)新應(yīng)用從事法律、行政法規(guī)禁止的活動。2021年1月1日起施行的《民法典》第1019條規(guī)定,任何組織或個人不得利用信息技術(shù)手段偽造等方式侵害他人的肖象權(quán)。行政規(guī)制和民事規(guī)制的路徑固然有其積極效能,但是當(dāng)“深度偽造”的危害性達到一定量級時,刑法制裁手段依然是必不可少的。2020年3月1日起施行的國家互聯(lián)網(wǎng)信息辦公室《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》第23條再次重申相關(guān)主體不得利用深度學(xué)習(xí)、虛擬現(xiàn)實等新技術(shù)新應(yīng)用從事法律、行政法規(guī)禁止的活動。2024/7/24407.3技術(shù)濫用案例人工智能倫理自然語言處理的濫用-Facebook放大仇恨言論2021年10月3日,臉書(Facebook)前雇員豪根(FrancesHaugen)在美國60Minutes節(jié)目上揭露了社交媒體平臺臉書的一些內(nèi)部運作機制。她表示,一家致力于產(chǎn)品優(yōu)化的公司,卻采用了放大仇恨言論(HateSpeech)的算法。此前的一項數(shù)據(jù)顯示了臉書在致力于反對仇恨言論上所做的努力?,F(xiàn)在看來更像是一場笑話。雖然該公司一再聲稱,至少在自己產(chǎn)品上,它正在幫助阻止仇恨言論,但豪根泄露的臉書內(nèi)部文件表明:“我們預(yù)計,我們的優(yōu)化可能只會對臉書上3%-5%仇恨言論、大約0.6%的暴力和煽動內(nèi)容產(chǎn)生作用,盡管在這一點上我們已經(jīng)做到世界上最好了?!绷硪环菸募踔粮又卑祝何覀儚母鞣N渠道獲得的證據(jù)表明,仇恨言論、分裂性政治言論以及臉書和旗下其他應(yīng)用程序的錯誤信息正在影響世界各地的社交平臺。豪根聲稱,問題的根源在于“2018年推出的算法控制了你在平臺上看到的東西”。你用手機滑動五分鐘,可能只能看到100條內(nèi)容,但是臉書可以向你展示成千上萬種選擇。該算法根據(jù)你過去接觸最多的內(nèi)容類型來推送信息,通過參與度來優(yōu)化內(nèi)容。她表示,臉書為了提高用戶的參與度,發(fā)現(xiàn)最好的參與方式便是向用戶灌輸恐懼和憎恨,因為激發(fā)人們的憤怒比激發(fā)其它情緒更容易。當(dāng)時,扎克伯格(MarkZuckerberg)稱算法的優(yōu)化是正面的。“我們覺得有責(zé)任確保我們的服務(wù)不僅僅是有趣的,而且有益于人們的福祉?!?024/7/24417.3技術(shù)濫用案例人工智能倫理自然語言處理的濫用-Facebook放大仇恨言論臉書對社會負面影響的案例有很多。例如,2018年緬甸軍方利用臉書宣揚種族滅絕,包括種族暴力。還有2020年大選,臉書明白其潛在的危險,因此啟動了安全系統(tǒng),以減少錯誤信息。但豪根表示,許多變化都是暫時的,選舉一結(jié)束,他們就把安全系統(tǒng)關(guān)閉了。在選舉之后,臉書被一些人用來組織1月6日的起義,即2021年美國國會大廈遭沖擊事件。檢察官引用臉書上的帖子作為證據(jù)——武裝游擊隊員的照片和文字,包括“通過子彈或選票恢復(fù)共和國即將到來!”這樣的信息。這些極端分子使用了很多平臺,但臉書反復(fù)出現(xiàn)?!爱?dāng)你消費更多內(nèi)容時,臉書會賺更多的錢?!蹦槙帉懰惴ǖ姆绞秸诟淖儦W洲主要政黨領(lǐng)導(dǎo)國家的方式。豪根獲得的這份2019年的內(nèi)部報告稱,對算法的改變迫使他們在臉書上的溝通對其產(chǎn)生負面影響,導(dǎo)致他們采取更加極端的政策立場。除了臉書,其危害也帶到了Instagram上。一項研究表明,13.5%的青少年說Instagram讓自殺的想法更糟糕;17%的青少年說Instagram讓飲食失調(diào)更嚴重。就在2021年9月,臉書表示,它將推遲為更小的孩子創(chuàng)建Instagram計劃。2024/7/24427.3技術(shù)濫用案例人工智能倫理自然語言處理的濫用-Facebook放大仇恨言論2021年10月13日,美國國會參議院商務(wù)委員會主席坎特維爾(MariaCantwell)發(fā)聲?!昂栏淖C詞引發(fā)了人們對臉書是否誤導(dǎo)公眾、聯(lián)邦監(jiān)管機構(gòu)和參議院商務(wù)委員會的嚴重擔(dān)憂?!笨蔡鼐S爾表示,“參議院商務(wù)委員會將繼續(xù)監(jiān)督并努力推動立法以保護消費者隱私、改善數(shù)據(jù)安全,并加強聯(lián)邦執(zhí)法以解決數(shù)字危害的問題,這正是我們召開這些聽證會的主題?!彼竽槙4婧栏岬降哪槙鴥?nèi)部研究文件,以及臉書對該研究的評估、排名或組合系統(tǒng),改變這些排名系統(tǒng)的實驗或建議,以及臉書平臺對18歲以下兒童和青少年的影響。2021年10月,美國參議院商務(wù)委員會對臉書提出嚴厲批評,指責(zé)扎克伯格一味追求更高利潤而罔顧用戶安全,并要求監(jiān)管機構(gòu)調(diào)查“吹哨人”豪根對這家社交媒體公司損害兒童心理健康和煽動分歧言論的指控。扎克伯格則為該公司提出辯護,稱這些指控與臉書的目標(biāo)不符。豪根呼吁,在臉書如何吸引用戶關(guān)注,從而為廣告商創(chuàng)造足夠的機會來接觸用戶的問題上,該公司應(yīng)做到公開透明。2024/7/24437.3技術(shù)濫用案例人工智能倫理自然語言處理的濫用-推特機器人賬戶社交媒體已成為我們?nèi)粘2豢煞指畹囊徊糠?,在美國,?dāng)有重大新聞爆發(fā)時,大約三分之二的人都可以實時在線查收,第一時間通過推特(Twitter)等社交平臺拿到事件的一手消息。2018年4月皮尤研究中心的報告稱:推特平臺上近95%賬戶都是機器人賬戶,不僅如此,這些機器人賬戶傳播的推特鏈接已覆蓋66%的流行網(wǎng)站,同時89%的新聞聚合網(wǎng)站鏈接也都來自僵尸網(wǎng)站。推特社交平臺上的機器人賬戶會大規(guī)模擴散其推文,將用戶接收推文的范圍及注意力無限放大,也會把媒體新聞事件的影響力加重或減輕。從外媒報道來看,越來越多“僵尸用戶”用于傳播被歪曲事實信息,在經(jīng)濟和政治上產(chǎn)生了一定影響。機器人賬號有一個非常有意思的行為方式,那就是在假消息傳播的早期尤為活躍,并且更傾向于針對有影響力的用戶。這些機器賬戶可能會將媒體所報道的事實以“傾向”用戶感受方式進行推文,或者可能會根據(jù)環(huán)境、政治等因素以一種自我錯誤的主張推向用戶。2013年,敘利亞電子軍當(dāng)時攻擊了美聯(lián)社的推特帳戶,同時刊登了一篇虛假信息——關(guān)于奧巴馬總統(tǒng)在恐怖襲擊事件中受傷的消息,結(jié)果消息一出,立即導(dǎo)致了平臺暫時性的“崩潰”,后來直到這場“惡作劇”被揭露,風(fēng)波才過去。僵尸網(wǎng)站最早用于形容中國基層政府網(wǎng)站。后指那類長期沒人維護、信息長期不更新,沒有生機和活力且不被搜索引擎收錄的網(wǎng)站僵尸用戶是指那些沒有生命力的沉默用戶或者圍觀用戶2024/7/24447.3技術(shù)濫用案例人工智能倫理自然語言處理的濫用-推特機器人賬戶佛羅里達大學(xué)新聞與傳播學(xué)院教授瓦德爾(FrankWaddell)表示說:“這些機器人制作的虛假信息過去在塑造公眾輿論方面非常有效,與一個正常用戶的推特賬戶相比,其發(fā)布的推文和分享已達到了一定的規(guī)模,再加之通過充分闡述自己的內(nèi)容,它們有效的塑造了公眾輿論的本質(zhì)?!痹?jīng)擔(dān)任德克薩斯州州長的佩里(RickPerry)的選戰(zhàn)主管約翰遜(RobJohnson)表示:“推特已經(jīng)展示出其在政界不可撼動的地位,推特也改變了這個政治圈,未來我們只需要去推特上拿到一手新聞就可以了,它將會發(fā)揮更大的作用?!?012年美國總統(tǒng)大選中,推特經(jīng)常會取代新聞,成為重要的、原始的消息首發(fā)地。推特在政界,可謂已成為“政界的幕后推動力”。據(jù)了解,當(dāng)時總統(tǒng)候選人的競爭對手都會利用社交平臺去詆毀、抨擊對方,隨后,大量機器賬戶就會自動進行推文覆蓋至整個網(wǎng)絡(luò),與此同時相應(yīng)的政治記者也會第一時間從推特中獲取消息。機器人賬戶引爆的“推特炸彈”,有效地塑造了公眾輿論。66%的美國人都知道這些機器人存在,而且其中高達80%的人都認為這些機器人的目的“不純”,可能包括詆毀、具有傾向性及錯誤言論等。但盡管如此,大部分的美國人都不能準(zhǔn)確地識別出哪些是“僵尸用戶”,調(diào)查顯示,只有47%的受訪者表示可能會識別出機器人,而其中僅有7%的人對“可以準(zhǔn)確地識別出”表示肯定。美國民眾在社交平臺如此容易上當(dāng)受騙已不再是一個小小風(fēng)波,產(chǎn)生的影響會波及整個美國甚至是世界。2024/7/24457.3技術(shù)濫用案例人工智能倫理自然語言處理的濫用-GPT2生成假新聞2019年2月,馬斯克倡導(dǎo)成立的AI研究機構(gòu)OpenAI展示了一款自然語言處理模型GPT-2,該模型內(nèi)部包含了15億個參數(shù),在800萬個網(wǎng)頁數(shù)據(jù)集上訓(xùn)練而成。GPT-2模型能夠根據(jù)人類給出的一些句子,編寫接下來的文本,同時在此基礎(chǔ)上,對整個文章細節(jié)進行補充。在模型公布新版本后,一些感興趣的研究人員對其進行了測試。他們試著把一條真新聞的內(nèi)容放進模型,內(nèi)容為:“搜狗正在打造AI語音仿人版,以后讀者可以聽到作者朗讀的有聲小說。”

GPT-2編寫了如下文字:“根據(jù)研究人員表示,這種閱讀方式的創(chuàng)意來源于Kindle用戶。同時,一部分安卓用戶也表達了同樣的需求。以下有三個原因可以解答為何他們需要這項服務(wù)。首先,使用這些設(shè)備的用戶,和傳統(tǒng)的電腦上閱讀者的習(xí)慣不同……未來,當(dāng)讀者使用該功能時,可能會真的以為作者們在為他們朗讀小說?!睂ⅰ八脑麻g,天氣寒冷晴朗,鐘敲了十三下?!币约啊兑痪虐怂摹愤@個著名的開頭輸入到模型后,GPT-2模型識別出了這種模糊的未來派小說基調(diào),開始了創(chuàng)作:“我開車去西雅圖找一份新工作。我給車加好汽油,插入鑰匙,然后讓它跑起來。我想象著那一天會是什么樣。一百年后的今天,那是2045年,我在中國貧困地區(qū)的一所學(xué)校當(dāng)老師,教授中國歷史和科學(xué)史?!毖芯咳藛T提供如下信息:“一節(jié)裝載受控核材料的火車車廂今天在辛辛那提被盜,下落不明。”以此作為基礎(chǔ),GPT-2模型編寫出了由7個段落組成的新聞,軟件還引述政府官員的話語,只是這些信息全是假的。2024/7/24467.3技術(shù)濫用案例人工智能倫理自然語言處理的濫用-GPT2生成假新聞GPT-2模型還可以生成一些突發(fā)的假新聞,如:“在唐納德特朗普不小心向空中發(fā)射導(dǎo)彈后,俄羅斯已向美國宣戰(zhàn)?!薄岸砹_斯表示已經(jīng)‘確定了導(dǎo)彈的軌跡,并將采取必要措施確保俄羅斯人民和國家戰(zhàn)略核力量的安全’。白宮表示,它‘對俄羅斯違反’禁止中程彈道導(dǎo)彈的條約‘極為關(guān)切’?!薄白?014年莫斯科吞并烏克蘭的克里米亞地區(qū)并支持烏克蘭東部的分離主義分子以來,美國和俄羅斯的關(guān)系一直不穩(wěn)定。”事實上,這些新聞不僅是假的,而且是一個令人不安的例子,說明了人工智能如何欺騙我們。那是因為它不是一個人寫的,而是由算法自動生成的,其中包含“在唐納德特朗普意外地……之后俄羅斯對美國宣戰(zhàn)……”,該程序自行補充了故事的其余部分。它可以就你提供的任何主題制作看似逼真的新聞報道。從GPT-2續(xù)寫的內(nèi)容中,可以看出它具有很強的邏輯能力,能找到輔助資料對新聞進行補充,整個短訊也足夠完整。一家科技網(wǎng)站的記者對此結(jié)果感到害怕,他認為這項技術(shù)代表著壞人可以操縱他人,在他看來,這甚至比任何槍支還要危險。在虛假信息正在蔓延并威脅全球的背景下,一個擅長制造假新聞的“高材生”很難不被聲討。早在2019年2月之時,就已經(jīng)有許多人對GPT-2表示了擔(dān)憂。在這個原本就信息爆炸,人們越來越難分清信息真假的年代,GPT-2可以毫無違和融入進去。如果它真的能獨立、完整地書寫各類新聞,由誰使用它就變得尤為重要。如果使用者居心不良,它可以發(fā)表極端言論,偽造內(nèi)容,成為引導(dǎo)輿論的政治工具??梢韵胂?,這種擅長合理遣詞造句的算法,能按需生成大量的仇恨語言和暴力言論。GPT-2也能用來生成具有誤導(dǎo)性的新聞報道、自動生成垃圾郵件、偽造內(nèi)容發(fā)布到社交媒體上。2024/7/24477.3技術(shù)濫用案例人工智能倫理生物識別技術(shù)的濫用-DNA重繪面部2015年夏天,香港大街上的廣告牌貼滿了真人大小的特定人物面孔海報,這些海報不是照片,而是由計算機生成的近似圖像。生物特征識別軟件通過從口香糖和煙頭等垃圾碎片中提取的DNA重建了這些人的面部,并產(chǎn)生了足夠的數(shù)據(jù)來計算出種族、臉型、眼睛、頭發(fā)和膚色等特征,還有雀斑。該項目是一項旨在提高人們對城市亂扔垃圾問題認識的廣告活動,由廣告公司奧美集團(Ogilvy&Mather)設(shè)計。雖然該項目的出發(fā)點是善意的,但它揭示了更嚴重的技術(shù)濫用問題——你的生物識別數(shù)據(jù)是你擁有的最個人化的數(shù)據(jù),但越來越多的私人公司將其用于商業(yè)目的。DNA一直以來都是“刑偵利器”。最常見用途就是比對嫌疑人和犯罪現(xiàn)場證據(jù)的DNA,此外還有“追蹤嫌疑人”功能。各個國家或地區(qū)都建有自己的DNA

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論