你的社交平臺擁有多少個粉絲?
一千?一萬?還是更多?你知道其中存在多少個“僵尸粉”嗎?
近日,據(jù)美國權威科技媒體The Information引述研究機構Ghost Data的報告稱,2015年,Instagram平臺的僵尸賬號占比為7.9%,到目前已經(jīng)攀升至9.5%。Instagram的閱讀用戶已經(jīng)增加到了十億人。根據(jù)上述比例,Instagram平臺上現(xiàn)在大約有9500萬個僵尸賬號。
有媒體評論指出,如此規(guī)模的“僵尸賬號”,讓Instagram成為下一個互聯(lián)網(wǎng)行業(yè)打擊假新聞、假信息和政客營銷的重要陣地。
為什么這么說 ,恐怕得看看“網(wǎng)絡水軍”在近些年的“杰作”。 2017 年,至少有 18 個國家在選舉中遭遇了線上操縱和虛假信息策略,包括德國聯(lián)邦總統(tǒng)選舉期間社交機器人活躍和垃圾新聞頻出等。
顯然,治理“網(wǎng)絡水軍”已成為全球難題。而由于其分散、量大兼具技術隱蔽性,對其的治理更需要講究專業(yè)化和智能化。此時,人工智能也派上了用處。
道高一尺,魔高一丈,虛假賬號與AI的斗智斗勇
從創(chuàng)建應用軟件、官方網(wǎng)站或內(nèi)容傳播平臺,到生產(chǎn)具有實質(zhì)性內(nèi)容的圖像、視頻或文字,通過或真或假或自動地與用戶交互,虛假賬號已經(jīng)越來越“真實”。就在去年,有研究表明,連人工智能都可以被用來生成復雜的點評信息,而這些虛假的點評不僅機器無法檢測出來,就連人類讀者也分辨不出來。
虛假賬號不再“虛假”,整個社交網(wǎng)站都面臨著潛在卻嚴重的沖擊。智能相對論(aixdlun)分析師顏璇梳理了三種智能“鑒粉”方式,分別囊括了用戶行為、內(nèi)容和情感特征三種形式,試圖解決這一問題。
首先是用戶行為特征的分析。這種方式大多依托于爬蟲技術,即通過主動爬取特定微博或者論壇的主體相關的注冊行為、社交行為、轉(zhuǎn)發(fā)與評論等行為 , 從而進行多維特征向量刻畫。同時,有研究者還采用了隱馬爾可夫模型來對用戶行為進行建模,利用模型參數(shù)來對用戶行為進識別和分類,畢竟“僵尸”掉進了“植物”里,總是有區(qū)別的。
這主要是利用賬號之間的社會關系來識別那些“僵尸號”。而面對這種方式,水軍們也“與時俱進”,比如一些職業(yè)差評師的賬號在注冊行為上就無懈可擊,他們的賬號一般會同時配備有身份證、用戶手持證件照、實名手機號碼卡、實名銀行卡等,還能通過作弊軟件騙過實名認證系統(tǒng)。即使是微博里的“僵尸粉”,也會存在一些粉絲關系。
第一種方式被“見招拆招”,AI也不得不拿出第二種方式,即對內(nèi)容特征的分析?;趦?nèi)容分析的識別技術主要從發(fā)帖內(nèi)容本身切入 ,建立“僵尸粉”、惡意或者美化信息等本體模型, 同時建立敏感語義庫,通過語言特征統(tǒng)計區(qū)分虛假賬號。
但是,由于語義領域的不統(tǒng)一性,同一本體在不同領域,甚至同一領域都會存在很多象征意義的現(xiàn)狀,比如用戶在討論某手機時,提到“這手機的上網(wǎng)速度真快”,“快”是一種夸贊,如果說“這手機耗電速度真快”,“快”又變成了一種批評。因此,內(nèi)容特征模型在不同的情況、平臺上都會有較大的變化,這也造成了AI分析內(nèi)容特征進而識別“僵尸粉”的通用性較差的問題。
如此來看,基于單一特征對虛假賬號進行識別還是比較困難的,因此,AI也不得不開始思考第三種方式。第三種方式源于第二種方式,即對內(nèi)容中情感特征的分析。
有研究者通過分析推特內(nèi)容中的情感,發(fā)現(xiàn)在線社交網(wǎng)絡中的內(nèi)容創(chuàng)建、傳播與證券市場波動、期貨商品價格及國家、社會重大事件之間有著緊密的聯(lián)系。這也表明情感傾向是社交網(wǎng)站內(nèi)容中的重要特征。
而水軍也往往帶有強烈的感情色彩(好評或差評),針對單個發(fā)帖的情感傾向性,AI可以設定一個閾值,若對某個主題發(fā)表的正面或者負面帖子比例超過設定閾值,,則認為該用戶為水軍。
但是,用于虛假賬號監(jiān)測的內(nèi)容和情感特征的融合,屬于比較明顯的特征,而忽視了隱藏式的異常用戶,比如用戶上傳與文字內(nèi)容沒有任何關系的圖片, 抑或者用戶評論情感與用戶打分不匹配等新特征。
12下一頁>(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )