阿里巴巴達摩院科學家造了一個識別謠言的神器
AI謠言粉碎機,謠言識別準確率達81%
達摩院NLP團隊成員李泉志
昨天,一篇《為拯救爸媽朋友圈,達摩院造了“謠言粉碎機”》的文章,在朋友圈刷屏,引來一片鼓掌叫好:“這下終于不用費勁勸導爸媽了!”
文章說的是,阿里巴巴達摩院的科學家,造了一個謠言粉碎機,這是一個算法模型,可以識別真假新聞,未來也能應用在各大領域。
這是怎樣一種算法?準確率高嗎?真的可以終結謠言?記者聯系到了正在大洋彼岸的“謠言粉碎機”的創造者李泉志。
“粉碎機”的前生功能
是為記者提供可靠線索
《速轉!科學家發現:一味中藥48小時可殺死60%癌細胞!》《晚上喝白開水的朋友,再不看就晚了!》《專家說了,這樣東西千萬別吃!》……
你有沒有收到過父母發來的這些“關懷”?又有多少次是抱著“算了算了,你開心就好”的心態結束話題?
“不能保證百分之百準確,但基本可以判斷是否為謠言。”李泉志,達摩院NLP團隊的核心成員之一,畢業于清華大學,后在美國獲得自然語言理解方向的博士學位,目前在達摩院的西雅圖辦公室工作。
在加入達摩院前,他曾是路透社重要的“情報官”:通過機器篩選成千上萬的網絡信息,為數千位一線記者提供可靠線索。
“AI謠言粉碎機”就是借助自然語言實現的。在剛剛結束的SemEval(自然語言處理領域的國際權威比賽,由國際計算語言學學會舉辦)全球語義測試中,“AI謠言粉碎機”創造了假新聞識別準確率的新紀錄,達到了前所未有的81%。
判斷一個新聞真假
要分三個步驟
“AI謠言粉碎機”要怎么去判斷是否為謠言呢?李泉志說,分三步——
首先,該模型會找到最初的信息源,分析用戶畫像,包括:專業領域,此前傳播或轉發過什么,是個人還是機構,注冊時間,活躍規律等,來判斷發布者是否“可靠”。最后根據不同態度的人群比例、各自的信譽度等信息,計算出此新聞的可信度。
第二步,尋找網上所有的信息源,看看鏈接的域名,是否來自可信網站,比如新華社、政府醫藥管理局等。
第三步,將正文里關鍵的論證提煉為知識點,與知識圖譜里的權威知識庫做匹配驗證。如果毫無聯系、自相矛盾,減分。
李泉志解釋,“AI謠言粉碎機”會考慮一部分人類的想法,更多的則是 AI的運用。人工智能有很多人類比不了的地方,比如當一個流言在社交網站上傳播很快的時候,我們很難去判斷真假,不知道誰接收到了,是出于什么原因轉發,不同的人對此的評價是什么,而這些AI可以做到。“假如來一個流言,人可以通過網站去查證,但是AI可以快速把科學研究、新聞拉出來,加上后臺知識庫的對比,做一個驗證。人腦中有基本判斷,但是沒有大型的知識庫。”李泉志說。
就拿“AI謠言粉碎機”的訓練樣本來說,就要分至少兩個層面:首先拿底層的2億條信息,幾百萬條新聞,訓練語言樣本;再將模型進行謠言的真實性訓練。“是一個復雜且費時的過程。”李泉志表示。
誰制造謠言,論文是否抄襲
未來粉碎機還有更多功能
其實,要建這樣一個數據模型,并不容易。李泉志坦言,他在前一家公司就開始研究,到如今,也還需繼續完善。他們有一個小團隊專門在研究這一技術,因為,總體來說這不是一個單獨能列出來的技術,是自然語言所有技術的綜合。
目前,該模型也并未應用于阿里巴巴的任何業務中,李泉志坦言,數據模型需要不斷被“訓練”,也需要得到社會的認同,而這些,都不是短時間內能解決的。
可以想象的是,“AI謠言粉碎機”未來將被應用的多個場合。
比如,可以識別論文是否為抄襲,用技術從個人的寫作風格、方法論、主題等多維度去判斷是否為抄襲。過去有人說某年輕作家后期的作品由人代筆,以后用AI就能分析得出結論。
另一方面,可以協助警方找到真正謠言的制造者。通過AI去追蹤傳播路徑,從傳播路徑中,將傳播分解,可以發現規律,比如傳播了哪些用戶,用戶是什么反應,是簡單的轉發,還是贊成、反對,還是進行了二次加工?
“當然,該模型也還是需要更多的語言訓練。比如有些用戶轉發時,說的是反話、諷刺,有些是隱喻,不知是否是真實的情緒表達,這些作為機器很難對此做出判斷,但是通過大量的訓練,是可以實現的。”李泉志表示,他和團隊會繼續研究該模型。
標簽:
凡本網注明“XXX(非現代青年網)提供”的作品,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和其真實性負責。
原標題:《子夜外賣》描繪城市的夜色畫卷(主題)總制片人張燁鏑:帶觀
2023-06-17 15:43
原標題:用腳和筆丈量世界(引題)?阿來《西高地行記》出版(主題)華
2023-06-17 13:45
原標題:“這里是三星堆”:高清手繪圖“復活”國寶華西都市報-封面新
2023-06-17 13:49
原標題:90多個“關鍵詞”還原蘇軾(引題)?蔣藍新作《蘇東坡辭典》出
2023-06-17 11:34
原標題:圖博會天津出版傳媒集團再創佳績(引題)?《閱讀天津·津渡》
2023-06-17 11:35
原標題:良渚遺址“琮王”“鉞王”現身上博(主題)6月20日起亮相“實
2023-06-17 11:51
原標題:《魚廬記》:鄂地小人物的傳奇華西都市報-封面新聞記者張杰近
2023-06-17 11:52
原標題:伴隨著人工智能技術飛速發展,科幻電影創作將走向何方──(引
2023-06-17 11:56
原標題:國標舞劇《人間四月天》啟動創排北京日報訊(記者韓軒)北京舞
2023-06-17 10:40
原標題:2023年青年攝影獎申報啟動天津日報訊(記者仇宇浩)近日,世界
2023-06-17 10:37
原標題:別樣《鳳求凰》百人合唱點擊量百億次作品(主題)中國古詩詞藝
2023-06-17 10:53
原標題:首屆天津音樂節中國天津·2023圣彼得堡愛樂樂團演繹經典(引題
2023-06-17 10:32
原標題:電視劇《淬火丹心》唱響武鋼人的青春之歌長江日報訊(記者萬旭
2023-06-17 10:53
【作品廣議】原標題:主動自覺,珍視生命肖承森汗流禾下土 蘇慶眼下正
2023-06-17 05:45
解碼文化自信的城市樣本原標題:長沙:千載星城吐芳華天上一顆星,地上
2023-06-17 05:56
原標題:第五屆中國西藏旅游文化國際博覽會6月16日晚開幕由文化和旅游
2023-06-17 05:54
原標題:開心果左一:節約用水左二:面具左三:——把衣服穿上!右一:
2023-06-17 06:00
原標題:“中國戲曲節2023”在香港開鑼新華社香港6月16日電(記者褚萌
2023-06-17 06:01
原標題:取材于武鋼的發展歷史(引題)《淬火丹心》凝聚鋼鐵人的青春與
2023-06-16 21:32
原標題:山東:文化館里涌動“青春力量”中國文化報駐山東記者蘇銳剛過
2023-06-16 17:49
原標題:北京國際圖書博覽會開幕6月15日,北京國際圖書博覽會現場,參
2023-06-16 16:42
原標題:芭蕾舞劇,如何圈粉諸多觀眾?中新網北京6月16日電(記者上官云
2023-06-16 14:44
原標題:中新人物丨演員楊蓉:學演戲,得先學做人中新網北京6月16日電(
2023-06-16 14:49
原標題:《尋她》首映舒淇暢聊與九零后導演的“碰撞”(引題)我心里曾
2023-06-16 14:52
原標題:“京城飄書香五洲共閱讀”(引題)第21屆北京國際圖書節開幕(
2023-06-16 13:52