您現在的位置:首頁 > 新聞 > 即時 > 正文

阿里版ChatGPT已進入測試!中文聊天截圖曝光 達摩院出品

時間:2023-02-14 13:44:01    來源:網經社    

谷歌硬剛ChatGPT消息一出,科技圈全坐不住了。


(相關資料圖)

就在前兩天,阿里百度網易京東一眾公司全宣布要推出類ChatGPT新產品,戰況那叫一個激烈。

阿里內測中的達摩院版ChatGPT,也被提前曝光。

竟然連畫畫技能都具備了?!

ChatGPT類型的對話功能,同樣不在話下。先來個NBA話題鋪墊:

當被問到“喬丹和科比誰更偉大”時,開始暴露籃球迷身份,連“毋庸置疑”、“奉為神跡”這種話都出來了:

還是個喬丹死忠粉,能對你老婆的觀點提出異議(手動狗頭)

看起來這個達摩院版ChatGPT,不僅有純文本任務能力,還融合了多模態任務能力。

這究竟采用了什么樣的技術?阿里這次內測中的類ChatGPT產品,能力如何?

基于通義融合升級

據透露,新產品可實現的功能包括知識問答、AI繪畫、代碼生成、小說續寫、文案撰寫、寫詩作詞等。

一言以蔽之,不僅ChatGPT具備的能力它都能實現,而且多了“AI繪畫”這項功能。

能取得這樣的多任務、跨模態效果,背后本質上離不開阿里通義大模型的能力。

新達摩院版ChatGPT,正是基于通義大模型體系進行融合升級。

據報道,推出的通義大模型底座基于統一學習范式OFA等底層技術打造,具備了能搞定多種任務的“大一統”能力:

不引入新增結構,單一模型即可同時處理圖像描述、視覺定位、文生圖、視覺蘊含、文檔摘要等10余項單模態和跨模態任務。

升級后,更是可以處理超過包括語音和動作在內的30多種跨模態任務。

這里“大一統”技術的關鍵,在于提出并實現了三個“統一”:

架構統一。使用Transformer(encoder-decoder,編解碼器)架構,統一進行預訓練和微調,無需在應對不同任務時,增加任何特定的模型層。

模態統一。不管是NLP、CV這種單模態,還是圖文等多模態任務,全都采用同一個框架和訓練思路。

任務統一。將所有單模態、多模態任務統一表達成序列到序列(Seq2seq)生成的形式,同類任務的輸入幾乎就是“一個模子里刻出來的”。

目前推出的通義大模型,在電商跨模態搜索、AI輔助設計、法律文書學習、醫療文本理解、開放域人機對話等200多個場景中應用落地時,均能達到2%~10%的效果提升。

從阿里的研發來看,他們實際上于2020年左右已經開始布局此類技術研究。

2021年推出“中文版GPT-3”PLUG,參數量270億,但跟GPT-3一樣是“萬能寫作神器”。

例如這是小說續寫的效果:

去年,阿里AliceMind模型更是在CLUE榜單的AI中文語言理解任務上得分首超人類,獲得了86.685高分。

CLUE榜單會從文本分類、閱讀理解、自然語言推理等9項任務中全面考核AI模型的語言理解能力,但參評AI模型一直未能超越人類成績,AliceMind則一舉在4項任務中超過了人類水平。

國內廠商紛紛追逐ChatGPT

所以,此次推出類ChatGPT產品,阿里究竟是怎么想的?

其實阿里通義大模型體系中,有不少模型都已經在魔搭社區開源。

魔搭社區由阿里達摩院與CCF開源發展委員會共同發起,目前社區內有300+模型上線,其中包括10多個大模型和150+ SOTA模型,其中三分之一都支持中文。

但據知情人士透露,阿里長期以來的目標依舊沒變:

打造中文ChatGPT的生態,這個定義對于阿里來說可能窄了一點。相比之下,阿里更希望能引領中文大模型的發展趨勢。

不止阿里,包括百度、網易、京東等各科技大廠也都已經坐不住了。

百度正在對類ChatGPT產品“文心一言”進行內部測試,官方宣布測試完成時間在3月左右,但是否會因為這波熱度提前還不好說。

網易也劇透,未來網易有道可能會推出ChatGPT同源技術產品,主要在在線教育一塊實現應用。

京東集團副總裁何曉冬則表示,京東是加速AIGC和ChatGPT規模化落地的最佳場景,未來借助這一系列成果,將加速AI在國內的應用落地。

這波國內外廠商的ChatGPT熱潮,很快就要起來了。

標簽: 人機對話 提出異議

相關新聞

凡本網注明“XXX(非現代青年網)提供”的作品,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和其真實性負責。

特別關注

熱文推薦

焦點資訊