《科創板日報》8月16日訊(記者 黃心怡)訊飛星火認知大模型昨日升級2.0版本,重點增加了代碼能力和多模態能力。
【資料圖】
科大訊飛董事長劉慶峰在會上表示,今年10月24日將全面對標ChatGPT,中文超越、英文相當,明年對標GPT-4。
《科創板日報》第一時間對訊飛星火的圖文生成能力進行了測試,并與文心一言進行對比。
▍訊飛星火VS文心一言:圖文生成能力大比拼
訊飛星火認知大模型V2.0的一大特點是升級了多模態能力。相比之前的版本只能進行文字對話,2.0版本可對圖像內容進行文字描述和理解,并生成圖片。
《科創板日報》記者對升級后的訊飛星火作圖能力進行了測試。
先來個簡單的:畫一幅風景畫
訊飛星火:
記者想測試一下訊飛星火的連續對話內容,于是讓其在畫中增加一個4歲女孩。
結果,訊飛星火增加了三個小女孩,同時畫面背景也有所變化。
文心一言:
在畫中增加一個4歲女孩
文心一言在數量上沒有犯錯,增加了一個小女孩。不過,圖片背景已完全換成了不同的另一張圖。看來要讓AI聽從指令來作畫依然存在難度,設計師們暫時無需太擔心失業。
提問:畫一張車水馬龍的圖
訊飛星火
訊飛星火給了一張古代城市的馬車街道圖片。于是,《科創板日報》記者讓其調整為現代城市。
文心一言:
提問:畫一張紅燒獅子頭
訊飛星火:
文心一言:
提問:畫一幅畫,媽媽抱著寶寶、寶寶在哭泣,寶寶6個月左右
訊飛星火:
文心一言:
從兩者的回答來看,生成的圖片都較為準確地完成了任務。
提問:畫一個胸有成竹的男人
訊飛星火:
記者再次嘗試讓訊飛星火在圖片中增加新內容:為畫里的男人手里增加一支煙。但以失敗告終。
文心一言:
文心一言倒是理解了指令,畫了一個手里有煙的男性。但并非基于之前生成的圖片。
提問:生成一張云計算的配圖
訊飛星火:
文心一言:
提問:生成一張大數據配圖
訊飛星火
文心一言:
在云計算的配圖方面,文心一言更勝一籌。而大數據的配圖,兩者均并未準確理解文字含義。
發布會上,主持人把現場照片拋給星火V2.0識別,并令其作出文案描述。
《科創板日報》記者也上傳了一張發布會的照片,對其進行了測試。
訊飛星火準確地描述了圖片的場景,并識別出了部分文字。值得一提的是這些文字都可以直接讓AI進行朗讀,變成一段音頻。
而文心一言似乎尚未開放識圖功能,PC端沒有相應選項。手機端雖然能上傳圖片,但從回答來看,屬于一本正經地胡說八道。
基于多模態能力升級,科大訊飛同時發布“訊飛智作2.0”工具。這一工具能進行視頻分析,寫文案、進行AI配音,提供配圖生成、AI主播功能。在演示中,訊飛智作2.0為一段視頻配上了字幕、并生成虛擬主播以及語音配音。
值得一提的是,會上訊飛星火和華為昇騰聯合發布了星火一體機,該設備可提供對話開發、任務編排、插件執行、知識接入、提示工程等5種定制優化模式,以及辦公、代碼、客服、運維、營銷、采購等10種以上即開即用的場景包,支持3種模型尺寸供用戶選擇。
劉慶峰表示,有了這些能力,就可以使得每一家企業、每一個行業、每一個學校、每個醫院都有機會構建自己的專屬大模型。目前,訊飛星火已完成的在金融、政務、汽車等領域的9個專屬大模型的數據顯示,在場景任務優化和私域知識增強等方面平均效果能夠提升20%。