所有語言
分享
文章來源:量子位
衡宇 發自 凹非寺
量子位 | 公眾號 QbitAI
阿里雲正式發布通義千問2.5大模型,同時宣布性能全面趕超GPT-4 Turbo。
此時,距離阿里雲通義大模型發布,恰好過去一周年;距離GPT-4發布,也已經過去一年有餘。
根據最新公布的數據,通義大模型通過阿里雲服務企業超9萬,通義開源模型累計下載量突破700萬。
同時,阿里雲也正式宣布了“通義千問App”更名為“通義App”,為所有用戶提供免費服務。
通義意為“通情,達義”,該App以最新通義基礎大模型為底座,並把通義實驗室的文生圖、智能編碼、文檔解析、音視頻理解、視覺生成等能力“All in one”。
阿里雲CTO周靖人表示:
大模型這麼多家,大家都說的是同樣的故事,但最後比拼的就是能力差異。包括最後比拼的是怎麼融合生態,尤其是開發者的生態。
怎麼把它落地運用起來,才是最大的差異。
通義千問2.5發布
先來看看最新發布的通義千問2.5版本。
周靖人介紹,相比通義千問2.1(去年12月1日發布),2.5版本的理解能力、邏輯推理、指令遵循、代碼能力分別提升9%、16%、19%、10%,中文能力尤其突出。
在權威基準OpenCompass(上海AI Lab出品)上,通義千問2.5得分追平GPT-4Turbo。這是該基準首次錄得國產大模型取得此等成績。
會上介紹,通義2.5加強了文檔處理能力。
可單次可處理多達1000萬字的長文檔,還能同時解析100份不同格式的文檔,支持多文件類型、多數據格式解析、多場景優化,便於用戶使用和繼承。
同時,通義的音視頻理解能力也有迭代升級。
發布會上,周靖人着重介紹了專業提供智能編碼能力的通義靈碼,現在它不只支持個人程序員,也推出通義靈碼企業版本。
通義靈碼基於SOTA水準的通義千問代碼模型CodeQwen1.5研發,目前插件下載量超過350萬。剛剛過去的4月份,通義靈碼登頂了Big Code模型排行榜。
在技術能力迭代的基礎上,上述能力都集成在剛剛改名的通義App內,用戶可以通過App和Web端進行使用。
百鍊升級2.0版本
除了通義2.5模型以外,阿里雲的百鍊大模型平台最新進展也進行了展示。
去年10月,阿里雲發布了百鍊大模型平台,主要功能就是讓開發者通過簡單的拖拉拽,在5分鐘開發一款大模型應用,幾小時煉出一個專屬模型。
現在升級后,百鍊有了2.0版本,成為阿里雲承載雲+AI能力的重要平台,提供一站式、全託管的大模型定製與應用服務。
“當下企業應用大模型存在三種範式:一是對大模型開箱即用,二是對大模型進行微調和持續訓練,三是基於模型開發應用,其中最典型的需求是RAG,以企業數據對大模型進行知識增強。”周靖人展開介紹,“圍繞這些需求,百鍊打造了模型中心和應用中心,提供最豐富的模型和最易用的工具箱。”
目前,百鍊聯動魔搭開源社區,集成了上百款大模型API,除了通義、Llama等系列,還有智譜ChatGLM、百川、月之暗面等系列模型。
對需進一步訓練模型的用戶,百鍊提供從數據管理、模型調優、評測到部署的模型服務,用戶可對算力按需調用,無需因底層架構費腦筋。
此外,百鍊還支持基於prompt定製和優化、支持Assistant API開發模式,實現智能應用的編排,結合自身需求做定製化開發。
持續開源
去年8月,通義宣布加入開源行列,隨之沿着“全模態、全尺寸”路線,陸續推出十多款模型。
其中較為矚目的是參數規模橫跨5億到1100億的八款大語言模型。
此外,通義還開源了視覺理解模型Qwen-VL、音頻理解模型Qwen-Audio、代碼模型CodeQwen1.5-7B、混合專家模型Qwen1.5-MoE。
目前,通義開源模型系列下載量已經超過700萬。
阿里雲表示,自己是全球唯一持續開發模型、堅持開源的公司。
此次發布會上,通義也發布了最新款開源模型:1100億參數的Qwen1.5-110B。
該模型在MMLU、TheoremQA、GPQA等基準測評中,超越了Meta的Llama-3-70B模型;在HuggingFace推出的開源大模型排行榜OpenLLMLeaderboard上,Qwen1.5-110B衝上榜首。
最後,在談及開源技術時,周靖人表示,開源對全球技術的貢獻毋庸置疑,閉源模型至少要超過所有開源模型才有機會參与討論。