快科技4月29日消息,馬斯克剛剛在社交平台X上稱,下周將向SuperGrok訂閱者推出Grok 3.5,並將該條信息頂置。
据馬斯克称,Grok 3.5是第一个能够准确回答有关火箭发动机或电化学技术问题的人工智能。同時,Grok可以從第一原理推理並得出互聯網上根本不存在的答案。
Grok 3.5被馬斯克旗下的xAI宣傳爲全球首個人工智能能從第一性原理推理,生成網絡上不存在的答案”。
而今年2月18日,xAI正式发布Grok 3,并在两天后把Grok 3免费向所有公众开放,超越ChatGPT,登顶苹果应用商店免费应用下载排行榜第一名。
馬斯克曾称Grok 3为地球上最聪明的人工智能”。
令人值得关注的是,馬斯克官宣下周推出Grok 3.5”的这一举动恰巧发生在阿里巴巴发布Qwen3(千问3)之后。
4月29日淩晨4點,阿裏巴巴開源新一代通義千問模型Qwen3,參數量僅爲DeepSeek-R1的1/3,成本大幅下降,性能全面超越R1、OpenAI-o1禑岖球顶尖模型,登顶全球最强开源模型。
據悉,Qwen3是國內首個混合推理模型”,快思考”與慢思考”集成進同一個模型,對簡單需求可低算力秒回”答案,對複雜問題可多步驟深度思考”,大大節省算力消耗。
作爲Qwen系列全新一代的混合推理模型,Qwen3在GPQA、AIME24/25、LiveCodeBench等多個權威評測中表現出極具競爭力的結果。
在奧數水平的AIME25測評中,Qwen3斬獲81.5分,刷新開源紀錄。
在考察代碼能力的LiveCodeBench評測中,Qwen3突破70分大關,表現甚至超過Grok3。
在評估模型人類偏好對齊的ArenaHard測評中,Qwen3以95.6分超越OpenAI-o1及DeepSeek-R1。
性能大幅提升的同時,Qwen3的部署成本還大幅下降,僅需4張H20即可部署Qwen3滿血版,顯存占用僅爲性能相近模型的三分之一。
(舉報)