歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的熱點内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鮮AI産品點擊了解:https://top.aibase.com/
1、阿里通义万相Wan2.1-VACE开源 号称首个开源的視頻編輯統一模型
通義萬相宣布VACE開源,支持多種分辨率和任務,提供一站式視頻創作體驗,通過多模態輸入机制实现高效灵活的視頻編輯。
【AiBase提要:】
? 支持文生视频、图像参考生成、局部编辑与视频扩展等多种任务,提高创作效率。
? 强大的可控重绘能力,基于人体姿态、运动光流等控制生成,支持主体和背景参考。
? 提出视频条件单元VCU,统一多模態輸入,实现多任务自由组合与灵活编辑。
詳情鏈接:https://github.com/Wan-Video/Wan2.1
2、OpenAI 升级 ChatGPT:正式引入GPT-4.1代码能力超强
OpenAI發布了GPT-4.1及其輕量級版本GPT-4.1mini,顯著增強了編碼能力和指令執行體驗,同時優化了用戶體驗和多模態支持,鞏固了其在AI領域的領先地位。
【AiBase提要:】
? GPT-4.1具备强大的编码能力,处理复杂编程需求更高效,运行速度更快,是开发者和指令处理场景的理想选择。
? GPT-4.1mini轻量级且高效,在资源受限设备上仍能流畅运行,为免费和付费用户提供广泛访问渠道。
? ChatGPT新增多项功能如长按复制、表格复制和流式传输,界面优化显著提升用户体验。
3、Stability AI开源341M超轻量文字转语音模型,手机本地可跑,音频生成仅需8秒!
Stability AI发布了一款名为‘Adversarial Post-Training加速的快速文字转音频生成’的超轻量文字转语音模型,参数仅为341M,却能在H100GPU上75毫秒生成12秒音频,在手机CPU上7秒完成同样任务,性能炸裂且多样性强。
【AiBase提要:】
??ARC後訓練方法不基于蒸餾,提升模型生成速度與質量。
?模型輕量化設計,支持手機本地運行,大幅提升移動端創意應用體驗。
?音頻轉音頻功能實現風格遷移,激發更多創作靈感。
詳情鏈接:https://arxiv.org/pdf/2505.08175
4、Poe 报告:可灵大模型视频生成量约占30%份额 领先Runway
近日發布的2025年春季AI模型使用趨勢報告顯示,中國快手的可靈多款視頻生成模型在文生視頻領域表現突出,市場份額達30%,其中可靈2.0模型僅三周就占21%使用比例。自去年6月發布以來,全球用戶突破2200萬,月活躍用戶增長25倍,生成視頻和圖片數量顯著。
【AiBase提要:】
? 可灵大模型在文生视频领域市场份额达30%,领先Runway等竞争者。
? 可灵2.0模型自4月发布后三周内即占据21%视频生成市场。
? 可灵AI全球用户超2200万,月活跃用户增长25倍,生成视频与图片数量显著增加。
5、微软 WizardLM 团队“集体跳槽”腾讯,或已并入混元大模型研发体系
微软的人工智能研究团队 WizardLM 整体加入腾讯 AI 实验室的“混元”团队,标志着腾讯在大模型领域进一步发力。该团队不仅带来了多项技术突破,还通过开源模型展示了其研发实力。
【AiBase提要:】
? 曾隶属于微软的 WizardLM 团队整体加入腾讯混元团队,强化了腾讯在大模型领域的竞争力。
? Hunyuan-TurboS0416模型首次使用“混元”命名,象征着团队与腾讯的深稛嶷合。
? 腾讯计划大幅增加 AI 投资,目标是在全球 AI 竞争中占据更为主导的地位。
6、騰訊宣布混元圖像2.0將于5月16日全新發布
騰訊混元大模型團隊宣布,混元圖像2.0將在5月16日發布,這是騰訊在AI視覺領域的重要突破,以‘更智能、更開放、更中國’爲核心理念。
【AiBase提要:】
? 混元图像2.0将于5月16日发布,标志着腾讯在AI视觉领域的又一重要进展。
? 新工具强调‘更智能、更开放、更中国’,助力创作者和企业迈向AI驱动的视觉生产新时代。
? 继去年混元大模型升级后,腾讯再次展示其在人工智能领域的持续创新力。
7、上海启动人工智能标识生态联盟,小红书和 MiniMax 等首批入盟
本文介紹了上海市成立的人工智能標識生態聯盟,該聯盟旨在推動人工智能領域的標識技術發展,提高生成內容的透明度和安全性,並通過政策解讀和企業合作,爲構建可信的人工智能環境奠定基礎。
【AiBase提要:】
? 联盟由上海市委网信办指导,汇聚多家知名企业,目标是提升AI生成内容的透明度和安全性。
? 国家互联网应急中心和中国电子技术标准化研究院解读相关政策,强调国际规则与中国特色的结合。
? 小红书、MiniMax等企业参与标识工作实践,探索多种内容的标识方案并积累治理经验。
8、Lightricks發布LTX-Video-13B精煉模型!10秒生成高清AI視頻,速度與質量雙飛躍!
以色列科技公司Lightricks發布的開源AI視頻生成模型LTX-Video-13B精煉模型,以130億參數爲基礎,結合多尺度渲染技術和高效量化優化,將視頻生成速度提升至10秒以內,同時保持高質量輸出。
【AiBase提要:】
? 采用多尺度渲染技术,10秒内生成高清视频,速度提升5倍以上。
? 开源模型,支持低显存设备运行,降低AI视频制作成本。
? 生成速度提升30倍,媲美专业影视作品,重塑内容创作生态。
詳情鏈接:https://github.com/Lightricks/LTX-Video
9、谷歌AlphaEvolve發布!Gemini自進化AI破解數學難題,優化芯片與數據中心,訓練速度飙升32.5%
谷歌DeepMind發布的AlphaEvolve是一款結合Gemini大語言模型與進化算法的AI編碼代理,它在多個領域展現了強大的自優化能力,包括數據中心調度、芯片設計、AI訓練以及數學研究。
【AiBase提要:】
? Gemini与进化算法结合,解决复杂问题如芯片优化和数学难题。
? AlphaEvolve优化数据中心调度,回收0.7%全球算力,节省运营成本。
? 提升AI训练效率,Gemini模型训练速度提升32.5%,展现强大自我优化能力。
10、騰訊元寶浏覽器插件嘗鮮版上線Chrome
騰訊元寶浏覽器插件嘗鮮版上線Chrome平台,提供懸浮球、常駐側邊欄和劃詞工具欄等功能,提升網頁浏覽與信息處理效率。
【AiBase提要:】
?懸浮球功能支持一鍵翻譯和總結網頁內容,輕松跨越語言障礙並節省閱讀時間。
?常駐側邊欄可高效答疑,支持截圖提問,大幅提升信息獲取效率。
?劃詞工具欄實現選中文本後的即時搜索或翻譯,讓信息處理更流暢。
詳情鏈接:https://yuanbao.tencent.com/download
(舉報)