歡迎來到【AI日報】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的熱點内容,聚焦开发者,助你洞悉技术趋势、了解创新AI産品應用。
新鮮AI産品點擊了解:https://app.aibase.com/zh
1、腾讯重磅发布混元3D 3.0模型 建模精度提升3倍
腾讯在2025全球数字生态大会上重磅发布混元3D 3.0模型,其3D-DiT分级雕刻技术显著提升了建模精度,同时推出混元3D Studio平台和开源计划,推动3D创作的边界拓展。
【AiBase提要:】
? 混元3D 3.0模型采用3D-DiT分级雕刻技术,建模精度提升3倍。
? 混元3D Studio平台提供专业创作工具,提升3D艺术创作效率和质量。
? 腾讯计划开源混元3D omni模型,加速3D生成技术在学术与工业应用中的落地。
2、昆仑万维AI 音乐创作平台Mureka上线Agent Studio功能,让音乐创作变得触手可及!
Mureka 的「Agent Studio」功能通过直观的方式让音乐创作变得触手可及,用户只需简单描述想法,AI 就能自动生成歌词和音乐。该功能包含多个创作场景,如专辑制作、熱點写歌等,为用户提供多样化的音乐体验。
【AiBase提要:】
? Mureka 推出「Agent Studio」功能,让普通人也能轻松进行音乐创作。
? 用户只需说出简单想法,AI 即可生成完整的歌词和音乐。
? 目前已有六个创作场景,涵盖专辑制作、熱點写歌、情感表达等多种功能。
3、阿裏Qoder推出付費訂閱服務,Pro版每月20美元,助力AI自主編程
Qoder正式推出付費訂閱計劃,提供Pro和Pro+版本,支持無限代碼補全、高級模型調用等功能,提升開發效率。同時優化了Credits消耗問題,提高智能體工具的並行化能力和工程檢索准確率。
【AiBase提要:】
? Qoder推出付费订阅服务,支持Pro和Pro+版本,满足开发者高效编程需求。
? Pro版提供无限代码补全和2000 Credits,Pro+版则提供6000 Credits和更多资源。
? 优化Credits消耗,提升智能体工具的并行化能力,降低token消耗。
4、VEED Fabric 1.0发布!一张图片变身“会说话”视频
VEED推出的Fabric 1.0是一款革命性的AI视频生成工具,能够通过一张图片和语音输入生成高质量的会说话视频。该工具在唇形同步、面部表情自然度以及生成速度方面表现出色,显著降低了视频制作的成本和时间,适用于多种内容创作场景。
【AiBase提要:】
?? Fabric 1.0支持从静态图像生成生动的会说话视频,实现动态叙事。
?? 视频生成速度提升7倍,成本降低60倍,适合快速内容生产。
? 集成多语言支持与自动字幕功能,增强全球用户使用体验。
詳情鏈接:https://www.veed.io/ai/fabric-1-0
5、OpenAI重磅推出GPT-5-Codex:AI編碼代理將徹底顛覆開發者世界
OpenAI發布GPT-5-Codex,標志著AI在代理式編碼領域的重大突破,其動態思考機制和多平台集成能力顯著提升了軟件開發效率。
【AiBase提要:】
? GPT-5-Codex具备动态思考机制,能根据任务复杂度调整处理时间,提升编码效率。
? 支持多平台集成,包括IDE扩展、Web界面和GitHub代码审查功能,增强开发者生态。
? 开发者反馈显示,GPT-5-Codex显著缩短开发周期,提升代码生成速度并减少错误注释。
詳情鏈接:https://openai.com/index/introducing-upgrades-to-codex/
6、全国发布《人工智能安全治理框架》2.0版,推动安全可信的 AI 生态建设
《人工智能安全治理框架》2.0版于2025年9月15日正式發布,旨在應對快速發展的AI技術帶來的新挑戰。該框架在1.0版基礎上進行了優化,結合實際應用情況,完善了風險分類和防範措施,並強調了全球合作的重要性。
【AiBase提要:】
? 《人工智能安全治理框架》2.0版正式发布,以应对AI技术发展带来的新挑战。
? 框架基于1.0版进行优化,完善了风险分类与防范措施。
? 强调全球合作,推动多边机制下的人工智能安全治理合作。
詳情鏈接:https://www.cac.gov.cn/2025-09/15/c_1759653448369123.htm
7、OpenAI Evals新增原生音频输入和评估功能
OpenAI 的 Evals 工具新增原生音频输入和评估功能,使开发者能够直接上传音频文件进行性能评估,从而大幅提升语音识别与生成模型的开发效率和准确性。
【AiBase提要:】
? 原生音频输入功能简化了评估流程,提升开发效率。
? 无需文本转录即可直接评估语音识别与生成模型性能。
? 新功能为智能语音助手和音频内容生成提供更精准的测试支持。
8、颠覆传统!Mini-o3 开源模型实现超长视觉推理,深度思考不再是难题
Mini-o3是字節跳動與香港大學聯合推出的開源視覺推理模型,能夠進行數十輪的視覺推理,顯著提升了處理複雜視覺問題的能力。其核心設計包括VisualProbe數據集、叠代數據收集流程和超輪次掩碼策略,爲多輪視覺推理技術提供了新的方向。
【AiBase提要:】
? Mini-o3实现了数十轮的视觉推理能力,突破了以往1-2轮对话的限制。
? 通过构建VisualProbe数据集和迭代数据收集流程,提升了模型的深度推理能力。
? 超轮次掩码策略优化了训练效率,使模型在测试阶段表现更出色。
詳情鏈接:https://arxiv.org/pdf/2509.07969
9、上海AI Lab推出Lumina-DiMOO,开创多模态生成与理解新局面
上海人工智能實驗室聯合多所高校推出了新一代多模態生成與理解模型Lumina-DiMOO。該模型采用創新的全離散擴散架構,通過對比學習技術實現文本、圖像和音頻等數據的有效整合與對齊,顯著提升了生成質量和效率,並在多種應用場景中展現出廣闊的應用潛力。
【AiBase提要:】
? Lumina-DiMOO 是新一代多模态生成模型,采用创新的“全离散扩散架构”以提升数据处理效率。
?? 该模型通过对比学习技术,实现了文本、图像等多种数据的有效对齐与理解。
? Lumina-DiMOO 在图像生成和理解方面表现卓越,能够适应多种应用场景,展现出广阔的应用潜力。
詳情鏈接:https://github.com/Alpha-VLLM/Lumina-DiMOO
10、騰訊全新AI繪畫升級!微調技術讓生成圖像美感提升300%
騰訊推出的微調技術顯著提升了AI生成圖像的真實感與美學評分,其創新方法包括“Direct-Align”和“語義相對偏好優化”,有效解決了獎勵作弊和離線調整限制的問題。
【AiBase提要:】
? 通过“Direct-Align”技术减少梯度爆炸,提升模型优化能力。
? “语义相对偏好优化”(SRPO)实现文本控制图像风格调整。
? 实验显示SRPO训练模型在真实感和美学质量上显著提升。
詳情鏈接:https://arxiv.org/pdf/2509.06942
11、Meta AI 发布 MobileLLM-R1:轻量级边缘推理模型,参数不足 10 亿,性能提升显著
Meta AI 推出的 MobileLLM-R1 系列模型在轻量化和边缘计算领域表现出色,其参数规模从140M到950M,专注于数学、编码和科学推理。该模型在训练效率和性能上均优于同类模型,尤其在数学和编码任务中表现突出。
【AiBase提要:】
? 新模型发布:Meta AI 推出 MobileLLM-R1 系列轻量级边缘推理模型,参数范围从140M 到950M。
? 训练效率:MobileLLM-R1 仅用约11.7% 的数据训练,表现出色,训练成本和资源需求显著降低。
? 性能优势:在多项基准测试中,MobileLLM-R1-950M 表现超越多款大型开源模型,尤其在数学和编码任务上。
詳情鏈接:https://huggingface.co/facebook/MobileLLM-R1-950M
12、騰訊啓動AI應用繁榮計劃,超300家企業搶灘智能體新賽道
騰訊全球數字生態大會發布AI應用繁榮計劃,聚焦垂直場景,推動AI産業深度滲透。該計劃涵蓋AI共創營和AI百校行,吸引超300家企業參與,並通過技術共享、資源開放等方式孵化智能體與大模型應用。
【AiBase提要:】
?腾讯人工智能应用繁荣计划旨在将人工智能深稛嶷入垂直场景,有两个核心模块:人工智能共创营和人工智能百所学校活动。
?首届线下活动吸引了来自多个行业的近 3000 名参与者,显示了大规模人工智能应用的强劲市场需求。
?騰訊提供技術支持、資源和內容,幫助合作夥伴將其人工智能解決方案商業化。
13、谷歌DeepMind 发布 VaultGemma 具备差分隐私能力
谷歌 DeepMind 推出的 VaultGemma 是一款具有差分隐私能力的语言模型,专注于保护用户数据隐私。它基于 Gemma2 架构,采用了多查询注意力机制,并通过添加随机噪声确保模型输出无法与特定训练样本关联。尽管性能略显保守,但 VaultGemma 在隐私保护方面提供了更强的保障,未来有望为用户提供更安全和可靠的使用体验。
【AiBase提要:】
? VaultGemma 是一款具备差分隐私能力的开源语言模型,参数规模达到10亿。
? 采用仅解码器的 Transformer 设计,序列长度限制为1024个 Token。
? 谷歌将在 Hugging Face 和 Kaggle 上公开 VaultGemma 及其代码库,推动隐私安全与开源技术的结合。
14、QuestMobile 数据:豆包月活超越DeepSeek,荣登中国原生 AI APP 榜首
QuestMobile發布的2025年8月AI應用行業月度報告顯示,豆包憑借6.6%的環比增速達到1.57億月活用戶,超越DeepSeek成爲原生應用的第一。腾讯元宝同样表现不俗,其月活增速高达22.4%,位居原生应用第三。此外,超过一半的TOP50 AI 应用为In-App插件应用,豆包作为一款PC客户端应用也成功跻身榜单,显示出其跨端使用的优势。
【AiBase提要:】
? 豆包以6.6%的环比增速达到1.57亿月活用户,超越DeepSeek成为原生应用第一
? 腾讯元宝月活增速达22.4%,位列原生应用第三,用户规模在1000万到1亿之间
? 超过一半的TOP50 AI 应用为In-App插件应用,豆包作为PC客户端成功跻身榜单
(舉報)