網站賺不到錢？立刻加入參與變現
字體超市--好字體用得起，買得起！
共建未成年人“清朗”網絡空間承諾書

AI日報：腾讯发布混元3D 3.0模型；昆仑万维上线Agent Studio功能；阿里Qoder推出付费订阅服务

2025-09-16 16:00 · 稿源：站長之家

歡迎來到【AI日報】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的熱點内容，聚焦开发者，助你洞悉技术趋势、了解创新AI産品應用。

新鮮AI産品點擊了解：https://app.aibase.com/zh

1、腾讯重磅发布混元3D 3.0模型建模精度提升3倍

腾讯在2025全球数字生态大会上重磅发布混元3D 3.0模型，其3D-DiT分级雕刻技术显著提升了建模精度，同时推出混元3D Studio平台和开源计划，推动3D创作的边界拓展。

【AiBase提要:】
? 混元3D 3.0模型采用3D-DiT分级雕刻技术，建模精度提升3倍。
? 混元3D Studio平台提供专业创作工具，提升3D艺术创作效率和质量。
? 腾讯计划开源混元3D omni模型，加速3D生成技术在学术与工业应用中的落地。

2、昆仑万维AI 音乐创作平台Mureka上线Agent Studio功能，让音乐创作变得触手可及！

Mureka 的「Agent Studio」功能通过直观的方式让音乐创作变得触手可及，用户只需简单描述想法，AI 就能自动生成歌词和音乐。该功能包含多个创作场景，如专辑制作、熱點写歌等，为用户提供多样化的音乐体验。

【AiBase提要:】
? Mureka 推出「Agent Studio」功能，让普通人也能轻松进行音乐创作。
? 用户只需说出简单想法，AI 即可生成完整的歌词和音乐。
? 目前已有六个创作场景，涵盖专辑制作、熱點写歌、情感表达等多种功能。

3、阿裏Qoder推出付費訂閱服務，Pro版每月20美元，助力AI自主編程

Qoder正式推出付費訂閱計劃，提供Pro和Pro+版本，支持無限代碼補全、高級模型調用等功能，提升開發效率。同時優化了Credits消耗問題，提高智能體工具的並行化能力和工程檢索准確率。

【AiBase提要:】
? Qoder推出付费订阅服务，支持Pro和Pro+版本，满足开发者高效编程需求。
? Pro版提供无限代码补全和2000 Credits，Pro+版则提供6000 Credits和更多资源。
? 优化Credits消耗，提升智能体工具的并行化能力，降低token消耗。

4、VEED Fabric 1.0发布！一张图片变身“会说话”视频

VEED推出的Fabric 1.0是一款革命性的AI视频生成工具，能够通过一张图片和语音输入生成高质量的会说话视频。该工具在唇形同步、面部表情自然度以及生成速度方面表现出色，显著降低了视频制作的成本和时间，适用于多种内容创作场景。

【AiBase提要:】
?? Fabric 1.0支持从静态图像生成生动的会说话视频，实现动态叙事。
?? 视频生成速度提升7倍，成本降低60倍，适合快速内容生产。
? 集成多语言支持与自动字幕功能，增强全球用户使用体验。
詳情鏈接:https://www.veed.io/ai/fabric-1-0

5、OpenAI重磅推出GPT-5-Codex：AI編碼代理將徹底顛覆開發者世界

OpenAI發布GPT-5-Codex，標志著AI在代理式編碼領域的重大突破，其動態思考機制和多平台集成能力顯著提升了軟件開發效率。

【AiBase提要:】
? GPT-5-Codex具备动态思考机制，能根据任务复杂度调整处理时间，提升编码效率。
? 支持多平台集成，包括IDE扩展、Web界面和GitHub代码审查功能，增强开发者生态。
? 开发者反馈显示，GPT-5-Codex显著缩短开发周期，提升代码生成速度并减少错误注释。
詳情鏈接:https://openai.com/index/introducing-upgrades-to-codex/

6、全国发布《人工智能安全治理框架》2.0版，推动安全可信的 AI 生态建设

《人工智能安全治理框架》2.0版于2025年9月15日正式發布，旨在應對快速發展的AI技術帶來的新挑戰。該框架在1.0版基礎上進行了優化，結合實際應用情況，完善了風險分類和防範措施，並強調了全球合作的重要性。

【AiBase提要:】
? 《人工智能安全治理框架》2.0版正式发布，以应对AI技术发展带来的新挑战。
? 框架基于1.0版进行优化，完善了风险分类与防范措施。
? 强调全球合作，推动多边机制下的人工智能安全治理合作。
詳情鏈接:https://www.cac.gov.cn/2025-09/15/c_1759653448369123.htm

7、OpenAI Evals新增原生音频输入和评估功能

OpenAI 的 Evals 工具新增原生音频输入和评估功能，使开发者能够直接上传音频文件进行性能评估，从而大幅提升语音识别与生成模型的开发效率和准确性。

【AiBase提要:】
? 原生音频输入功能简化了评估流程，提升开发效率。
? 无需文本转录即可直接评估语音识别与生成模型性能。
? 新功能为智能语音助手和音频内容生成提供更精准的测试支持。

8、颠覆传统！Mini-o3 开源模型实现超长视觉推理，深度思考不再是难题

Mini-o3是字節跳動與香港大學聯合推出的開源視覺推理模型，能夠進行數十輪的視覺推理，顯著提升了處理複雜視覺問題的能力。其核心設計包括VisualProbe數據集、叠代數據收集流程和超輪次掩碼策略，爲多輪視覺推理技術提供了新的方向。

【AiBase提要:】
? Mini-o3实现了数十轮的视觉推理能力，突破了以往1-2轮对话的限制。
? 通过构建VisualProbe数据集和迭代数据收集流程，提升了模型的深度推理能力。
? 超轮次掩码策略优化了训练效率，使模型在测试阶段表现更出色。
詳情鏈接:https://arxiv.org/pdf/2509.07969

9、上海AI Lab推出Lumina-DiMOO，开创多模态生成与理解新局面

上海人工智能實驗室聯合多所高校推出了新一代多模態生成與理解模型Lumina-DiMOO。該模型采用創新的全離散擴散架構，通過對比學習技術實現文本、圖像和音頻等數據的有效整合與對齊，顯著提升了生成質量和效率，並在多種應用場景中展現出廣闊的應用潛力。

【AiBase提要:】
? Lumina-DiMOO 是新一代多模态生成模型，采用创新的“全离散扩散架构”以提升数据处理效率。
?? 该模型通过对比学习技术，实现了文本、图像等多种数据的有效对齐与理解。
? Lumina-DiMOO 在图像生成和理解方面表现卓越，能够适应多种应用场景，展现出广阔的应用潜力。
詳情鏈接:https://github.com/Alpha-VLLM/Lumina-DiMOO

10、騰訊全新AI繪畫升級！微調技術讓生成圖像美感提升300%

騰訊推出的微調技術顯著提升了AI生成圖像的真實感與美學評分，其創新方法包括“Direct-Align”和“語義相對偏好優化”，有效解決了獎勵作弊和離線調整限制的問題。

【AiBase提要:】
? 通过“Direct-Align”技术减少梯度爆炸，提升模型优化能力。
? “语义相对偏好优化”（SRPO）实现文本控制图像风格调整。
? 实验显示SRPO训练模型在真实感和美学质量上显著提升。
詳情鏈接:https://arxiv.org/pdf/2509.06942

11、Meta AI 发布 MobileLLM-R1：轻量级边缘推理模型，参数不足 10 亿，性能提升显著

Meta AI 推出的 MobileLLM-R1 系列模型在轻量化和边缘计算领域表现出色，其参数规模从140M到950M，专注于数学、编码和科学推理。该模型在训练效率和性能上均优于同类模型，尤其在数学和编码任务中表现突出。

【AiBase提要:】
? 新模型发布：Meta AI 推出 MobileLLM-R1 系列轻量级边缘推理模型，参数范围从140M 到950M。
? 训练效率：MobileLLM-R1 仅用约11.7% 的数据训练，表现出色，训练成本和资源需求显著降低。
? 性能优势：在多项基准测试中，MobileLLM-R1-950M 表现超越多款大型开源模型，尤其在数学和编码任务上。
詳情鏈接:https://huggingface.co/facebook/MobileLLM-R1-950M

12、騰訊啓動AI應用繁榮計劃，超300家企業搶灘智能體新賽道

騰訊全球數字生態大會發布AI應用繁榮計劃，聚焦垂直場景，推動AI産業深度滲透。該計劃涵蓋AI共創營和AI百校行，吸引超300家企業參與，並通過技術共享、資源開放等方式孵化智能體與大模型應用。

【AiBase提要:】
?腾讯人工智能应用繁荣计划旨在将人工智能深稛嶷入垂直场景，有两个核心模块：人工智能共创营和人工智能百所学校活动。
?首届线下活动吸引了来自多个行业的近 3000 名参与者，显示了大规模人工智能应用的强劲市场需求。
?騰訊提供技術支持、資源和內容，幫助合作夥伴將其人工智能解決方案商業化。

13、谷歌DeepMind 发布 VaultGemma 具备差分隐私能力

谷歌 DeepMind 推出的 VaultGemma 是一款具有差分隐私能力的语言模型，专注于保护用户数据隐私。它基于 Gemma2 架构，采用了多查询注意力机制，并通过添加随机噪声确保模型输出无法与特定训练样本关联。尽管性能略显保守，但 VaultGemma 在隐私保护方面提供了更强的保障，未来有望为用户提供更安全和可靠的使用体验。

【AiBase提要:】
? VaultGemma 是一款具备差分隐私能力的开源语言模型，参数规模达到10亿。
? 采用仅解码器的 Transformer 设计，序列长度限制为1024个 Token。
? 谷歌将在 Hugging Face 和 Kaggle 上公开 VaultGemma 及其代码库，推动隐私安全与开源技术的结合。

14、QuestMobile 数据：豆包月活超越DeepSeek，荣登中国原生 AI APP 榜首

QuestMobile發布的2025年8月AI應用行業月度報告顯示，豆包憑借6.6%的環比增速達到1.57億月活用戶，超越DeepSeek成爲原生應用的第一。腾讯元宝同样表现不俗，其月活增速高达22.4%，位居原生应用第三。此外，超过一半的TOP50 AI 应用为In-App插件应用，豆包作为一款PC客户端应用也成功跻身榜单，显示出其跨端使用的优势。

【AiBase提要:】
? 豆包以6.6%的环比增速达到1.57亿月活用户，超越DeepSeek成为原生应用第一
? 腾讯元宝月活增速达22.4%，位列原生应用第三，用户规模在1000万到1亿之间
? 超过一半的TOP50 AI 应用为In-App插件应用，豆包作为PC客户端成功跻身榜单

（舉報）

相關推薦

關鍵詞：

薦AI日報：可灵AI发布数字人新功能；腾讯混元新技术给大模型 “去油”；抖音上线AI求真功能

AI日報今日聚焦多项技术突破：可灵AI推出图片转视频功能，腾讯混元SRPO技术提升图像真实感，IBM开源文档处理模型Granite-Docling-258M。Meta发布带屏AI眼镜Ray-Ban，DeepSeek论文登《Nature》封面。OpenAI新增GPT-5思考时长调节功能，抖音上线“AI求真”辟谣工具，通用DeepResearch开源模型性能超越国际知名模型。

?AI日報 ?數字人 ?視頻生成
苹果iOS 26普通照片秒变3D照上熱搜 “空间场景”功能引熱议

苹果正式推送iOS 26系统，支持iPhone 11及以上机型。新系统引发用户吐槽，如LiquidGlass设计被指“丑出新高度”，升级后出现发烫、卡顿等问题。但“空间场景”功能广受好评，可将普通照片转换为裸眼3D效果，操作便捷，还能设为动态壁纸。不过该功能在不同屏幕上的表现存在差异，低刷屏会出现卡顿，高刷屏则效果更流畅逼真。

?iOS26 ?LiquidGlass ?空間場景
薦AI日報：生数科技推出Vidu Q2；火山引擎推出炉米Lumi；通义千问开源300+模型

本文汇总了近期AI领域多项重要进展：生数科技推出Vidu Q2模型，显著提升视频生成中细微表情的真实感；火山引擎发布炉米Lumi平台，支持视觉模型LoRA微调以定制独特风格；阿里云通义千问开源超300个模型，下载量突破6亿次；百度开源多模态视觉理解模型Qianfan-VL，适配不同场景需求；微软在Copilot中引入Anthropic模型，拓展AI助手功能；OpenAI计划在美国新建五个数据中心以加速Stargate项目；英伟达开源Audio2Face模型，提升实时面部动画生成效果；Meta发布具备沙箱推演能力的32B代码世界模型CWM，优化代码调试效率。这些动态展示了AI技术在视觉、多模态、开源生态及硬件支持等方面的快速迭代与创新突破。

?AI ?視頻生成 ?細微表情
薦AI日報：阿里推多模态模型Qwen3-Omni；谷歌推出AP2协议；百度推出Qianfan-VL 模型

本期AI日報聚焦多领域技术突破：阿里云推出全球首个全模态AI模型Qwen3-Omni，支持文本、图像、音频和视频统一处理；百度发布多尺寸视觉理解模型Qianfan-VL，优化企业级应用。苹果扩展Image Playground平台，引入ChatGPT等第三方模型。谷歌与PayPal合作推出AP2协议，推动AI支付安全创新。钉钉上线AI表格助手，支持自然语言生成表格。DeepSeek开源V3.1-Terminus模型，性能显著提升。Kimi推出Agent会员服务，智元机器人开源全球首个通用具身智能模型GO-1，降低技术门槛促进行业创新。

?AI模型 ?全模態 ?阿裏雲
薦AI日報：京东物流推出超脑大模型2.0；DeepSeek V3.1终结版发布；Kimi 推出全新 Agent 模式

本期AI日報聚焦多领域技术突破：京东物流发布“超脑大模型2.0”与“异狼具身智能机械臂系统”，推动物流行业迈向自主执行；DeepSeek推出V3.1终结版，修复漏洞并为V4架构铺路；Kimi上线Agent模式“OK Computer”，支持智能网站开发等复杂任务；ChatGPT新增个性化資訊功能，定制用户专属新闻；Exa Code发布代码索引工具，助力AI代理精准生成代码；Meta推出AI视频创作平台Vibes，简化短視頻制作；蚂蚁数科发布隐私保护AI框架Gibbon，推理速度提升超百倍；OpenAI新基准测试显示GPT-5在多个行业逼近人类专家水平，覆盖九大行业44种职业。

?京東物流 ?超腦大模型2.0 ?異狼具身智能機械臂系統
業界首個！騰訊混元Voyager3D世界模型發布：支持原生3D重建

今日，腾讯混元官方宣布，HunyuanWorld-Voyager（简称混元Voyager）正式发布，这是业界首个支持原生3D重建的超长漫游世界模型。该模型在斯坦福大学李飞飞团队发布的世界模型基准测试WorldScore上位居综合能力首位，超越现有开源方法，在视频生成和3D重建任务中均表现出色。在视频生成和视频3D重建两个任务上，Voyager也均取得更好的结果。

?騰訊混元 ?3D重建 ?世界模型
IFA 2025“杰出创新奖”揭晓：三星電競显示器以裸眼3D体验引领行业变革

三星玄龙骑士3D電競显示器G90XF荣获2025年IFA创新奖，凭借裸眼3D技术突破行业瓶颈。该产品通过眼球追踪和视图映射算法实现无眼镜立体视觉，同时保持4K分辨率、165Hz刷新率等顶级显示性能。结合AI视频转换功能与游戏生态建设，三星正推动显示技术从二维向三维沉浸式体验跨越，重塑行业标准。

?三星 ?玄龙骑士3D電競显示器 ?IFA創新獎
薦AI日報：接入MJ！夸克发布造点AI；Wan2.5-Preview发布；可灵推最新视频生成模型可灵2.5Turbo

近日AI领域迎来多项重要更新：阿里夸克发布AI创作平台“造点”，整合通义万相Wan2.5与Midjourney V7，支持音画同步视频生成；Wan2.5-Preview实现多模态输入与电影级视频同步生成，提升视觉创作能力；可灵AI推出视频生成模型2.5Turbo并降价30%，降低使用门槛；阿里通义推出Qwen3-ASR-Toolkit，实现小时级音视频转录；谷歌相册AI编辑功能扩展至安卓用户，支持语音修图；谷歌Mixboard工具助力创意设计，生成情绪板；Qwen发布Qwen3-Max模型，在代码生成与智能体能力表现突出；Figma推出MCP服务器，实现设计到代码的一键转换，提升开发效率。

?AI創作平台 ?通義萬相 ?音畫同步
腾讯应用宝与高通（中国）基于骁龙平台共推端侧AI能力发布AI智能启动台

在2025骁龙峰会期间，腾讯应用宝与高通（中国）宣布合作，聚焦移动应用跨端引擎技术与端侧AI应用创新。双方推出针对搭载骁龙X系列计算平台的定制化解决方案，包括升级的跨端引擎和基于端侧AI能力的智能启动台，提升PC内容体验与生产力工具效率。跨端引擎实现安卓应用原生运行、续航超9小时、虚拟机启动仅5.5秒等性能突破，覆盖超1000款熱门应用。智能启动台通过文件主題分类、本地搜索和AI服务（如发票助手）重构PC交互，降低AI调用成本并保护数据隐私。此次合作旨在完善跨端生态布局，推动端侧AI普惠化落地。

?骁龍峰會 ?騰訊應用寶 ?跨端引擎
全球第一！腾讯混元翻译模型Hunyuan-MT-7B登顶开源熱榜

腾讯混元翻译模型Hunyuan-MT-7B登顶Hugging Face趋势榜首位，并在ACL WMT2025睙狳中以30项第一的成绩领先。该模型支持33种语言，包括5种汉语言方言互译，在Flores200评测中表现卓越，超越同尺寸模型，与超大模型效果相当。腾讯提出完整训练范式，覆盖预训练到强化学习全链条，实现业界最优翻译效果。

?騰訊混元 ?Hunyuan-MT-7B ?翻譯模型

今日大家都在搜的詞：

熱文

3 天
7天

站長商机

美女1级情感片下载二级1片欧美1级片 1级片网站 a1级片免费看1级片看1级片国产1级片三级1片三1级片

AI日報：腾讯发布混元3D 3.0模型；昆仑万维上线Agent Studio功能；阿里Qoder推出付费订阅服务

薦AI日報：可灵AI发布数字人新功能；腾讯混元新技术给大模型 “去油”；抖音上线AI求真功能

苹果iOS 26普通照片秒变3D照上熱搜 “空间场景”功能引熱议

薦AI日報：生数科技推出Vidu Q2；火山引擎推出炉米Lumi；通义千问开源300+模型

薦AI日報：阿里推多模态模型Qwen3-Omni；谷歌推出AP2协议；百度推出Qianfan-VL 模型

薦AI日報：京东物流推出超脑大模型2.0；DeepSeek V3.1终结版发布；Kimi 推出全新 Agent 模式

業界首個！騰訊混元Voyager3D世界模型發布：支持原生3D重建

IFA 2025“杰出创新奖”揭晓：三星電競显示器以裸眼3D体验引领行业变革

薦AI日報：接入MJ！夸克发布造点AI；Wan2.5-Preview发布；可灵推最新视频生成模型可灵2.5Turbo

腾讯应用宝与高通（中国）基于骁龙平台共推端侧AI能力发布AI智能启动台

全球第一！腾讯混元翻译模型Hunyuan-MT-7B登顶开源熱榜

今日大家都在搜的詞：

熱文

微信新功能上线：长按图片“搜一搜” 检索购物转表一键达

AI日報：生数科技推出Vidu Q2；火山引擎推出炉米Lumi；通义千问

雷軍稱沒什麽好猶豫的：50歲正是闖的年紀

小米非常非常缺人上熱搜雷军谈小米成功秘诀

AI日報：京东物流推出超脑大模型2.0；DeepSeek V3.1终结版发布

苹果回应iPhone17 Pro划痕：展示机问题将改善

小米17标准版正式发布：售价4499元起首发第五代骁龙8至尊版

雷军：小米17标准版加量不加价年度演讲时长大约2个半小时

卢伟冰：小米17全球首发骁龙8 Elite Gen5

小米汽车定制服务发布：每月限量 40 台选配金额需超10万元

微信新功能上线：长按图片“搜一搜” 检索购物转表一键达

华为WATCH GT 6/Pro系列手表发布售价1488元起

雷軍公布小米17標准版外觀：1.18mm窄邊框、6.3英寸直屏

AI日報：接入MJ！夸克发布造点AI；Wan2.5-Preview发布；可灵推

全新问界M7小订破22万：将于明晚上市公布价格

AI日報：美团发布推理大模型LongCat-Flash-Thinking；阿里Wan-

AI日報：阿里推多模态模型Qwen3-Omni；谷歌推出AP2协议；百度推

ColorOS 16将于10月15日发布 Find X9系列全球首发搭载

折叠屏iPhone细节曝光采用超薄钛合金：预计售价2000美元起

小米平板8系列搭載11.2英寸3.2K旗艦屏

站長商机