網站賺不到錢？立刻加入參與變現
字體超市--好字體用得起，買得起！
共建未成年人“清朗”網絡空間承諾書

AI日报：阿里推全新图片模型Qwen-Image；小米全量开源MiDashengLM-7B；智谱Zread.ai搭载 GLM-4.5

2025-08-05 16:16 · 稿源：站長之家

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的熱點内容，聚焦开发者，助你洞悉技术趋势、了解创新AI産品應用。

新鮮AI産品點擊了解：https://top.aibase.com/

1、小米全量开源MiDashengLM-7B：音频理解性能刷新SOTA，推理速度暴增 20 倍

小米正式发布并全量开源了MiDashengLM-7B多模态大模型，该模型在音频理解领域实现了性能和效率的双重突破。其在 22 个公开评测集上取得最佳成绩，并且在推理效率方面表现出色，单样本首Token延迟仅为业界先进模型的四分之一，数据吞吐效率高出 20 倍以上。

【AiBase提要:】
? 双核心架构设计，融合专业音频处理与语言理解能力。
? 实现语音、环境声音和音乐的统一理解，提升跨域音频识别精度。
? 推理效率显著提升，支持终端离线部署，降低使用成本。

2、腾讯旗下AI工作台ima 推出全新功能，支持 AI 播客和文件夹导入等多项实用工具

騰訊旗下AI知識管理工具ima推出了多項新功能，包括AI播客生成、文件夾一鍵導入、Xmind腦圖導入及知識庫內容置頂，旨在提升用戶的知識獲取和管理體驗。

【AiBase提要:】
? 支持AI播客生成，帮助用户更轻松地消化长篇文章或报告。
? 提供一键导入文件夹功能，简化文档管理流程。
? 可将重要文档置顶，提升信息检索效率。

3、阿裏通義千問開源全新文生圖模型Qwen-Image

阿裏通義千問开源了全新的文生圖模型Qwen-Image，该模型在文本渲染和圖像編輯方面表現出色，並在多個基准測試中取得領先性能，成爲圖像生成與編輯領域的重要突破。

【AiBase提要:】
?? Qwen-Image支持多行布局、段落级文本生成及细粒度细节呈现，能精准渲染宫崎骏风格动漫场景和中文对联书法效果。
? 在圖像編輯方面，Qwen-Image具备风格迁移、物体增减、细节增强等能力，使普通用户也能轻松实现专业级圖像編輯。
? Qwen-Image在多个公开基准测试中表现卓越，尤其在中文文本渲染上大幅领先现有先进模型，展现了全面优势。
詳情鏈接:https://modelscope.cn/models/Qwen/Qwen-Image

4、ChatGPT用户数暴涨至 7 亿创纪录新高，OpenAI年化收入飙升至 120 亿美元

文章详细介绍了ChatGPT的用户增长、商业化进展以及OpenAI的财务表现。同时提到GPT- 5 可能即将发布，以及与谷歌AI产品的竞争情况。此外，还强调了产品优化和对用户健康的关注。

【AiBase提要:】
? ChatGPT周活跃用户达到 7 亿，同比增长超四倍。
? OpenAI年化收入达到 120 亿美元，远超预期。
? 新增休息提醒功能，关注用户健康与体验提升。

5、Anthropic疑似开始内测Claude Opus 4.1：代号leopard暗示推理能力重大升级

文章指出，Anthropic正在对其下一代大语言模型Claude Opus 4. 1 进行内部测试，其内部代号为claude-leopard-v2-02-prod。新模型的宣传语强调了问题解决能力的显著提升，表明其在逻辑推理和复杂任务处理方面有重大突破。同时，该模型可能接近正式发布阶段，预计将在激烈的AI市场竞争中保持技术领先。

【AiBase提要:】
? 新模型Claude Opus 4. 1 主打问题解决能力，强化逻辑推理与复杂任务处理。
豹子命名暗示模型具備更快響應速度和精准分析能力，預示架構創新。
內測版本v2-02-prod表明模型已進入生産環境測試階段，接近正式發布。

6、搭载 GLM-4.5！智谱推出 Zread.ai 开发效率工具，更快理解代码与生成文档

Zread.ai 是一款基于大语言模型的开发效率工具，旨在帮助开发者快速掌握项目结构、生成技术文档，并提升团队协作效率。其核心功能包括代码理解、知识生成和团队协作，利用 GLM-4.5 模型实现高效的代码分析和文档生成。

【AiBase提要:】
? Zread.ai 提供一站式代码理解与文档生成服务，帮助开发者快速掌握项目结构。
? 自动生成项目导读，涵盖架构解析、模块说明等内容，提升文档撰写效率。
? 背后采用 GLM-4.5 模型，具有出色的代码理解能力和低误判率，支持深入技术问答。

7、xAI 发布 Grok Imagine4:支持文生图与视频生成，开放 NSFW 内容创作

xAI推出的Grok Imagine4 在文生图和图生视频方面表现出色，尤其以快速的生成速度和原生支持NSFW内容为亮点，但视频效果仍有提升空间。

【AiBase提要:】
? 文生图功能生成速度快，接近实时浏览体验。
? 图生视频效率高，但画面细节和流畅性有待优化。
?? 原生支持NSFW内容生成，引发伦理讨论。

8、阿裏巴巴與南開大學攜手推出視頻大模型新型壓縮技術LLaVA-Scissor

LLaVA-Scissor 是一种创新的视频大模型压缩方法，由阿里巴巴通义实验室与南开大学计算机科学学院联合开发。该技术通过基于图论的SCC算法有效减少token数量，同时保留关键语义信息，显著提升了视频处理效率，并在多个视频理解基准测试中表现出色。

【AiBase提要:】
? LLaVA-Scissor 是一种新型视频大模型压缩技术，旨在解决传统方法中token数量激增的问题。
? SCC 方法通过计算token相似性，构建图并识别连通分量，从而减少token数量并保留关键语义信息。
? LLaVA-Scissor 在低token保留率下展现出显著性能优势，尤其在视频问答和长视频理解任务中表现优异。

9、北京團隊突破！全球首個人形機器人3D視覺系統誕生，多傳感器融合技術領跑世界

文章介绍了北京人形机器人创新中心推出的Humanoid Occupancy视觉感知系统，该系统通过语义占用表征技术实现了对三维空间的精准建模和多传感器数据的高效融合，解决了人形机器人在复杂环境中的感知难题。

【AiBase提要:】
? 引入语义占用表征技术，实现对三维空间的精细化建模。
? 支持多模态传感器协同工作，提升环境信息整合能力。
? 构建大规模数据集，为研究提供宝贵资源支持。
詳情鏈接:https://arxiv.org/pdf/2507.20217

10、OpenMind推出機器人操作系統OM1：打造機器人領域的安卓，FABRIC協議實現機器人互聯互通

OpenMind通过开发名为OM1 的机器人操作系统，致力于成为机器人领域的Android。其创新的FABRIC协议使机器人能够验证身份并共享信息，推动机器人间的协作与学习。

【AiBase提要:】
? OpenMind专注于机器人软件生态，开发了OM1 操作系统，旨在成为机器人领域的Android。
? FABRIC协议为机器人构建了一个信任和协作网络，提升群体智能的进化速度。
? OpenMind选择家庭场景作为切入点，以满足对人性化交互的需求。

（舉報）

相關推薦

關鍵詞：

ISC.AI 2025 人工智能安全治理与创新实践论坛圆满召开

ISC.AI2025人工智能安全論壇在北京召開，聚焦AI安全治理與創新實踐。論壇彙集頂尖專家，探討大模型安全評估與防護、智能體安全、AI治理等前沿議題。360集團張向征指出，隨著Agent技術爆發式應用，AI安全已成爲産業核心焦點。專家們強調需構建AI安全防護體系，應對大模型直接訪問核心系統帶來的全新挑戰。中國電子院彭健提出企業合規建設需關注九大要素，清華大學蘇航揭示智能體安全風險遠超傳統AI。華爲雲範建軍倡導端到端大模型安全防護，中國信通院楊哲超呼籲構建協同治理框架。論壇爲構建安全、普惠、負責任的人工智能未來貢獻智慧。

?人工智能安全 ?大模型安全 ?AI治理
Razer（雷蛇）在新加坡设立AI CENTER OF EXCELLENCE，加速人工智能投资布局

雷蛇宣布在新加坡设立全球AI卓越中心，并计划在欧洲和美国建立类似机构，推动游戏与开发者工具领域的创新。新加坡中心将招聘150名AI工程师，专注于下一代AI游戏技术研发。雷蛇还推出AI工具套件，包括Game Co-AI和QA Co-AI，帮助开发者提升游戏质量和开发效率。该战略布局正值全球游戏市场快速增长期，预计2033年AI游戏市场规模将达280亿美元。新加坡数字产业发展局表示，此举将巩固该国作为区域AI创新中心的地位。

?雷蛇 ?人工智能 ?遊戲創新
薦AI日报：腾讯混元开源Hunyuan-GameCraft；最强圖像編輯器nano-banana发布；字节开源Agent专用模型 M3-Agent-Control

本文介绍了AI领域最新动态：1)腾讯开源Hunyuan-GameCraft框架，可快速生成高质量游戏视频；2)Nano-Banana模型在圖像編輯领域超越FLUX+Kontext；3)字节开源基于Qwen 3 32B的328亿参数M3-Agent-Control模型；4)Kimi将推出PPT生成功能；5)阿里1688将上线"诚信通AI版"会员服务；6)苹果智能家居中心推迟至2026年发布；7)万兴科技接入GPT-5；8)全球AI独角兽达498家，总估值2.7万亿美元；9)谷歌为Slides和

?AI ?遊戲視頻生成 ?騰訊混元
真我GT8 Pro渲染图曝光徐起：不是大矩阵大家放心

今日，真我GT8 Pro渲染图在网上曝光，大矩阵设计的后摄模组引发网友讨论。今天下午，真我realme副总裁、全球营销总裁、中国区总裁徐起微博发文称：不是大矩阵，大家放心。” 据了解，真我GT8系列将在10月发布，推出真我GT8和真我GT8 Pro。

?真我GT8 ?Pro ?渲染圖曝光
加佳科技亮相世界人工智能大會，參與浦東重點項目簽約並發布創新技術成果

2025世界人工智能大会(WAIC)7月26日在上海开幕。加佳智云的"曦源一号"项目入选浦东新区人工智能重点项目并签约合作协议。加佳科技首次发布"数字商务智能体训练场"创新技术平台，与多家企业达成战略合作。浦东新区人工智能产业规模超1600亿元，占全市40%。加佳科技通过"曦源一号"训练场基础底座平台，为行业提供"硬件+软件+产业解决方案"一体化服务，推动AI与产业深稛嶷合。大会期间，加佳科技展示其核心成果"数字商务智能体训练场"平台，该平台依托国产替代算力，提供全生命周期开发运营服务，降低企业AI应用门槛。加佳科技还与多家企业达成合作，加速构建开放共生的AI产业生态。

?人工智能大會 ?數字商務智能體 ?浦東新區AI産業
剛剛，全網最懂圖文調研的智能體模型震撼上線，看完我直接卸了浏覽器

疯狂的七月已经落下了帷幕，如果用一个词来形容国产大模型，「开源」无疑是当之无愧的高频词汇。各大厂商你方唱罢我登场，昆仑万维、阿里、智谱、月之暗面、腾讯、阶跃星辰等众多玩家们先后开源了数十款大模型。根据 Hugging Face 发布的中国 AI 社区七月开放成果，短短一个月开源模型总数达到了惊人的33款。进入到八月，国产大模型「上新」的势头丝毫不减，重量?

?開源 ?大模型 ?國産
星辰聚智·才啓未來：2025世界人工智能大會中國電信發布系列前沿能力及AI産品

7月27日，TeleAI科技前沿论坛在上海模速空间举办，主題为"星辰聚智·才启未来"。论坛汇聚全球行业专家、青年学者及企业家，探讨AI创新趋势。中国电信发布多项AI成果：1）TeleAI研究院凭借大模型创新获2025SAIL之星奖；2）提出"智传网"三大定律（信容律、同源律、集成律）及生成式智能传输等创新技术；3）发布"星小辰"智能终端，整合高德地图、航旅纵横等服务；4）推出首款智能眼镜"天翼AI智镜"，具备物体识别、实时翻译等功能；5）启动"青年智算计划"，投入超600P算力支持AI创新。论坛展示AI在终端、机器人等领域的深度应用，体现中国电信"云改数转智惠"战略布局。

?人工智能 ?科技論壇 ?創新趨勢
潤和軟件攜豐富金融行業實踐成果亮相2025世界人工智能大會

潤和軟件在2025世界人工智能大會(WAIC2025)上展示了JettoAI+智能助手平台等系列智慧金融解決方案，包括測試智能助手、消保助手、研報助手等創新産品。作爲金融科技領域領先企業，潤和軟件深耕AI與金融業務融合，已服務6大國有銀行、12家股份制銀行及超280家中小金融機構。報告顯示中國金融科技市場預計將以13.3%複合增長率高速增長，2028年科技投入或突破6500億元。潤和軟件?

?金融科技 ?人工智能 ?智慧金融
零门槛数字IP上线，邦彦Nuwaai掀起世界人工智能大会（WAIC）互动体验熱潮?

邦彥技術在2025世界人工智能大會發布Nuwaai數字人平台，主打"3分鍾創建AI數字IP"概念。該平台通過三大核心模塊（形象塑造、才藝賦能、個性養成）實現數字人全流程創作，支持古風、職業裝等多種風格定制，並能加載營銷、直播等專業技能。相比傳統方案，Nuwaai將開發成本降至8元起，交付周期縮短至3分鍾，支持按需加載功能。平台定位"數字人生産力工具"，覆蓋營銷、社交、娛樂等多場景應用，旨在推動數字人技術從概念探索邁向實用化。目前官網已開放注冊，面向個人創作者和企業用戶提供低成本數字IP解決方案。

?AI數字人 ?數字人生産力 ?邦彥Nuwaai
昆仑万维UniPic 2.0“小钢炮”模型炸场，一个模型搞定理解+生成+编辑

大模型又迎来新一波的迭代周期。近日，从Open AI发布GPT-5，到国内的昆仑万维、商汤、百川智能、智谱等都陆续发布了自己的新模型。其中昆仑万维更是一口气开启了技术周，连续5天每天发布一个新模型，而8月13日发布的，正是其本周发布的第三款模型——多模态统一模型UniPic2.0。 UniPic2.0主打的是，在单一模型中深稛嶷合图像理解、文本到图像生成、圖像編輯三大核心能力

?大模型 ?多模態 ?AI生圖

今日大家都在搜的詞：

熱文

3 天
7天

站長商机

美女1级情感片下载二级1片欧美1级片 1级片网站 a1级片免费看1级片看1级片国产1级片三级1片三1级片

AI日报：阿里推全新图片模型Qwen-Image；小米全量开源MiDashengLM-7B；智谱Zread.ai搭载 GLM-4.5

ISC.AI 2025 人工智能安全治理与创新实践论坛圆满召开

Razer（雷蛇）在新加坡设立AI CENTER OF EXCELLENCE，加速人工智能投资布局

薦AI日报：腾讯混元开源Hunyuan-GameCraft；最强圖像編輯器nano-banana发布；字节开源Agent专用模型 M3-Agent-Control

真我GT8 Pro渲染图曝光徐起：不是大矩阵大家放心

加佳科技亮相世界人工智能大會，參與浦東重點項目簽約並發布創新技術成果

剛剛，全網最懂圖文調研的智能體模型震撼上線，看完我直接卸了浏覽器

星辰聚智·才啓未來：2025世界人工智能大會中國電信發布系列前沿能力及AI産品

潤和軟件攜豐富金融行業實踐成果亮相2025世界人工智能大會

零门槛数字IP上线，邦彦Nuwaai掀起世界人工智能大会（WAIC）互动体验熱潮?

昆仑万维UniPic 2.0“小钢炮”模型炸场，一个模型搞定理解+生成+编辑

今日大家都在搜的詞：

熱文

苹果iOS 18.6.1正式版发布：美版Apple Watch血氧功能上线

AI日报：腾讯混元开源Hunyuan-GameCraft；最强圖像編輯器nano-

华为MatePad Air新款官宣8月15日发布

华为MatePad Air 12英寸2025发布：售价2799元起

REDMI Note 15 Pro系列官宣下周发布

AI日報：可靈2.1推出全新首尾幀功能；昆侖萬維上線AI音樂模型M

微信聊天可以引用部分文字了！還可用表情包回複

华为MatePad 11.5 S 2025发布：预装鸿蒙5 首发售价2099元起

苹果正式入驻小红书 iPhone 17系列下月发布

苹果iOS 18.6.1正式版发布：美版Apple Watch血氧功能上线

iPhone17Pro最新外觀曝光：蘋果調整天線布局

AI日報：昆侖萬維發布SkyReels-A3模型；百度搜索PC端全面上線A

全球首款女团机器人10580元拍出接入京东Joy Inside智能体

AI日报：腾讯混元开源Hunyuan-GameCraft；最强圖像編輯器nano-

AI日報：智譜視覺推理模型GLM-4.5V開源；達摩院開源三項具身智

REDMI Note 15 Pro系列官宣本月发布

京东养车50亿补贴更名震骨价号称补贴不「唬」

雷军发起小米YU7版本更名投票称小米YU7标准版绝非丐版

REDMI Turbo 5已备案：首发天玑8500处理器

站長商机