網站賺不到錢？立刻加入參與變現
字體超市--好字體用得起，買得起！
共建未成年人“清朗”網絡空間承諾書

AI日報：阿裏開源Qwen-Image-Edit；淘寶“AI搜”功能灰度測試；小紅書發布DynamicFace人臉生成技術

2025-08-19 15:43 · 稿源：站長之家

歡迎來到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的熱點内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鮮AI産品點擊了解：https://top.aibase.com/

1、阿裏開源 Qwen-Image-Edit：中文渲染秒殺 GPT-4o，精准文本編輯+語義外觀雙控

Qwen-Image-Edit 是阿里通义千问团队推出的圖像編輯模型，凭借其强大的文本编辑能力和双重编码机制，在中文渲染和圖像編輯领域表现出色，具有广泛的应用前景。

【AiBase提要:】
? 突破性文本编辑能力，支持中英文精准渲染，尤其在中文场景下表现卓越。
? 双重编码机制确保语义与外观的平衡，提升圖像編輯的准确性和视觉一致性。
? 開源赋能全球AI创作生态，提供多种平台和工具支持，推动技术普及与应用。
詳情鏈接:https://github.com/QwenLM/Qwen-Image

2、淘寶“AI萬能搜”功能灰度测试，探索電商新购物模式

淘寶正在灰度測試名爲“AI萬能搜”的新功能，利用大模型技术重构電商搜索体验。该功能通过自然语言理解为用户提供购物攻略、口碑评测和优惠咨询等服务，并展示AI的思考过程。

【AiBase提要:】
? AI萬能搜基于大模型技術，提升用戶購物決策效率。
? 功能聚焦穿搭指南、送礼清单、选购攻略和问口碑四大场景。
? 用户可清晰看到AI的思考逻辑，包括获取信息、查询需求和分析总结。

3、小紅書發布DynamicFace人臉生成技術，實現高質量圖像視頻人臉融合

小紅書AIGC團隊發布了名爲DynamicFace的可控人臉生成技術，這項技術針對圖像和視頻領域的人臉融合任務進行優化，能夠實現高質量與高度一致性的人臉置換效果。該技術不僅在娛樂社交領域有廣泛應用前景，在影視制作、虛擬形象生成等專業領域也具有重要價值。

【AiBase提要:】
? DynamicFace技术强调可控性，允许用户对人脸生成过程进行精确控制。
? 该技术在图像和视频两个维度都实现了优化，特别是在保持高度一致性方面表现突出。
? 小红书在推出这一技术的过程中，如何平衡创新与安全将是业界关注的重点。

4、Gemini API重磅升级！URL Context功能上线，网站内容直接变现新模式来袭！

Gemini API推出了URL Context功能，允许开发者直接在API中嵌入网页链接，简化了内容获取流程，并为内容提供商和开发者带来了新的商业机会。该功能提升了开发效率，同时可能催生新的商业模式，如类似AdSense的联盟机制。

【AiBase提要:】
? URL Context功能让开发者可以直接在提示中提供网页链接，模型自动访问并解析内容，提升开发效率。
? 使用URL Context时，提取的内容将计入输入Tokens费用，需权衡成本与内容量。
? 新的商业模式可能通过联盟机制实现，内容提供商可从Tokens费用中分得利润，激励高质量内容生成。
詳情鏈接:https://ai.google.dev/gemini-api/docs/url-context?hl=zh-cn

5、Nvidia 推出新型小型开放模型 Nemotron-Nano-9B-v2，支持智能推理开关

Nvidia 发布了新型小型语言模型 Nemotron-Nano-9B-v2，该模型在多个基准测试中表现优异，并支持用户灵活控制推理功能。其参数量为90亿，优化于单个 Nvidia A10 GPU，适用于多语言任务和代码生成。

【AiBase提要:】
? Nemotron-Nano-9B-v2 是一款新型小型语言模型，支持用户灵活控制推理功能。
?? 模型基于混合架构，能够高效处理长序列信息，适用于多语言任务。
? 以开放模型许可证发布，允许商业用途和衍生模型的创建。
詳情鏈接:https://huggingface.co/nvidia/NVIDIA-Nemotron-Nano-9B-v2

6、马斯克发布Grok Imagine 0.1版本，野心打造宇宙最強想象力放大器

马斯克在X平台宣布其AI公司xAI推出的图像生成功能Grok Imagine目前为0.1测试版，并表达了对其未来发展的雄心壮志。该功能旨在与DALL-E、Midjourney等主流AI图像生成工具竞争，同时希望成为用户拓展创意思维的创新平台。

【AiBase提要:】
? Grok Imagine是xAI推出的图像生成功能，目标是与DALL-E、Midjourney等竞争。
? 马斯克公开承认当前版本仍需改进，但对未来发展充满信心。
? 功能定位为“想象力放大器”，旨在帮助用户拓展创意思维和想象边界。

7、Vercel v0 iOS版发布：AI驱动的移动开发新篇章

Vercel推出了其AI驅動開發工具v0的iOS版本，爲移動開發者提供了全新的構建體驗。該工具通過自然語言提示生成全棧Web應用，顯著提升了開發效率，並在React和Next.js框架中表現出色，贏得了廣泛認可。

【AiBase提要:】
? Vercel v0 iOS版正式推出，为移动开发者带来全新构建体验。
? 利用自然语言提示生成全栈Web应用，提升开发效率。
? 现已开放候补名单注册，欢迎开发者抢先体验。
詳情鏈接:https://v0.app/ios

8、理想汽车发布MindGPT 3.1智能体模型，每秒200字符输出速度提升5倍

理想汽車發布MindGPT3.1智能體模型，顯著提升了AI助手的實時處理和多任務協調能力，同時在數學計算、代碼編程等關鍵維度表現全面超越前代版本，展現了其在AI大模型領域的技術實力。

【AiBase提要:】
? MindGPT3.1将智能体能力深稛嶷入大模型架构，支持边想边搜功能。
? 每秒输出速度最高可達200個tokens，性能提升近5倍。
? 代码能力增强，可实现贪吃蛇游戏、弹球控制等经典编程案例。

9、AI 技术简化动漫制作流程，ToonComposer实现自动上色和生成动画

ToonComposer 是一项基于生成式 AI 技术的创新工具，能够显著简化动画制作流程。用户只需提供一张草图和一帧彩色图像，即可生成完整的卡通视频，节省高达70% 的人工工作时间。该技术还支持关键帧控制和区域控制功能，提升了创作效率。

【AiBase提要:】
? ToonComposer 通过生成式 AI 技术，简化了动画制作流程，用户仅需一张草图和一帧彩色图像即可生成完整动画。
? 该系统可节省高达70% 的人工工作时间，让创作者专注于创意。
?? 提供区域控制功能，用户可自由标记草图区域，系统会智能填充，提升创作效率。
詳情鏈接:https://lg-li.github.io/project/tooncomposer/

10、ElevenLabs發布全新視頻到音樂生成流程

ElevenLabs推出了視頻到音樂生成流程和AI學生包，爲內容創作者和學生提供了更高效、經濟的創作工具。這些更新進一步鞏固了ElevenLabs在AI音頻領域的領先地位。

【AiBase提要:】
? 视频到音乐生成流程：基于视频内容自动生成定制化配乐。
? AI学生包：提供免费积分和折扣工具，支持教育领域应用。
? 技术与商业突破：扩展多模态能力，并推动AI音频生态升级。

（舉報）

相關推薦

關鍵詞：

薦AI日报：腾讯開源图像模型HunyuanImage2.1；?爱诗科技获6000万美元融资；?Freepik上线豆包Seedream4.0图像模型

本文汇总了AI领域的最新动态：腾讯升级混元生图模型至2.1版，支持2K分辨率与中英文输入；爱诗科技获阿里领投6000万美元融资，聚焦AI视频生成；Freepik上线Seedream 4.0图像模型，提供高分辨率生成选项；阿里千问新模型通过MoE架构提升推理效率10倍；微软在Office 365中集成Anthropic技术，调整AI供应商策略；首款AI Agent浏览器Fellou CE发布，简化工作流程；清华团队開源GUAVA技术，实现

?AI日報 ?混元生圖模型 ?2K分辨率
薦AI日报：国产版Nano Banana？即梦图片4.0发布；阿里巴巴发布 Qwen3-Max-Preview；上海重磅发布AI廣告扶持政策

AI日报栏目聚焦人工智能领域最新动态。主要内容包括：即梦图集4.0发布，新增文生图、圖像編輯等功能；阿里巴巴推出超万亿参数语言模型Qwen3-Max-Preview；小米AI眼镜上线支付宝“看一看”支付功能；微软開源14B参数模型rStar2-Agent在数学推理领域表现突出；MiniMax启动股权激励计划覆盖核心员工；谷歌明确Gemini使用限制，免费用户每日最多5次提示；上海发布AI廣告扶持政策，最高补贴500万元。这些进展展示了AI技术在图像处理、语言模型、智能支付等领域的创新应用。

?AI ?圖像處理 ?文生圖
美团也開源了大模型，但我觉得他们的野心是通用生活Agent。

也有线上体验地址:https://longcat.ai 我自己去体验了一下，整体模型能力，中规中矩，但是快，是真的快，能把560B的模型，在推理的时候搞得这么快，是真的有点牛逼的。我直接录了个屏给大家看一下。这里我们可以直观对比一下LongCat和DeepSeek V3的输出速度，他俩都是MoE架构，而且总参数量差不太多。为了更公平的竞争，用了同一个问题，并关闭了联网搜索来避免搜索干扰?

?美團 ?AI模型 ?開源
薦AI日报：字节视频模型Waver 1.0发布；百度AI搜索APP“梯子AI”发布；谷歌推全新Gemini 2.5 Flash圖像編輯模型

本文汇总了AI领域最新动态：谷歌推出Gemini 2.5 Flash圖像編輯模型，字节发布Waver 1.0视频生成工具；百度“梯子AI”提供无廣告搜索；文心快码新增终端编码功能；腾讯游戏VISVISE工具集提升动画制作效率；自动驾驶配送机器人RM5进军外卖行业；DeepSeek V3.1出现字符Bug已修复；谷歌翻译升级实时同传和AI陪练；全球首现AI勒索软件PromptLock威胁网络安全；Anthropic推出Chrome浏览器AI助手Claude。

?AI ?Gemini ?2.5
薦AI日报：AI内容新规正式生效；美团推出開源大模型LongCat；阶跃发布语音大模型Step-Audio 2 mini

AI日报栏目每日更新AI领域熱點内容，聚焦开发者需求。本期重点包括：阶跃星辰发布端到端语音大模型Step-Audio2 mini，在多项基准测试中表现优异；9月1日起AI生成内容需强制标识；美团推出開源大模型LongCat；上海AI实验室发布多模态大模型InternVL3.5；腾讯ARC团队推出音频生成模型AudioStory；OpenAI发布实时语音模型GPT-realtime；Meta与UCSD合作推出DeepConf技术；xAI代码库遭窃事件；阿里巴巴Qwen团队发布GUI自动化框架；微软推出Copilot Labs实验中心；小红书自动化工具xiaohongshu-mcp上线。

?AI ?語音大模型 ?Step-Audio2mini
字节跳动发布 Seedream 4.0 图像创作模型，豆包App可免费体验

字节跳动Seed团队推出豆包图像创作模型Seedream4.0，支持文生图、圖像編輯及多图参考等功能，在专业评测中达到业界领先水平。该模型已上线豆包App、即梦AI等平台供用户免费体验，并通过火山引擎开放给企业客户。Seedream4.0具备多模态创意能力，可生成4K分辨率商用图像，适用于教育、電商、廣告设计等场景。团队表示将持续探索实时交互生成体验，深稛嶷合多模态推理与世界知识。

?豆包圖像創作模型 ?Seedream4.0 ?文生圖
薦AI日报：腾讯開源3D世界模型HunyuanWorld-Voyager；即梦AI系列模型开放API；通义推智能体开发框架AgentScope 1.0

本文介绍了AI日报栏目，聚焦人工智能领域最新动态。主要内容包括：腾讯開源具备3D重建能力的HunyuanWorld-Voyager模型、通义实验室推出的多智能体开发框架AgentScope 1.0、即梦AI开放图像与视频生成API、腾讯翻译模型Hunyuan-MT-7B在WMT2025斩获佳绩、苹果推出图像生成技术STARFlow和视觉语言模型FastVLM、新模型CoMPaSS-FLUX.1提升空间理解能力、Cherry Studio免费提供Qwen38B模型、谷歌Gemini API新增网页内容解析功能，以及腾讯优图開源智能体框架Youtu-Agent。这些进展展现了AI技术在多个领域的创新与应用。

?AI ?3D重建 ?腾讯開源
薦Nano Banana更像是AI图像领域的DeepSeek

这是《窄播Weekly》的第66期，本期我们关注的商业动态是:Google最新的AI图像生成模型Nano Banana，可能会给AI图像领域带来一场应用大爆炸。去年这个时候，我想把照片中人物手里拿的玩具火车换成玩具飞机，还需要给玩具火车做出精细标记，找到干净的玩具飞机图片，告诉AI将其替换成另一张图里的飞机。我花费一个小时，多番尝试下来，飞机会变形，人物的手会消失，最后的?

?AI圖像生成 ?Nano ?Banana
薦AI日报：MiniMax Music 1.5上线；腾讯会议上线AI托管；蚂蚁外滩大会发布AI眼镜可信连接技术框架gPass

本文介绍了AI领域的最新动态：MiniMax推出Music 1.5模型，支持4分钟高质量音乐生成；腾讯会议AI托管功能提供会议分身服务；蚂蚁集团发布AI眼镜连接框架gPass；Anthropic为Claude新增自动记忆聊天功能；苹果AI功能在欧盟受限；AI首次担任职业球队教练获胜；谷歌推出离线AI应用Edge Gallery；企业应用AI成熟度模型发布；Claude新增网页与PDF抓取功能；FTC启动对AI聊天机器人安全性的调查。

?AI音樂 ?MiniMax ?音樂生成
Claude 用不了？蓝耘 Coding Agent 提供原生替代方案，更轻量、高性价比的替代选择

Anthropic宣布停止向中国资本控股企业提供Claude服务，蓝耘Coding Agent凭借强代码能力、灵活适配性及高性价比成为可靠替代选择。支持多模型切换、低迁移成本，提供可视化控制台和本地化服务，助力开发者无缝衔接开发流程，确保工作连续性。

?文章搜索 ?核心標簽 ?Claude服務

今日大家都在搜的詞：

熱文

3 天
7天

1

上市没几天iPhone 17已跌破发售价部分机型降幅高达千元

站長商机

美女1级情感片下载二级1片欧美1级片 1级片网站 a1级片免费看1级片看1级片国产1级片三级1片三1级片

AI日報：阿裏開源Qwen-Image-Edit；淘寶“AI搜”功能灰度測試；小紅書發布DynamicFace人臉生成技術

薦AI日报：腾讯開源图像模型HunyuanImage2.1；?爱诗科技获6000万美元融资；?Freepik上线豆包Seedream4.0图像模型

薦AI日报：国产版Nano Banana？即梦图片4.0发布；阿里巴巴发布 Qwen3-Max-Preview；上海重磅发布AI廣告扶持政策

美团也開源了大模型，但我觉得他们的野心是通用生活Agent。

薦AI日报：字节视频模型Waver 1.0发布；百度AI搜索APP“梯子AI”发布；谷歌推全新Gemini 2.5 Flash圖像編輯模型

薦AI日报：AI内容新规正式生效；美团推出開源大模型LongCat；阶跃发布语音大模型Step-Audio 2 mini

字节跳动发布 Seedream 4.0 图像创作模型，豆包App可免费体验

薦AI日报：腾讯開源3D世界模型HunyuanWorld-Voyager；即梦AI系列模型开放API；通义推智能体开发框架AgentScope 1.0

薦Nano Banana更像是AI图像领域的DeepSeek

薦AI日报：MiniMax Music 1.5上线；腾讯会议上线AI托管；蚂蚁外滩大会发布AI眼镜可信连接技术框架gPass

Claude 用不了？蓝耘 Coding Agent 提供原生替代方案，更轻量、高性价比的替代选择

今日大家都在搜的詞：

熱文

上市没几天iPhone 17已跌破发售价部分机型降幅高达千元

库克称最爱橙色新iPhone：17 Pro是迄今最先进iPhone

华为MatePad mini今日首销：3299元起

苹果推出手机斜挎挂绳售价479元：10种配色可选

罗永浩悬赏10万征集西贝预制菜线索还送iPhone17

iPhone首現2TB內存！iPhone17系列價格公布

苹果iPhone 17系列京东预约人数超400万：标准版最受欢迎

天猫首发iPhone 17：支持24期免息淘宝闪购最快30分钟到手

AI日報：快手推出AI視頻制作助手Kwali；字節跳動推出USO模型；

影视飓风连续4年给员工换新iPhone 全员可得iPhone 17 Pro Max

AI日报：腾讯開源图像模型HunyuanImage2.1；?爱诗科技获6000万

站長商机