歡迎來到【AI日報】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的熱點内容,聚焦开发者,助你洞悉技术趋势、了解创新AI産品應用。
新鲜AI産品點擊了解:https://top.aibase.com/
1、快手可靈 2.1 推出全新首尾帧功能
快手可靈2.1模型推出了全新的首尾帧功能,显著提升了視頻生成的效果和流暢度,同時優化了轉場效果和文本響應能力。該模型在動態表現、語義理解和生成效率方面都有明顯提升,適用于多種專業視頻創作場景。
【AiBase提要:】
? 可灵2.1新增首尾帧功能,提升视频开头和结尾的精细控制。
? 支持自定义首尾帧图像,解决转场生硬问题,适合专业视频创作。
? 生成速度和成本下降,提高创作者使用效率。
2、昆仑万维上线AI音乐模型Mureka V7.5 并推出MoE-TTS语音模型
昆仑万维集团在2025年8月15日推出了Mureka V7.5模型,标志着其SkyWork AI技术发布周的圆满收官。该模型在中文歌曲创作方面表现出色,优化了人声表现的真实性与情感深度,并结合MoE-TTS语音合成框架,提升了语音合成的自然度和可控性。
【AiBase提要:】
? Mureka V7.5在中文歌曲创作中展现了卓越的能力,包括音色、演奏技法、咬字和情感表现的提升。
? MoE-TTS通过自然语言描述精准控制声音特征与风格,解决了复杂修辞生成语音偏离预期的问题。
? 昆仑万维展示了其在AI音乐创作和语音合成领域的强大实力,为相关领域研究和发展提供了新思路。
3、腾讯云推出AI开发工具CloudBase AI CLI 可减少80%编码量
腾讯云推出了CloudBase AI CLI,这是一款深度集成云开发平台的AI命令行工具,旨在为开发者提供更高效、便捷的开发体验。该工具通过统一的命令行入口,支持多种AI编程工具,显著提升开发效率,并覆盖从代码生成到部署应用的全流程。
【AiBase提要:】
? CloudBase AI CLI 提供统一的命令行入口,简化开发流程。
? 支持全平台通用性和多模型协作能力,满足不同开发场景需求。
? 提供免费体验额度,降低使用门槛,提升AI性价比。
详情链接:https://static.cloudbase.net/cli/install/install.sh -fsS | bash
4、海外新品MuleRun爆火!每人独享虚拟机,AI Agent自动玩游戏做建模
MuleRun作为一款创新的AI産品,通过独特的虚拟机机制和社区驱动的Agent生态,为用户带来了前所未有的智能化体验,展示了AI Agent在多个领域的广泛应用潜力。
【AiBase提要:】
? MuleRun的AI Agent能够自动完成游戏任务,极大提升了用户体验。
? MuleRun为用户提供了专属的虚拟机环境,支持运行多种软件和應用。
? 社区驱动的Agent生态让普通用户也能轻松使用自动化工具,降低了技术门槛。
詳情鏈接:https://discord.com/invite/kKAAEYay5F
5、Meta重磅開源DINOv3!無需人工標注的AI視覺神器,顛覆圖像識別新未來
Meta AI开源了新一代通用图像识别模型DINOv3,其基于自监督学习,无需人工标注即可实现卓越性能,被认为是AI视觉技术的新里程碑。DINOv3在高分辨率特征提取和多任务适应性方面表现出色,适用于环境监测、医疗、自动驾驶等多个领域,并通过开源降低了开发门槛。
【AiBase提要:】
? 自监督学习:无需人工标注,从海量未标注图像中自主提取特征。
?? 高分辨率特征提取:同时捕捉全局信息与局部细节,支持多种视觉任务。
? 广泛应用场景:适用于环境监测、医疗、自动驾驶等跨领域應用。
詳情鏈接:https://github.com/facebookresearch/dinov3
6、春晚明星再夺冠!宇树 H1夺机器人史首枚1500米金牌
宇树科技人形机器人 H1 在全球首个以人形机器人为核心的竞技赛事中夺得历史首枚1500米赛金牌,展现了其在速度与耐力方面的卓越性能。
【AiBase提要:】
??♂?宇树科技人形机器人 H1 在全球首个以人形机器人为核心的综合性竞技赛事中夺得历史首枚1500米赛金牌。
?本次賽事吸引了來自16個國家的280支隊伍、500余台人形機器人參賽,展示了行業頂尖水平。
?H1在軟件上針對跑步速度與耐力進行了優化升級,展現了極限速度與耐力的突破。
7、谷歌Gemini迎來重大更新!新增記憶功能和隱私聊天模式
谷歌为Gemini AI助手推出了两项新功能——记忆功能和临时聊天模式,标志着AI助手在个性化服务和隐私保护方面的重要进展。记忆功能能够持续学习用户信息,提供更精准的服务;而临时聊天模式则确保对话内容不被保存,保护用户隐私。
【AiBase提要:】
? 记忆功能可记录用户偏好和习惯,提升个性化服务体验。
? 临时聊天模式保障隐私,对话内容不会被保存或用于训练。
? 这两项功能体现了AI助手在个性化与隐私保护上的双重突破。
8、香港大學聯手開源項目OpenCUA,打造個性化電腦智能助手!
香港大学联合多家机构开源了 OpenCUA 框架,旨在帮助开发者构建个性化的计算机使用智能体(CUA),提升用户工作效率。该框架提供了丰富的数据支持和强大的工具,展现了其在智能助手开发领域的潜力。
【AiBase提要:】
? OpenCUA 框架提供了一套无缝的注释基础设施,用于捕捉人类在电脑上的操作演示。
? 集成了 AgentNet 数据集,覆盖了超过200个应用程序和网站,支持多操作系统。
? 支持可扩展的工作流程,将演示转换为“状态 - 动作”对,提升长链推理能力。
詳情鏈接:https://opencua.xlang.ai/
9、OpenAI或在ChatGPT引入廣告,高管稱“保持靈活性很重要”
OpenAI正在探索增加收入的方式,包括在ChatGPT中引入廣告。虽然高管Nick Turley表示廣告需要谨慎处理以避免影响用户体验,但公司仍考虑在其他产品中采用廣告模式。同时,订阅模式仍有巨大增长潜力。
【AiBase提要:】
? OpenAI考虑在ChatGPT中引入廣告,但需谨慎处理以确保用户体验。
? 高管认为订阅模式仍有巨大增长潜力,且存在大量未开发机会。
? OpenAI预计2024年订阅收入将达127亿美元,但要到2029年才能实现正向现金流。
10、谷歌发布超小型高效开源 AI 模型 Gemma 3 270M,可在智能手机上运行
谷歌 DeepMind 发布了 Gemma3270M 开源 AI 模型,拥有 2.7 亿参数,体积小巧且能效高,支持在智能手机、树莓派等轻量设备上离线运行。其在指令跟随任务中表现优异,并具备快速微调能力,适用于企业开发和创造性场景。
【AiBase提要:】
? Gemma3270M 是一款拥有 2.7 亿参数的开源 AI 模型,适合在智能手机上离线运行。
? 在指令跟随任务中表现出色,内部测试显示仅消耗 0.75% 的电池电量,能效高。
? 支持快速微调,适用于企业开发和创造性应用,满足多样化需求。
詳情鏈接:https://developers.googleblog.com/en/introducing-gemma-3-270m/
(舉報)