歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的熱點内容,聚焦開發者,助你洞悉技術趨勢、了解創新AI産品應用。
新鲜AI産品點擊了解:https://top.aibase.com/
1、阿裏開源WebAgent項目WebShaper,GAIA評測超過Claude4-Sonnet
阿裏雲通義實驗室開源了其自主搜索AI智能體項目WebAgent,其中WebSailor和WebShaper在多個評測中表現優異,展示了其在複雜任務中的強大能力。該項目不僅降低了使用門檻,還爲全球AI社區提供了工業級訓練框架和評估標准。
【AiBase提要:】
? WebAgent通过模拟人类搜索行为,实现高效处理复杂网络任务。
? WebSailor-72B模型在權威評測中超越多數閉源模型,展現卓越性能。
? WebShaper采用形式化驱动的数据合成方法,提升多步推理准确性。
詳情鏈接:https://github.com/Alibaba-NLP/WebAgent
2、Moonvalley發布Sketch-to-Video功能:手繪草圖秒變電影級視頻
Moonvalley推出的Sketch-to-Video功能通過手繪草圖和文本描述生成高質量視頻,爲影視制作、廣告創意及個人創作提供了便捷的工具。該功能依托Marey模型,具備精准控制和倫理保障,顯著降低了視頻制作成本與門檻。
【AiBase提要:】
? Sketch-to-Video允许用户通过手绘草图和文本生成电影级视频片段。
? Marey模型使用授权素材训练,确保版權安全并提升视频质量。
? 该功能大幅降低视频制作成本,赋能全球创作者并推动AI与影视行业的深稛嶷合。
3、騰訊AI新突破:X-Omni模型讓智能生成告別寫字困難症,圖文理解生成一步到位
騰訊研究團隊推出的X-Omni多模態AI模型在圖像生成和理解領域實現了重大突破,特別是在長文本渲染方面表現出色,解決了傳統AI模型在文字生成中的准確性問題。該模型通過強化學習框架和統一建模技術,顯著提升了輸出質量的穩定性和准確性。
【AiBase提要:】
? X-Omni采用强化学习框架优化模型性能,引入多维度奖励机制提升文字渲染准确率。
? 实现图像生成与理解功能的统一建模,无需不同模型架构和训练策略。
? 在多个基准测试中表现优异,尤其在长文本渲染和图像理解任务中超越主流模型。
詳情鏈接:https://arxiv.org/pdf/2507.22058
4、百度搜索首頁将变身AI应用中心?智能体入口灰度测试中
百度搜索正在测试在电脑端首頁开放智能体应用入口,用户未来可能直接在搜索框下方访问各类AI應用。该功能目前处于灰度测试阶段,预计不久将全面开放。
【AiBase提要:】
? 百度搜索计划在首頁开放智能体应用入口,提升用户搜索体验。
? 智能体主要来源于文心智能体平台、外部优质AI应用及百度自研應用。
? 目前该功能处于灰度测试阶段,尚未得到百度官方正式回应。
5、Midjourney 推出“为您推薦”功能:一键解锁个性化图片与视频体验
Midjourney 在探索页面新增了‘为您推薦’按钮,基于用户历史交互数据和偏好学习算法,提供个性化AI生成的图片和视频推薦。这一功能极大提升了用户的创作效率和个性化体验。
【AiBase提要:】
? 用户点击‘为您推薦’按钮即可获取符合自身风格的创意内容。
? 系统通过分析用户的历史操作(如点赞、moodboard上传)捕捉风格偏好。
? 推薦结果支持参数调整,优化输出效果。
6、GPT-5发布越来越近!GPT-5-Auto 与 GPT-5-Reasoning 现身 Mac 客户端
文章揭示了OpenAI可能正在測試GPT-5的兩個新模型,GPT-5-Auto和GPT-5-Reasoning,這些發現暗示其下一代AI模型已進入內部測試階段,預計2025年夏季正式發布。
【AiBase提要:】
? GPT-5-Reasoning专注于复杂任务的逻辑拆解与多步推理,表现出色。
? GPT-5-Auto具备高度自动化能力,可执行多步骤任务,减少用户干预。
? OpenAI计划在2025年夏季正式发布GPT-5,加速开发进程。
7、Ollama發布桌面客戶端!拖拽文檔、多模態識別,本地AI從此告別命令行
Ollama推出了桌面客戶端,爲用戶提供了更直觀的交互體驗。該客戶端支持多模態識別和文檔拖拽功能,同時保持了本地運行的優勢,提升了隱私保護和效率。
【AiBase提要:】
? 图形化界面简化操作,降低使用门槛。
?? 多模态识别支持图像与文本交互,提升应用多样性。
? 本地运行保障数据隐私,满足合规要求。
詳情鏈接:https://ollama.com/download
8、OWL團隊開源全新多智能體工具Eigent:革新複雜任務處理效率
OWL團隊推出了全新的多智能體協作工具Eigent,旨在通過多智能體協作提升複雜任務的處理效率。該工具繼承了CAMEL和OWL的成功經驗,並引入了高效的並行處理機制、靈活的定制能力以及Human-in-the-Loop機制,爲AI開源生態帶來了重大突破。
【AiBase提要:】
? **高效任务拆解与并行处理**:Eigent通过多层次并行机制显著提升任务处理效率。
?? **灵活定制与工具整合**:支持动态创建Workforce,整合多种数据源和工具,提高适用性。
? **Human-in-the-Loop机制**:允许用户在关键节点进行人工干预,确保任务精度和主观判断。
詳情鏈接:https://github.com/eigent-ai/eigent
9、OpenAI 今年收入激增至 120 亿美元 周活跃用户破 7 亿大关
OpenAI 在2023年取得了显著的商业成就,前七个月收入达到120亿美元,预计月收入将达到10亿美元。周活跃用户数突破7亿,显示出其产品的广泛市场认可。公司目标到2029年实现年收入1250亿美元。
【AiBase提要:】
? OpenAI 今年前七个月收入达120亿美元,月收入预计10亿美元。
? 周活跃用户突破7亿,ChatGPT 受到全球用户欢迎。
? OpenAI 目标到2029年年收入增至1250亿美元,展现雄心壮志。
10、英偉達H20算力芯片被約談:國信辦要求說明“追蹤定位”及“遠程關閉”風險
國家互聯網信息辦公室就英偉達H20算力芯片的安全風險,特別是‘追蹤定位’和‘遠程關閉’技術,對英偉達公司進行了約談。網信辦要求英偉達詳細說明其對華銷售的H20芯片的漏洞後門安全風險問題,並提交相關證明材料。
【AiBase提要:】
? 国家互联网信息办公室约谈英伟达,关注其H20芯片的‘追踪定位’和‘远程关闭’技术风险。
? 英伟达的算力芯片存在严重安全漏洞,且相关技术已成熟。
? 网信办依据《网络安全法》等法规,要求英伟达提供详细说明和证明材料。
11、萬興科技驚豔登榜!天幕2.0模型成國內第四,攜手華爲雲共建AI視頻實驗室
萬興科技憑借天幕2.0模型的出色表現,在AI視頻生成領域取得顯著進展,並與華爲雲展開深度合作,共同探索AI技術的應用潛力。
【AiBase提要:】
? 万兴天幕2.0模型在SuperCLUE榜单中位列国内第四,展现了其强大的技术实力。
? 与华为云共建AI视频大模型实验室,推动行业技术革新。
? 未来合作有望拓展至更多领域,提升用户数字创意体验。
(舉報)