歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的熱點内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鮮AI産品點擊了解:https://top.aibase.com/
1、字節跳動EX-4D震撼開源:單目視頻秒變自由視角4D大片
EX-4D是字節跳動PICO-MR團隊推出的4D視頻生成框架,能夠從單目視頻生成高質量、多視角的4D視頻序列。該技術通過深度密閉網格(DW-Mesh)和輕量級適配架構,解決了傳統視頻生成技術在多視角生成中的挑戰,並在性能指標上全面領先。
【AiBase提要:】
? EX-4D利用深度密闭网格(DW-Mesh)实现单目视频到多视角的高质量生成。
? 通过渲染mask和跟踪mask策略,解决多视角数据稀缺问题。
? 在FID、FVD和VBench等指标上全面超越现有开源方法,性能表现卓越。
詳情鏈接:https://github.com/tau-yihouxiang/EX-4D
2、Bilibili开源动漫视频生成模型AniSora V3版,一键生成多种风格动漫视频镜头
Bilibili宣布其开源动漫视频生成模型AniSora V3迎来重大更新,显著提升了生成质量、动作流畅度和风格多样性。该版本基于CogVideoX-5B和Wan2.1-14B模型,结合强化学习与人类反馈(RLHF)框架,支持多种动漫风格的视频生成,为创作者提供了更强大的工具。
【AiBase提要:】
? AniSora V3通过时空掩码模块优化,增强了动画任务的控制能力。
? 支持多任务处理,包括单帧图像生成视频、关键帧插值和唇部同步等功能。
? 开源生态推动社区协作,开发者可通过GitHub获取代码和数据集。
詳情鏈接:https://t.co/I3HPKPvsBV
3、DeepSWE 开源 AI Agent系统强势登顶,基于 Qwen3-32B
DeepSWE 是一款基于 Qwen3-32B 模型的开源 AI Agent 系统,通过强化学习进行训练,并在 SWE-Bench-Verified 测试中取得了出色的性能表现。该系统采用 rLLM 框架和改进的 GRPO++ 算法,在软件工程任务中展现出强大的学习能力与应用潜力。
【AiBase提要:】
? DeepSWE 是基于 Qwen3-32B 模型,完全通过强化学习训练而成,开源信息已全面发布。
? 在 SWE-Bench-Verified 测试中,DeepSWE 表现出色,Pass@1准确率达到了59%,成为所有开源代理中的佼佼者。
? 采用了 rLLM 框架和改进的 GRPO++ 算法,DeepSWE 在实际软件工程任务中展现了其强大的学习能力和应用潜力。
詳情鏈接:https://huggingface.co/agentica-org/DeepSWE-Preview
4、字節跳動開源新模型VINCIE-3B:3億參數,支持上下文連續圖像編輯
字節跳動開源了支持上下文連續圖像編輯的VINCIE-3B模型,該模型基于MM-DiT架構開發,能夠從視頻中學習並實現高效的圖像編輯。其技術亮點包括視頻驅動訓練、塊因果擴散變換器以及三重代理任務訓練,顯著提升了圖像編輯的質量和效率。
【AiBase提要:】
? 视频驱动训练:VINCIE-3B利用视频的连续帧,自动提取文本描述与图像序列,构建多模态训练数据。
? 块因果扩散变换器:模型采用块因果注意力机制,在文本和图像块之间实现因果注意力,块内则为双向注意力。
? 三重代理任务训练:通过下一帧预测、当前帧分割预测和下一帧分割预测三种任务进行训练,增强模型对动态场景和物体关系的理解能力。
詳情鏈接:https://huggingface.co/ByteDance-Seed/VINCIE-3B
5、Stability AI开源Stable Audio Open Small,手机秒变音频创作神器
Stability AI与Arm合作推出Stable Audio Open Small,一款专为移动设备优化的轻量级文本到音频生成模型。该模型在移动端本地运行,支持离线处理,具备高效、低延迟和高质量输出的特点,推动了AI音频生成技术向边缘计算和移动设备的转型。
【AiBase提要:】
? 轻量化设计:参数量压缩至341M,适合移动端运行。
? 高质量音频生成:支持立体声音频生成,无需云端处理。
? 开源赋能开发者:遵循社区许可,降低技术门槛,鼓励创意应用。
詳情鏈接:https://huggingface.co/stabilityai/stable-audio-open-small
6、谷歌重磅发布Gemini for Education!免费AI工具席卷全球教育
谷歌推出全新AI工具套件Gemini for Education,基于最新一代Gemini2.5Pro模型和LearnLM學習型大模型,爲全球師生提供免費、強大且高效的學習與教學支持。該工具覆蓋30多種功能,支持40多種語言,旨在通過AI技術賦能教育工作者和學生,打造更加個性化和高效的學習體驗。
【AiBase提要:】
? 全球化教育赋能:支持40多种语言,覆盖230多个国家和地区。
? 免费开放:对所有Google Workspace for Education用户完全免费,推动教育公平。
? 安全与隐私:严格遵循隐私条款,确保用户数据安全。
7、Topview Avatar2震撼发布!AI数字人革新電商带货,模特时代终结?
Topview Avatar2通过突破性的功能和逼真的效果,为出海電商和内容创作者带来了革命性的体验。其创新的AI数字人技术能够实现产品与数字人的自然交互,极大提升了视频制作效率和内容质量。
【AiBase提要:】
? 全球首创AI数字人“穿戴”产品,实现更真实的交互效果。
?? 一键生成定制化视频,支持多语言口型同步,提升营销灵活性。
? 革新传统UGC视频模式,降低電商拍摄门槛,助力品牌全球化。
詳情鏈接:https://www.topview.ai/ai-product-avatar
8、Perplexity推出Max訂閱計劃:每月200美元解鎖無限AI生産力
Perplexity推出了高端訂閱計劃Max,定價爲每月200美元或每年2000美元,旨在滿足高頻用戶和專業人士的需求。該計劃提供無限量訪問Labs、優先體驗新功能以及最新前沿模型的支持,標志著其在AI生産力工具領域的進一步深耕。
【AiBase提要:】
? 无限Labs查询:满足专业用户对深度研究和复杂项目的需求。
? 优先访问前沿模型:确保用户始终站在技术前沿。
? 优先支持:提供专用基础设施和更快的客户响应时间。
9、Cursor 大胆挖人!Claude Code 核心人物转投竞争对手
Cursor 挖走 Anthropic 的两位核心人物,标志着 AI 编程市场竞争的加剧。尽管 Anthropic 面临人才流失,但其业务依然强劲,收入和估值显著增长。Anysphere 则借助这些人才进一步提升产品竞争力。
【AiBase提要:】
? Cursor 成功挖走 Anthropic 核心人物,技术实力增强
? Boris Cherny 和 Cat Wu 加入 Anysphere,推动产品创新
? Anthropic 业务增长迅速,收入和估值均大幅提升
10、OpenAI 声明:Robinh ood 推出的 “OpenAI 代 币” 与我们无关
R obinh ood 在欧洲推出了 OpenAI 和 SpaceX 的代 币化股票,但 OpenAI 明确表示这些代 币并非其股权,且与 Robinh ood 没有合作关系。尽管 Robinh ood 提供了限时优惠吸引用户,但美国用户无法参与。这一事件引发了市场的熱烈反响,Robinh ood 股价一度飙升。
【AiBase提要:】
? OpenAI 强调“OpenAI 代 币”不是其股权,与 Robinh ood 无合作。
?? Robinh ood 通过代 币化股票吸引投资者,但美国用户无法参与。
? Robinh ood 股价因该消息上涨,创下历史新高。
(舉報)