歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的熱點内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鮮AI産品點擊了解:https://top.aibase.com/
1、通義千問正式發布Qwen3-Embedding系列模型
我作爲一名AI助手,對通義千問團隊推出Qwen3-Embedding系列模型感到非常興奮。這款新模型不僅在多語言文本理解和檢索任務上表現出色,而且提供了靈活的配置選項和強大的多語言支持,展現了其在文本處理領域的領先地位。
【AiBase提要:】
? Qwen3-Embedding系列基于Qwen3基础模型,提供从0.6B到8B参数规模的三种配置,适用于不同场景下的性能与效率需求。
? 支持超过100种语言,具备强大的多语言、跨语言及代码检索能力,采用双塔和单塔结构设计。
? 在MTEB多语言榜单中得分70.58,性能超越众多商业API服务,展现卓越的文本表征和排序能力。
詳情鏈接:https://modelscope.cn/collections/Qwen3-Embedding-3edc3762d50f48
2、字節跳動發布圖像編輯模型SeedEdit3.0細節保持能力進一步提升
SeedEdit3.0是基于 Seedream3.0开发的图像编辑模型,通过多样化数据融合和专用奖励模型,大幅提升了主体保持、背景细节处理及指令遵循能力,尤其在人像编辑、背景更换和复杂光影处理方面表现卓越。
【AiBase提要:】
? 引入高效数据融合策略与专用奖励模型,显著提升图像编辑保持效果。
? 支持4K分辨率编辑,处理复杂场景如人像、光影变换时展现强大细节处理能力。
? 推理加速至10秒级,23类编辑任务评测领先,可用率提升至56.1%。
詳情鏈接:https://seed.bytedance.com/seededit
3、地表最強AI语音来了!Eleven v3Alpha版震撼发布,会说话还能‘演戏’
ElevenLabs推出的Eleven v3Alpha版以其卓越的情感表达、多語言支持和自然对话能力成为TTS领域的里程碑,重新定义了文本转语音技术。
【AiBase提要:】
? Eleven v3Alpha版引入音频标签,可精确控制情感、语速并添加音效,使语音更真实且富有表现力。
? 支持70多种语言,具备多角色对话能力,适用于影视配音、教育及客户服务等多场景。
? 技术升级后,文本理解与对话生成能力显著提升,自动标签功能简化创作流程,助力非专业人士轻松生成高质量语音内容。
4、Anthropic 发布专为国家安全定制的 AI 模型,获亚马逊和谷歌支持
Anthropic 推出 Claude Gov 模型套件,专为国家安全机构设计,增强涉密材料处理能力,获得亚马逊和谷歌战略支持,但面临 Reddit 的法律诉讼。
【AiBase提要:】
? Claude Gov 模型套件专为国家安全机构设计,提升涉密材料处理能力。
? 产品获亚马逊和谷歌支持,仅限最高安全許可機構使用。
?? Anthropic 面临 Reddit 提起的法律诉讼,指控其未经授权使用用户数据训练模型。
5、可靈AI月度付費金額連續兩個月超1億元,用戶規模破2200萬
可靈AI在推出10個月後年化收入運行率突破1億美元,P端付費訂閱會員貢獻主要收入,全球用戶規模突破2200萬。
【AiBase提要:】
? 可灵AI年化收入运行率突破1亿美元,仅10个月达成。
? P端付费订阅会员贡献近70%营业收入。
? 全球用户规模突破2200万,为企业客户提供API服务。
6、Meta发布Aria Gen2技术细节:四摄像头加持,续航8小时挑战苹果Vision Pro
Meta首次全面披露Aria Gen2研究眼镜的技术细节,相比初代产品,它在硬件设计、传感器技术和AI处理能力等方面实现了全面升级。
【AiBase提要:】
四攝像頭加持,全局快門傳感器解決運動失真問題,深度測量精度顯著提高。
新增接觸式麥克風,鼻托內置結構聲傳導技術,嘈雜環境下仍能清晰拾音。
AI處理能力大幅增強,支持六自由度位置追蹤、眼動追蹤及3D手部追蹤,爲未來AR交互奠定基礎。
7、愛詩科技PixVerse國內版“拍我AI”正式上線
愛詩科技旗下的PixVerse國內版“拍我AI”正式上線,支持網頁端和移動端,並提供API開放平台,大幅降低視頻制作成本與時間。
【AiBase提要:】
拍我AI通過AI特效和WoW發射器助力用戶輕松創作個性化視頻內容。
國內版支持V4.5版本,提供便捷的視頻生成解決方案,滿足多種需求。
拍我AI開放平台與多家頭部企業合作,爲企業用戶提供高效視頻生成工具。
詳情鏈接:https://pai.video
8、富国银行大胆预测:2030年 ChatGPT 廣告收入将达千亿美元
富國銀行分析師預測,到2030年ChatGPT將占據全球搜索廣告市場30%份額,年收入接近1000億美元,這將對谷歌的主導地位構成挑戰。
【AiBase提要:】
截至2030年,ChatGPT預計占據全球搜索廣告市場30%份額,年收入接近1000億美元。
目前,谷歌在搜索廣告領域占據超90%市場份額,但預計到2030年將降至約60%。
ChatGPT的商業化進程可能受到與手機制造商合作及反壟斷裁決的推動。
9、王自如感谢董明珠雷军 将以AI测评UP主身份二次创业
知名科技博主王自如宣布複更並更名爲‘王自如AI’,專注AI內容創業,助力傳統産業數字化轉型,同時分享了在格力的經曆及對董明珠和雷軍的感激。
【AiBase提要:】
?6月6日,王自如的B站賬號複更並更名爲‘王自如AI’,開啓AI測評UP主的二次創業。
? 他曾在格力重塑销售体系,得益于董明珠和雷军的鼓励,怀揣理想继续前行。
? 选择AI领域创业是因为看到其巨大潜力,认为能快速获得回报。
10、智源發布RoboOS2.0與RoboBrain2.0:首個支持MCP機制的機器人
在北京智源大會上,北京智源人工智能研究院發布了具身智能操作系統RoboOS2.0與大模型RoboBrain2.0,開源推動具身智能生態發展。
【AiBase提要:】
首個支持MCP機制的機器人操作系統RoboOS2.0,降低開發門檻並提升多機器人協作能力。
RoboBrain2.0任務規劃准確率提升74%,在空間推理與智能調度方面表現卓越。
已與多家企業合作,共同構建開放、協同的智能機器人生態體系。
11、谷歌重磅新作!Portraits讓你與虛擬專家對話,解鎖溝通與領導力秘籍
谷歌推出的Portraits是一款基于AI技術的創新産品,用戶能與虛擬專家實時互動學習溝通與領導力等技能,具有高度個性化和交互性的特點。
【AiBase提要:】
?沈浸式對話學習體驗,與虛擬專家互動掌握實用技能。
?AI驅動個性化學習,動態調整內容確保針對性。
?應用場景廣泛,從職場到教育,助力個人與職業發展。
12、OpenAudio 发布开源 TTS 模型 S1-Mini:0.5B 参数打造超自然 AI 语音
Fish Audio 推出基于 S1模型的轻量化版本 S1-Mini,参数仅0.5B,却具备高表现力和多語言支持,开源后大幅降低开发门槛,为教育、娱乐等领域带来创新可能。
【AiBase提要:】
? 轻量化设计:0.5B 参数,适配边缘设备,支持14种语言与50+情感表达。
? 开源赋能:免费下载,降低开发门槛,促进全球技术普及与创新。
? 性能卓越:媲美行业巨头,尤其在多语言和复杂对话场景表现突出。
詳情鏈接:https://huggingface.co/fishaudio/openaudio-s1-mini
13、AI驱动本地视频编辑工具Diffusion Studio Pro,号称“CapCut + Cursor”结合
AI驱动的视频编辑工具Diffusion Studio Pro正式亮相,以其强大的AI功能和本地化设计受到广泛关注。它结合了CapCut和Cursor的优势,提供多模态AI赋能的非线性编辑体验,同时支持免费使用,极大降低了创作门槛。
【AiBase提要:】
? 多模态AI赋能非线性编辑,内置智能代理侧边栏实现自动化工作流,显著提升创作效率。
? 本地优先设计保护隐私,免费无限层级模式吸引独立创作者和小型团队。
? 支持广泛应用场景,从短視頻到专业制作,提供从创意到上线的全链条支持。
14、智源研究院推出Emu3等‘悟界’系列大模型
在第七届‘北京智源大会’上,智源研究院发布了‘悟界’系列大模型,包括Emu3、见微 Brainμ、RoboOS2.0、RoboBrain2.0和OpenComplex2,涵盖多模态智能技术,推动人工智能应用落地。
【AiBase提要:】
? Emu3作为原生多模态世界模型,整合视觉、听觉和触觉数据,提升机器对世界的理解能力。
? 见微 Brainμ结合神经科学成果,为机器智能发展提供生物学支持。
? RoboOS2.0和RoboBrain2.0推动具身智能协作框架,加速机器人技术进步。
15. Luma Labs 发布 Modify Video:AI 视频后期一键改风格、换场景
Luma Labs 推出 Modify Video 工具,利用 AI 技术简化视频后期制作,实现风格重塑、场景替换等功能。
【AiBase 提要:】
? 风格重塑:通过文本改变视频艺术风格。
? 场景替换:将背景换为新的场景,增强视觉效果。
? 角色编辑:调整人物外观和表演,无需重新拍摄。
(舉報)