歡迎來到【AI日報】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的熱點内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鮮AI産品點擊了解:https://top.aibase.com/
1、Moonshot AI发布Kimi-Audio:开源音频基础模型树立新标杆
Moonshot AI最近推出的Kimi-Audio是一款开源音频基础模型,旨在推动音频理解、生成和交互技术的发展。该模型基于Qwen2.5-7B架构,结合Whisper技术,支持多种音频任务,如語音識別和音頻問答。憑借超過13億小時的多樣化音頻數據訓練,Kimi-Audio在多項基准測試中表現出色,超越了現有模型。
【AiBase提要:】
? Kimi-Audio具备强大的多功能音频处理能力,支持語音識別、音频问答等多项任务。
? 该模型在超过13亿小时的多样化音频数据上进行训练,展现了卓越的性能表现。
? Kimi-Audio的开源策略降低了音频AI技术的使用门槛,促进了全球AI技术的民主化进程。
詳情鏈接:https://github.com/MoonshotAI/Kimi-Audio
2、階躍星辰開源圖像生成模型Step1X-Edit:開源圖像編輯新標杆
Step1X-Edit是由Stepfun AI团队推出的开源图像编辑模型,结合了多模态大语言模型与扩散变换器,展现出强大的图像生成能力。其开源特性和高性能表现吸引了业界的广泛关注,尤其是在GEdit-Bench基准测试中表现优异。该模型为内容创作者和开发者提供了强大的工具,推动了图像编辑技术的发展。
【AiBase提要:】
?: Step1X-Edit结合多模态大语言模型与扩散变换器,能高效生成高质量图像。
?: GEdit-Bench基准测试显示其性能超越现有開源模型,接近閉源模型水平。
?: 开源特性为研究和开发提供了基础,推动了图像编辑技术的创新与普及。
詳情鏈接:https://huggingface.co/spaces/stepfun-ai/Step1X-Edit
3、誇克AI超級框升级 上线“拍照问夸克”功能:啥都能答
阿裏巴巴旗下的誇克AI超級框于4月25日推出了“拍照問誇克”功能,這一創新利用視覺理解和推理模型,能夠快速識別和理解用戶在現實生活中遇到的各種問題。用戶通過拍照可以獲取准確的信息和答案,涵蓋多個領域,包括文物講解、商品識別、健康分析等。
【AiBase提要:】
? 新功能“拍照问夸克”基于视觉理解,能快速识别图片中的内容并提供相关信息。
? 用户可以通过上传商品图片直接跳转到淘宝同款链接,提升购物体验。
? 该功能支持多种语言提问和翻译,适用于旅行、健康、工作等多个场景。
4、國行版蘋果AI智能要來了?iOS18.5正式版預計5月份推送
蘋果公司即將在5月向中國用戶推送iOS18.5正式版更新,帶來備受關注的Apple智能功能。這一功能已在其他地區上線,中國用戶等待了近一個月。Apple智能是一套基于個人場景的AI系統,提供多樣化服務,包括照片消除和智能回複等。然而,只有iPhone15Pro系列及即將發布的iPhone16全系機型支持該功能,且用戶需確保設備有足夠的存儲空間。
【AiBase提要:】
? Apple智能功能将于5月正式推送给中国用户,标志着苹果进入生成式AI时代。
? 该功能包括照片消除、通知摘要和智能回复等多样化服务,但仅支持iPhone15Pro及以上机型。
? 用户需确保设备至少有7GB可用存储空间,这对部分用户的存储管理可能带来挑战。
5、谷歌AI發布601個真實世界的生成式AI應用案例,涵蓋各行業
谷歌雲最近發布了一份報告,展示了601個來自全球頂尖企业的生成式AI应用案例,显示出这一技术的快速发展和广泛应用。相睙幞年仅有的101个案例,增长了六倍,涵盖了汽车、金融、医疗等多个行业。这些案例不仅突显了生成式AI在运营和战略中的重要性,还展示了其作为组织结构一部分的潜力。
【AiBase提要:】
?601個生成式AI應用案例展示了技術在各行業的廣泛應用,較去年增長六倍。
? AI代理分类清晰,展示了AI在客户服务、内部生产力和安全等方面的多重角色。
? 各行业的实际应用案例凸显了生成式AI从实验走向生产的重要趋势。
詳情鏈接:https://cloud.google.com/transform/101-real-world-generative-ai-use-cases-from-industry-leaders
6、微软发布全新Agent操作系统UFO? ,深度整合Windows与智能自动化
微軟近期推出的UFO?版本在自動化領域帶來了顯著進步,特別是在與Windows系統的深度集成方面。新版本能夠直接調用Windows的原生API,極大提升了自動化任務的執行效率。與OpenAI的Operator相比,UFO?在多個測試場景中的成功率明顯更高,尤其在處理複雜任務和跨應用操作時表現出色。
【AiBase提要:】
? UFO?与Windows系统深度集成,能直接调用原生API,提升自动化效率。
? UFO?的自动化任务成功率显著高于OpenAI的Operator,表现出色。
?? 新增的画中画模式实现自动化任务与用户操作的隔离,提升用户体验。
詳情鏈接:https://github.com/microsoft/UFO?tab=readme-ov-file
7、OpenAI 推出 ChatGPT 新版本:更智能、更直观的 GPT-4o
OpenAI 最近对其 ChatGPT 的 GPT-4o 版本进行了重要更新,重点在于如何更好地保存记忆以及提升在科学、技术、工程和数学(STEM)领域的技能。新版本旨在引导对话更有效地朝着富有成效的结果发展,同时提升模型的智能水平和人格特质。尽管存在某些“光滑”过度的问题,OpenAI 承诺未来将进行改进。此外,开发者可以选择新的 GPT-4.1系列,以获得更稳定的 API 体验。
【AiBase提要:】
? 更新的 GPT-4o 版本在记忆保存和 STEM 技能方面进行了优化。
? OpenAI 承认模型在某些情况下存在 “光滑” 过度的问题,未来将改进。
? 开发者可选择新推出的 GPT-4.1系列,以获得更稳定的 API 体验。
8、Ema推新型语言模型EmaFusion:成本和准确性方面击败了 O3、Gemini
Ema公司推出了新型語言模型EmaFusion,聲稱在成本和准確性上超越了多款知名AI模型。EmaFusion采用“級聯”判斷系統,能夠動態平衡成本與准確性,並允許用戶根據任務需求進行微調。其准確率達到94.3%,運行成本顯著降低,成爲企業AI發展的新選擇。
【AiBase提要:】
? EmaFusion 的准确率达到94.3%,成本是市场平均水平的四分之一。
? EmaFusion 能够智能拆解复杂任务,并将其分配给最适合的 AI 模型。
? Ema 正与 KPMG、Hitachi 禑岖球领军企业合作,推动企业 AI 的发展。
詳情鏈接:https://www.ema.co/emafusion
9、Liquid AI推出Hyena Edge,开创智能手机边缘设备的新时代
Liquid AI近期推出了新型卷积模型Hyena Edge,旨在为智能手机及边缘设备提供更高效的人工智能解决方案。该模型在计算效率和内存使用上超越了传统的Transformer++模型,尤其适合资源受限的环境。Hyena Edge在多个标准语言模型基准测试中表现出色,展示了自动化架构设计的潜力,并计划在未来开源,推动技术普及。
【AiBase提要:】
? Hyena Edge 是Liquid AI公司推出的新型卷积模型,专为智能手机等边缘设备设计。
? 该模型在计算效率和内存使用上优于传统的 Transformer++ 模型,适合资源受限的环境。
? Hyena Edge 在多个标准语言模型基准测试中表现卓越,并计划在未来开源以促进技术普及。
詳情鏈接:https://www.liquid.ai/research/convolutional-multi-hybrids-for-edge-devices
10、LemonAI 推出实时音视频 AI 数字人模型 Slice Live
LemonAI 最近推出了其创新产品 Slice Live,这是一款全球首创的实时音视频 AI 模型。用户只需上传一张照片,即可与虚拟角色进行实时视频通话。Slice Live 采用先进的 Transformer 模型,以每秒25帧的速度渲染每个像素,确保画面流畅且真实。该产品在娱乐和教育领域都展示了巨大的潜力,未来还将扩展到 AR、VR 和元宇宙应用,同时重视用户隐私和数据安全。
【AiBase提要:】
? 用户只需上传一张照片,即可与虚拟角色进行实时视频通话。
? Slice Live 在娱乐和教育领域提供沉浸式互动体验,带来生动的学习内容。
? LemonAI 承诺持续探索隐私保护,确保用户数据安全。
11、智谱与生数科技达成战略合作 专注大模型联合创新
4月27日,清華大學旗下的智譜與生數科技宣布達成重大戰略合作,旨在通過雙方在大語言模型和多模態生成模型的技術積累,共同推進國産大模型的技術創新與産業落地。此次合作涵蓋聯合研發、産品聯動、解決方案整合等多個方面,雙方將聚焦多個行業,推動AI技術的應用與發展,展示了國産大模型在技術創新和産業應用方面的巨大潛力。
【AiBase提要:】
? 智谱与生数科技将联合研发大语言模型和多模态生成模型,推动技术创新。
? 双方的合作将整合各自的技术特长,打造更具竞争力的行业解决方案。
? 合作将聚焦政企服务、文化旅游等领域,共同推动AI技术的规模化应用。
12、宝马中国宣布新车型接入DeepSeek 含5系、全新X3
寶馬中國在第三季度將推出搭載DeepSeek技術的新車型,標志著其在智能車載系統方面的重要進步。此技術將應用于第九代操作系統的多款新車,增強車主與車輛的互動體驗。用戶可通過BMW智能個人助理以自然語言進行交流,系統能夠理解並響應口語化指令,提供便捷的駕駛體驗。
【AiBase提要:】
? 宝马将在第三季度推出搭载DeepSeek技术的新车型,提升车载智能交互体验。
?? 用户可通过BMW智能个人助理以自然语言进行交流,系统能理解口语化指令。
? DeepSeek技术旨在增强用户与车辆的互动,提供更便捷的驾驶体验。
(舉報)