網站賺不到錢？立刻加入參與變現
字體超市--好字體用得起，買得起！
共建未成年人“清朗”網絡空間承諾書

AI日報：OpenAI重磅上線Sora；智譜AI免費多模態模型GLM-4V-Flash；騰訊雲打造AI代碼助手

2024-12-10 15:25 · 稿源：站長之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的熱點内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鮮AI産品點擊了解:https://top.aibase.com/

1、OpenAI正式上线Sora，ChatGPT Pro用户可无限生成、最长20秒

OpenAI 在 "ship-mas" 系列活动中发布了 Sora Turbo 视频生成 AI，支持生成20秒1080p 视频，用户可通过文本、图片或视频进行创作，具有多种风格和剪辑功能。该平台强调创意表达与内容安全，用户可浏览其他创作者的视频。

【AiBase 提要:】
? Sora Turbo 支持生成最高1080p 分辨率的20秒视频。
? 用户可以使用多种工具进行创意视频制作。
? 所有生成视频均附加水印和 C2PA 元数据确保安全。
詳情鏈接:https://sora.com/

2、智譜AI上線免費多模態模型GLM-4V-Flash:圖像處理精確度提升

北京智譜華章科技有限公司推出了其首個免費多模態API——GLM-4V-Flash，旨在提升圖像處理的精確度，降低開發者的使用門檻。該模型支持多種語言，並具備多項高級圖像處理功能，如圖像描述生成和視覺問答等，能夠爲特定行業提供精准解決方案。

【AiBase提要:】
? GLM-4V-Flash是首個免費多模態API，支持26種語言，降低開發門檻。
? 具备图像描述生成、分类、视觉推理等高級功能，適用于多個行業。
? 该模型已在社交媒体、教育、美容等领域展现出显著效益。
詳情鏈接:https://www.bigmodel.cn/console/trialcenter

3、騰訊雲AI代碼助手上線，基于混元大模型打造

腾讯云推出的AI代码助手旨在通过预测和提供代码建议来帮助程序员提升开发效率。该工具利用混元大模型，能够深入理解代码上下文，提供精准的代码补全建议，超越传统的關鍵詞匹配方式。它不仅能适应程序员的编码风格，还在多个关键场景中展现了强大的编码辅助能力，如生成正则表达式、快速生成前端页面以及清晰解读复杂代码。

微信截图_20241210085836.png

【AiBase提要:】
?? AI代码助手通过深入理解代码上下文，提供精准的代码补全建议，显著提升开发效率。
? 该助手能够学习程序员的编码风格，提供定制化的代码补全，贴合个人习惯。
? 通过混元大模型，AI代码助手在多个场景中展现强大能力，包括生成正则表达式和快速适配新接口规范。

4、可灵AI API V1.5模型新增标准std模式、V1.0模型新增运动笔刷

北京快手科技有限公司近日推出了可灵AI的API V1.5模型标准模式和V1.0模型的“运动笔刷”功能。这些更新旨在提升用户体验，增强艺术创作的灵活性与效率。V1.5模型以其卓越的效果和快速的处理速度为用户提供了高性价比的选择，而V1.0模型的新功能则允许用户为图片中的人物或物体指定运动轨迹，带来了更精准的运动控制和生动的表现。

【AiBase提要:】
? V1.5模型标准模式提供了出色的效果和快速的处理速度，提升用户体验。
?? V1.0模型新增的“运动笔刷”功能允许用户指定运动轨迹，实现精准控制。
? 新功能丰富了可灵AI的功能，为视觉艺术创作带来了创新的可能性。

5、书生·万象多模态大模型InternVL2.5开源性能媲美GPT-4o

上海 AI 实验室推出的书生·万象InternVL2.5模型在多模态理解基准上取得了超过70%的准确率，成为首個開源模型與商業模型如GPT-4o和Claude-3.5-Sonnet相媲美。該模型通過鏈式思考推理技術提升了性能，並在多個領域展現了強大的測試時間可擴展性及多學科推理能力。

【AiBase提要:】
? InternVL2.5模型在多模态理解基准上达到了超过70%的准确率，表现出色。
? 通过链式思考推理技术，该模型实现了3.7个百分点的性能提升，展现了强大的可扩展性。
? 开源特性使得研究人员和开发者能够自由访问和使用该模型，推动多模态AI技术的发展。
詳情鏈接:https://www.modelscope.cn/collections/InternVL-25-fbde6e47302942

6、Swift Ventures发布AI公司指数明確人工智能投資標准

Swift Ventures推出了一项新的人工智能公司指数，旨在帮助投资者识别真正进行AI技术投资的上市公司。该指数分析了数千份数据，发现尽管公司在财报中频繁提及AI，实际大规模投资的公司却寥寥无几。当前追踪的90家公司在AI研究和人才密度方面表现突出，年增长率远超市场平均水平。

【AiBase提要:】
? 该指数追踪约90家公司，依据AI研究投资、人才密度和AI收入进行评分。
? 投资AI研究的公司，其平均毛利润是未投资公司的两倍，显示出研究与盈利能力的正相关。
? 一些低调公司在AI领域表现出色，年增长率超过50%，表明AI转型已超越大技术公司。

7、量子計算驚天一躍!谷歌Willow芯片5分鍾搞定138億年計算，OpenAI都看傻了

谷歌的Willow量子芯片在量子計算領域取得了劃時代的突破，成功將計算任務從傳統計算機需要的10^25年縮短至僅5分鍾，展示了量子技術的巨大潛力。通過精細的工程設計，Willow在增加量子比特數量的同時，顯著降低了計算誤差，推動了量子計算的進步。

【AiBase提要:】
? Willow芯片在量子计算中实现了低于阈值的误差控制，错误率显著降低。
?? 计算速度惊人，10^25年的任务仅需5分钟，展现了量子计算的巨大潜力。
? Willow的进步引发了对加密安全的担忧，尤其是对比特币等加密货币的潜在威胁。

8、宅男福音!VR角色扮演AI來了，南洋理工“造人”新突破，唱跳互動還能陪你聊!

新加坡南洋理工大學的研究團隊推出了名爲SOLAMI的AI技術，能夠創造出活靈活現的3D虛擬角色，支持實時互動、語音理解和動作響應。該技術利用深度學習，將用戶的語音和動作轉化爲虛擬角色可理解的語言，提供自然流暢的互動體驗。SOLAMI還配備VR界面，用戶可通過VR設備與虛擬角色進行面對面交流。

【AiBase提要:】
? SOLAMI是一个端到端的社会视觉-语言-动作建模框架，实现用户与虚拟角色的自然互动。
? SynMSI合成数据集为训练提供了丰富的对话和动作数据，解决了数据缺乏的问题。
? SOLAMI的沉浸式VR界面让用户能够身临其境地与虚拟角色互动，提升了社交体验。
詳情鏈接:https://solami-ai.github.io/

9、X 正式表态，全新AI图像生成器Aurora将在本周内向所有用户推出

近日，社交网络 X（前身为推特）推出了新的图像生成器Aurora，经过数十亿个样本训练，具备高质量图像生成能力。虽然最初被撤下，但现已重新上线，计划在一周内向所有用户推广。Aurora能够精准渲染真实世界的视觉细节，尽管在测试中发现其生成的图像偶尔存在不自然的融合和细节缺失问题。

【AiBase提要:】
? Aurora是由xAI开发的新图像生成器，具备照片级渲染能力。
? 目前已在部分国家上线，预计一周内向所有用户推广。
? 测试发现Aurora生成的图像有时存在不自然的融合和人物细节缺失问题。
詳情鏈接:https://x.ai/blog/grok-image-generation-release

10、Reddit 推出 AI 问答功能，但用户却不买账!

Reddit最近推出了名为“Reddit Answers”的新功能，旨在通过AI驱动的问答提升用户搜索体验。然而，尽管该功能可以基于平台内的帖子和评论提供答案，用户的反馈却并不积极，许多人认为改善搜索功能的优先级更高。该功能目前仅在美国的有限用户中测试，且尚未在Android平台上推出。

【AiBase提要:】
? 新功能“Reddit Answers”开始在美国有限用户中测试，旨在提升搜索体验。
? 该功能利用Reddit平台内的帖子和评论，提供AI驱动的问答服务。
? 用户反响平平，许多人对搜索功能改善的优先级表示不满。

11、特斯拉陶琳:將堅持自動駕駛純視覺路線

特斯拉副總裁陶琳重申了公司在自動駕駛技術上堅持純視覺路線的決心。她強調，只有通過攝像頭和視覺神經網絡的結合，才能更好地模擬人類的駕駛習慣，從而實現更安全、更智能的完全自動駕駛。特斯拉的AI4芯片已在所有在售車型中配備，算力提升顯著，標志著公司在硬件上已爲完全自動駕駛做好准備。

【AiBase提要:】
? 特斯拉坚持通过纯视觉技术实现完全自动驾驶，认为这是最安全、最智能的方案。
? 自动驾驶技术采用端到端大模型，已实现从光子输入到决策输出的全过程。
? 所有在售车型均配备最新AI4芯片，算力提升5倍，爲實現完全自動駕駛奠定基礎。

12、惊人复苏!Stability AI新管理层六个月实现无债务、三位数业务增长

Stability AI在新任首席执行官普雷姆?阿卡拉朱的带领下，经过六个月的努力，成功实现了业务的三位数增长，并清除了所有债务。阿卡拉朱强调公司资产负债表的健康状态，并专注于API和许可服务的快速发展。新管理团队的形成吸引了曾经离开的投资者回归，标志着公司前景的向好。

【AiBase提要:】
? Stability AI新CEO普雷姆?阿卡拉朱表示，公司业务已实现三位数增长，且无债务。
? 新管理团队在六个月内完成复苏，吸引曾离开的投资者回归。
? 知名导演詹姆斯?卡梅隆已加入Stability AI董事会，显示行业信心回升。

13、智源开源无标注视频学习的3D 生成模型 See3D

北京智源人工智能研究院推出了 See3D 模型，能够利用无标注互联网视频进行3D 生成。该模型通过视觉条件技术，生成相机方向可控且何一致的多视角图像，避免传统相机标注的需求，具有良好的数据扩展性和适用性。See3D 已开源，支持多种3D 创作应用。

微信截图_20241210151417.png

【AiBase 提要:】
? See3D 利用大规模无标注视频进行3D 学习，降低数据采集成本。
? 模型支持从文本、单视图到3D 生成，功能多样。
? 开源模型和数据集促进3研究社区关注无相机标注数据。
項目地址:https://vision.baai.ac.cn/see3d

（舉報）

相關推薦

關鍵詞：

薦AI日報：B站測試AI視頻工具花生AI；騰訊發布多模態模型Large-Vision；昆仑万维开源Skywork UniPic 2.0

【AI日报】主要内容： 1. B站测试"花生AI"视频工具，3分钟可成片，同时推进自研大模型和多语言翻译功能 2. 昆仑万维开源多模态模型Skywork UniPic 2.0，实现高效统一的多模态生成能力 3. 马斯克指责苹果偏袒OpenAI，苹果回应称平台设计公平公正 4. 腾讯混元发布52B参数多模态理解模型Large-Vision，支持任意分辨率输入 5. DeepSeek官方否认8月发布R2模型的传闻 6. OpenAI推出超值ChatGPT Go套餐，仅399卢比降低使用门槛 7. AI新贵Perplexity豪掷345亿美元收购谷歌Chrome 8. Anthropic的Claude Sonnet 4模型支持100万token上下文 9. ChatGPT重大更新：恢复GPT-4o默认模式，为GPT-5引入多模式选择，优化交互体验

?AI視頻創作 ?花生AI ?B站AI工具
薦AI日報：智譜視覺推理模型GLM-4.5V開源；達摩院開源三項具身智能核心技術；360智腦推出Light-IF系列模型

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的熱點内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鮮AI産品點擊了解:https://top.aibase.com/1、智谱GLM-4.5V开源发布:全球100B级最佳视觉推理模型智谱宣布推出并开源了全球100B级效果最佳的开源视觉推理模型GLM-4.5V，这是该公司在通向通用人工智能（AGI）道路上的又一重要探
薦AI日报：GPT-5正式发布；百度将推文心5.0大模型；知网发布AIKBase V2.0多模态数据管理系统

《AI日报》精选AI领域最新动态：1)OpenAI发布GPT-5模型，具备强大多模态能力但推理任务仍有局限；2)知网推出AIKBase V2.0多模态数据管理系统；3)Ideogram新增"角色"功能实现图像风格统一；4)Cursor发布CLI版本支持终端AI编程；5)百度即将推出全新推理模型和文心5.0大模型；6)dots.ocr推出1.7B参数多语言文档解析工具；7)特斯拉解散Dojo超算团队转向英伟达合作；8)谷歌Pixel 10引入AI相?

?GPT
薦AI日报：阿里推全新图片模型Qwen-Image；小米全量开源MiDashengLM-7B；智谱Zread.ai搭载 GLM-4.5

本文汇总了AI领域最新动态：1)阿里开源文生图模型Qwen-Image，中文文本渲染领先；2)ChatGPT周活用户达7亿，OpenAI年收入120亿美元；3)Anthropic测试Claude Opus 4.1，推理能力升级；4)智谱推出开发工具Zread.ai提升代码理解效率；5)xAI发布Grok Imagine4支持文生视频及NSFW内容；6)Character.AI推出首個AI原生社交功能；7)阿里与南开合作视频压缩技术LLaVA-Scissor；8)北京团队突破人形机器人3D视觉系统?

?人工智能 ?文生圖模型 ?阿裏通義千問
薦AI日報：昆侖萬維發布SkyReels-A3模型；百度搜索PC端全面上線AI搜索；Grok 4 AI模型永久免费开放

AI日报栏目聚焦人工智能领域最新动态：1)昆仑万维发布SkyReels-A3模型，实现语音驱动数字人生成；2)xAI宣布Grok4模型永久免费开放；3)OpenAI发布GPT-5提示词指南；4)百度PC端上线AI搜索功能；5)微软Windows Co pilot接入GPT-5；6)百川智能开源医疗大模型Baichuan-M2性能超越GPT-oss120b；7)苹果iOS26将集成ChatGPT-5；8)谷歌推出3D视觉编辑框架BlenderFusion；9)轻量级TTS模型Kitten TTS参数仅1500万；10)MiniCPM-V

?AI技術 ?數字人創作 ?語音驅動
薦AI日報：智譜AI重磅發布GLM-4.5；阿裏開源Wan2.2；階躍星辰推全新模型Step3

【AI日報】本期重點內容：1.智譜AI發布開源大模型GLM-4.5，在推理、編碼和智能體能力方面達到SOTA水平；2.阿裏開源視頻生成模型Wan2.2，采用MoE架構提升計算效率；3.階躍星辰推出AI研究助手"階躍深研"，支持金融醫療等專業領域研究；4.微軟Edge浏覽器新增Copilot模式，提供智能搜索體驗；5.Anthropic對Claude用戶實施使用限制引發爭議；6.階躍星辰發布321B參數大模型Step3；7.螞?

?人工智能 ?開源模型 ?技術趨勢
AI大模型选型决策指南：10分钟数据对比 Gemini 2.5 Flash-Lite 与 DeepSeek R1

本文探討大模型選型困境與解決方案。2025年全球可調用大模型超300個，但選型面臨三大難題：單位混亂、定價波動快、87%團隊無法量化模型價值。提出三層漏鬥篩選法：1)場景剛需篩選80%選項；2)驗證核心性能；3)評估邊際效益。以Gemini和DeepSeek爲例，前者適合常規FAQ場景年省$16,000，後者適用于金融計算場景可降低15%人工複核。建議建立動態評估體系，將3小時選型會議壓縮至18分鍾，錯誤率下降40%。核心觀點：選型應從參數爭論轉向場景驗證，通過自動化工具爲工程師節省時間，聚焦提示詞優化而非參數對比。

?文章搜索 ?核心標簽 ?模型適配
薦AI日報：GPT-5-Auto現身Mac客戶端；阿裏開源WebAgent項目WebShaper；騰訊推X-Omni多模態模型

【AI日报】今日AI领域重要动态：1）阿里开源WebAgent项目WebShaper，GAIA评测超越Claude4-Sonnet；2）Moonvalley推出草图转视频功能，支持手绘生成电影级视频；3）腾讯X-Omni模型实现图文理解重大突破；4）百度搜索测试AI应用中心入口；5）Midjourney+新增个性化推薦功能；6）GPT-5或于2025年夏季发布；7）Ollama推出桌面客户端；8）OWL团队开源多智能体协作工具Eigent；9）OpenAI年收入激增至120亿美元；10）英伟达H20芯片因安全风险被约谈；11）万兴科技天幕2.0模型国内排名第四，与华为云共建AI视频实验室。

?人工智能 ?AI産品 ?技術趨勢
薦AI日報：騰訊混元開源Hunyuan-GameCraft；最強圖像編輯器nano-banana发布；字节开源Agent专用模型 M3-Agent-Control

本文介绍了AI领域最新动态：1)腾讯开源Hunyuan-GameCraft框架，可快速生成高质量游戏视频；2)Nano-Banana模型在图像编辑领域超越FLUX+Kontext；3)字节开源基于Qwen 3 32B的328亿参数M3-Agent-Control模型；4)Kimi将推出PPT生成功能；5)阿里1688将上线"诚信通AI版"会员服务；6)苹果智能家居中心推迟至2026年发布；7)万兴科技接入GPT-5；8)全球AI独角兽达498家，总估值2.7万亿美元；9)谷歌为Slides和

?AI ?遊戲視頻生成 ?騰訊混元
AI 大模型选型指导：一文实测 Kimi?K2?Turbo?Preview 与 Qwen3?Coder?Flash

本文对比分析了Kimi-K2-Turbo-Preview和Qwen3-Coder-Flash两款AI大模型在开发者选型中的表现。K2-Turbo采用MoE架构，激活参数32B，支持128K上下文，在代码调试和自动化流程方面表现突出；Qwen3-Coder为480B参数的MoE模型，原生支持256K上下文，擅长大规模代码库理解和API集成。二者在中级任务表现接近，但K2在复杂可视化任务更优，Qwen3在多轮Agent调用更稳定。建议根据需求选择：注重调试自动化选K2，需要长上下文支持选Qwen3。推薦使用AIbase模型广场进行高效选型对比。

?AI大模型選型 ?編碼能力對比 ?性能評測

今日大家都在搜的詞：

熱文

3 天
7天

站長商机

美女1级情感片下载二级1片欧美1级片 1级片网站 a1级片免费看1级片看1级片国产1级片三级1片三1级片

AI日報：OpenAI重磅上線Sora；智譜AI免費多模態模型GLM-4V-Flash；騰訊雲打造AI代碼助手

薦AI日報：B站測試AI視頻工具花生AI；騰訊發布多模態模型Large-Vision；昆仑万维开源Skywork UniPic 2.0

薦AI日報：智譜視覺推理模型GLM-4.5V開源；達摩院開源三項具身智能核心技術；360智腦推出Light-IF系列模型

薦AI日报：GPT-5正式发布；百度将推文心5.0大模型；知网发布AIKBase V2.0多模态数据管理系统

薦AI日报：阿里推全新图片模型Qwen-Image；小米全量开源MiDashengLM-7B；智谱Zread.ai搭载 GLM-4.5

薦AI日報：昆侖萬維發布SkyReels-A3模型；百度搜索PC端全面上線AI搜索；Grok 4 AI模型永久免费开放

薦AI日報：智譜AI重磅發布GLM-4.5；阿裏開源Wan2.2；階躍星辰推全新模型Step3

AI大模型选型决策指南：10分钟数据对比 Gemini 2.5 Flash-Lite 与 DeepSeek R1

薦AI日報：GPT-5-Auto現身Mac客戶端；阿裏開源WebAgent項目WebShaper；騰訊推X-Omni多模態模型

薦AI日報：騰訊混元開源Hunyuan-GameCraft；最強圖像編輯器nano-banana发布；字节开源Agent专用模型 M3-Agent-Control

AI 大模型选型指导：一文实测 Kimi?K2?Turbo?Preview 与 Qwen3?Coder?Flash

今日大家都在搜的詞：

熱文

全球首款女团机器人10580元拍出接入京东Joy Inside智能体

AI日報：騰訊混元開源Hunyuan-GameCraft；最強圖像編輯器nano-

阿裏小號宣布暫緩停服：可繼續正常使用

华为MatePad 11.5 S官宣8月15日发布

华为MatePad Air新款官宣8月15日发布

AI日報：B站測試AI視頻工具花生AI；騰訊發布多模態模型Large-V

婚禮時間有變！李國慶透露有新版實名制請柬：從未對外出售門票

華爲平板電腦教育優惠上線：至高便宜200元

曝iPhone18系列搭载全新A20芯片 iPhone 18 Fold明年发布

荣耀Magic V Flip2 定档 8 月 21 日外观配置亮点抢先看

iPhone17Pro最新外觀曝光：蘋果調整天線布局

AI日報：昆侖萬維發布SkyReels-A3模型；百度搜索PC端全面上線A

AI日報：智譜視覺推理模型GLM-4.5V開源；達摩院開源三項具身智

全球首款女团机器人10580元拍出接入京东Joy Inside智能体

REDMI Note 15 Pro系列官宣本月发布

京东养车50亿补贴更名震骨价号称补贴不「唬」

雷军发起小米YU7版本更名投票称小米YU7标准版绝非丐版

REDMI Turbo 5已备案：首发天玑8500处理器

周鸿祎与机器人PK球技：带球突破被机器人抢断

特斯拉Model 3长续航后轮驱动版上线：售价26.95万起 830公里续

站長商机