歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的熱點内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鮮AI産品點擊了解:https://top.aibase.com/
巨量引擎的AIGC工具“即創”正式上線,提供多種內容生成方式,包括AI脚本生成、智能成片和数字人等。该平台通过深度学习和自然语言处理,用户只需输入主題即可生成高质量文本和视频内容。新增的爆款裂变和一键过审功能,帮助创作者快速响应市场变化,提升创作效率和内容合规性。
【AiBase提要:】
? 即创支持多种內容生成,提升创作效率。
? 新增爆款裂变和一键过审功能,帮助创作者快速响应市场。
? AI 技术引领内容创作革命,鼓励创作者探索新工具。
詳情鏈接:https://top.aibase.com/tool/douyinjichuang
2、通义万相推2.1视频模型 大幅提升复杂运动能力
阿裏旗下的通義萬相視頻生成模型在最新2.1版本中實現了重磅升級,推出了極速版與專業版,分別聚焦于高效性能和卓越表現力。這一版本在處理複雜運動和還原真實物理規律方面取得了顯著進步,提升了視頻的電影質感和指令遵循能力。
【AiBase提要:】
? 新版本分为极速版与专业版,分别提升高效性能与表现力。
? 生成的视频细节丰富,成功解决了“鬼画符”问题,实现精准中英文文字生成。
? 运镜效果如同电影大师,能够自动调整镜头,提升视频艺术性。
詳情鏈接:https://tongyi.aliyun.com/wanxiang/videoCreation
3、微軟正式開源超強小模型Phi-4
微软在Hugging Face平台上发布了小型语言模型Phi-4,参数量为140亿,表现优异,超越了多款知名模型如GPT-4o和Llama-3.1。Phi-4在数学竞赛AMC中获得91.8分,并在MMLU测试中取得84.8分,展现了强大的推理能力。该模型采用创新的合成数据生成方法,支持长达16k的上下文长度,适用于消费级硬件。
【AiBase提要:】
? 微软推出的Phi-4模型参数仅140亿,却在性能测试中超越了GPT-4o和Llama-3.1等多个知名模型。
? Phi-4在数学与推理能力方面表现突出,特别是在AMC和MMLU测试中取得了高分。
? 该模型已开源并支持商业用途,吸引了大量开发者和AI爱好者的关注。
詳情鏈接:https://huggingface.co/microsoft/phi-4
4、全新视频修复技术 SeedVR:模糊变高清,可处理任意长度视频
在數字媒體迅速發展的背景下,視頻質量的提升成爲了重要議題。南洋理工大學與字節跳動的研究團隊推出的SeedVR技術,利用創新的移動窗口注意力機制,顯著改善了視頻恢複效果,特別是在處理AI生成視頻時表現突出。該技術不僅能夠處理任意長度的視頻,還能有效修複畫面細節,爲用戶帶來更真實的視覺體驗。
【AiBase提要:】
? SeedVR利用移动窗口注意力机制,成功提升对长视频序列的处理能力。
? 该技术采用较大的窗口尺寸,显著提高了高分辨率视频的恢复质量。
? 结合多种现代技术手段,SeedVR在多个基准测试中表现卓越,尤其适用于AI生成的视频。
詳情鏈接:https://iceclear.github.io/projects/seedvr/
5、Adobe 的 TransPixar 将烟雾、反射等透明效果无缝融入场景
Adobe Research与香港科技大学联合开发的TransPixar系统,革新了视觉特效制作,尤其是在處理透明元素方面。該技術通過生成包含Alpha通道的視覺效果,顯著提高了制作效率,降低了成本。TransPixar的推出正值行業對高質量特效需求激增之際,預示著未來影視制作流程的變革。
【AiBase提要:】
? TransPixar通过创新的AI技术,能够在有限的训练数据下生成高质量的透明效果,简化特效制作流程。
? 该系统不仅提升了大型制作团队的工作效率,还为小型工作室降低了制作成本,使其能够实现复杂特效。
? TransPixar在实时应用领域展现出巨大潜力,能够快速生成透明效果,适用于视频游戏和增强现实等场景。
6、字节联合高校出品!STAR 模型:提升视频清晰度和分辨率
南京大學研究團隊與字節跳動、西南大學聯合推出的STAR技術,通過文本到視頻模型實現視頻超分辨率處理,顯著提升低分辨率視頻質量。該技術結合時空增強方法,適用于視頻分享平台上下載的低清晰度視頻。研究團隊已在GitHub發布預訓練模型和推理代碼,使用過程簡單,推動了視頻處理領域的進步。
【AiBase提要:】
? 新技术 STAR 结合文本到视频模型,实现视频超分辨率,提升视频质量。
?? 研究团队已发布预训练模型和推理代码,使用过程简单明了。
? 提供联系方式,鼓励用户与研究团队进行交流与探讨。
詳情鏈接:https://github.com/NJU-PCALab/STAR
7、Stability AI 推出 SPAR3D:单图像生成3D 对象一秒钟搞定
在CES展会上,Stability AI推出了SPAR3D,这是一种创新的两阶段3D生成技术,能够在不到一秒的时间内从单个图像中生成精确的3D对象。SPAR3D不仅提供了高效的3D原型设计方式,还允许用户实时编辑生成的3D对象,提升了创作灵活性。
【AiBase提要:】
? 实时生成能力:SPAR3D能在一秒内从单张图像生成完整的3D对象,并支持快速编辑。
? 精确的结构预测:提供准确的几何形状和360度视图,包括隐藏区域,确保高分辨率输出。
? 开放的使用政策:支持商业和非商业用途,用户可通过多种方式获取和使用该模型。
詳情鏈接:https://stability.ai/news/stable-point-aware-3d
8、2024年238款生成式人工智能服務在國家網信辦完成備案
國家互聯網信息辦公室于1月8日發布公告,明確截止2024年12月31日,已有302款服務完成備案,其中238款爲2024年新增。這表明該領域快速發展,更多新服務獲得官方認可。公告還要求提供輿論屬性服務的企業進行備案,並提升已上線應用的透明度,確保合規性和安全性。
【AiBase提要:】
?2024年,共302款生成式人工智能服務在國家網信辦完成備案,新增238款。
? 提供舆论属性服务的企业可通过属地网信部门进行备案,确保合规性。
? 已上线应用需公示所使用的已备案服务信息,提升透明度。
9、2024胡潤中國人工智能企業50強榜單:科大訊飛第二、商湯科技第三
2024胡潤中國人工智能企業50強榜單正式發布,寒武紀以2380億人民幣估值位居榜首,展現出其在AI領域的強大實力。科大訊飛和商湯科技分別以1160億和500億的估值緊隨其後。榜單顯示,北京、上海和深圳是主要的AI企業集聚地,合計占據80%的上榜企業。
【AiBase提要:】
? 寒武纪以2380亿元估值位居榜首,科大讯飞和商汤科技分别排第二和第三。
?? 北京、上海、深圳成为人工智能企业的主要集聚地,合计占据80%的上榜企业。
? 该榜单侧重非具身智能企业,评选范围不包括机器人和智能家居等领域的公司。
10、你絕對想不到!重複這個簡單指令讓AI生成代碼快100倍
BuzzFeed的高級數據科學家麥克斯?伍爾夫進行了一項實驗,使用Claude3.5語言模型,通過反複請求AI改進代碼,成功將原本657毫秒的運行時間縮短至6毫秒,提升了100倍的性能。實驗中AI展現出其對“更好代碼”的獨特理解,自動添加企業特性。
【AiBase提要:】
? AI通过反复指令提升代码性能,原代码运行时间从657毫秒降至6毫秒。
? AI在代码中自动添加企业特性,展现出其对“更好代码”的独特理解。
?? 提示工程依然重要,精确的请求可以加速结果生成,但仍需人工开发者进行验证和修复。
11、英伟达发布Groot Teleop 技术 允许通过Apple Vision Pro来训练机器人
英伟达在CES展会上推出了一系列创新技术,旨在加速人形机器人的开发,尤其是在工业和制造领域。通过Isaac GR00T蓝图,开发者可以利用模仿学习生成大量合成运动数据,从而训练人形机器人。这一技术不仅降低了数据收集的时间和成本,还通过Cosmos平台生成物理意识视频,推动物理人工智能的发展。
【AiBase提要:】
? 英伟达推出Isaac GR00T蓝图,利用模仿学习生成合成运动数据,加速人形机器人开发。
? Cosmos平台经过18万亿数据训练,生成物理意识视频,促进物理人工智能发展。
? 多家机器人公司已采用Isaac GR00T技术,展现出良好的应用效果。
12、惊悚发明!工程师用 ChatGPT 制作机器人步枪,OpenAI 立刻出手
近期,工程師STS3D創造了一款機器人步槍,能夠通過ChatGPT指令進行瞄准和射擊,展現出令人驚歎的反應速度和准確性。這一發明引發了廣泛討論,尤其是關于將科幻技術變爲現實的擔憂。OpenAI迅速回應,指出該行爲違反了公司政策,禁止利用其服務開發武器。
【AiBase提要:】
? OpenAI迅速切断与开发机器人步枪工程师的关系,因其违反使用政策。
? STS3D的机器人步枪可以根据ChatGPT的指令进行瞄准和射击,展现出高准确性。
?? 尽管OpenAI去年修改了政策,但仍禁止使用其服务开发任何形式的武器。
13、因用户投诉,微软回滚Bing AI图像生成器升级、重返旧版DALL-E
微软近期因用户对Bing图像生成器新版本的不满,决定回滚至旧版DALL-E模型。用户反馈新版本在图像质量和细节处理上显著下降,导致微软搜索部门负责人Jordi Ribas承认并采取措施恢复旧版。
【AiBase提要:】
? 微软因用户投诉决定回滚 Bing 图像生成器的新版本,旨在改善用户体验。
? 升级后的图像生成效果不如预期,用户反映细节和质量明显下降。
? Jordi Ribas 表示将重返旧版 DALL-E 模型,预计需几周时间完成这一调整。
(舉報)