声明:本文来自于微信公众号 硅星人Pro,作者:黄小艺,授权站長之家转载发布。
今年的世界人工智能大會(WAIC),可能是史上最熱闹的一届。
不僅展館規模創下新高,超過800家企業帶來了3000多項展品,線下參觀人數也遠超去年。而如果你也在現場,穿梭在擁擠的人潮中,你會發現有一個展台前總是被圍得水泄不通,其中還夾雜著大量專程趕來的海外觀衆。
这个展台就是可灵 AI。
这一次,之所以会被这些专业目光团团围住,并非是可灵 AI 的又一次基础模型能力飞跃,而是一个新功能——靈動畫布的上線。
簡單來說,這是一個節點式的創作畫布,讓你能像搭積木一樣,將圖片生成、視頻生成、音頻創作等環節自由串聯,一口氣完成整體創作,爲創作者搭建起了一條專業流水線。
这个新功能精准地戳中了 AI 创作者的痛处:我们能轻易生成无数惊艳的5秒片段——飞龙、赛博都市、雨中回眸——但它们却很难串联成一个完整的故事。在过去很长一段时间,创作者都因此陷入 " 抽卡 " 和 " 缝合 " 的循环,被上下文缺失和一致性抽卡所困。
这其中,既有模型能力的瓶颈,更有工具链生态的断裂。而可灵 AI 的新功能 " 靈動畫布 ",正是为了解决后者。
更關鍵的是,這是由大模型廠商親自下場,爲創作者打造的一站式工作台。
這也意味著,最懂模型的人,終于開始爲我們打造順手的工具了。
它用起來到底怎麽樣?我們也第一時間上手實測了一番。
从 " 想法 " 到 " 成品 ",一个无缝的创作宇宙
当你的创作区不再是冰冷的菜单和窗口,而是一张可以无限缩放的画布。这,就是靈動畫布的第一個驚喜——它讓你所有的想法、素材、流程都一目了然,更接近我們大腦中創意迸發的非線性方式。
据官方介绍,画布的布局可以分为三个部分:中心的核心工作区为主体,你可以在此完成所有节点的创建、编排与预览。左侧的 " 我的资产库 " 为你提供历史素材的拖拽复用,而右方的 " 当前创作历史 " 则能够快速定位和回溯每一次的生成结果,让整个创作流程清晰可控。
現在,就讓我們以一個具體的科幻短片爲例,完整地走一遍這條全新的創作路徑,看看它是如何將一個模糊的想法,打磨成一部作品雛形的。
我們的目標是:制作一个宇航员在异星沙漠行走的科幻短視頻。
首先,是把这个想法 " 画 " 出来。我們不再需要打開文檔寫劇本和分鏡,而是可以直接在畫布中央的全局對話框裏,用大白話輸入這個核心創意。
接着,AI 就会主动帮你 " 翻译 " 和 " 优化 "Prompt。
例如,我们只说了 " 宇航员 ",它便在生成节点的 Prompt 里自动补全为:" 一位宇航员身穿白色太空服,头盔反射着遥远星系的微光,正独自一人行走在外星球的广袤沙漠中。脚下的沙丘呈现出奇异的橙红色,背景是高耸的、形状怪异的山脉,天空中悬挂着两个大小不一的月亮,营造出一种孤独而神秘的宇宙氛围。"
文本輸入確定後,接下來,我們可以選擇模型型號爲最新的可圖2.1版本,並將參數改成一次性生成4張高清圖,確認生成。每個步驟也會有清晰的消耗明細,方便創作者控制成本。
在这个环节,节点式的设计,让用户基本可以告别 " 覆盖式开盲盒 " 的痛苦了。
举个例子,如果上图中的这四张生成结果,你都不满意,可以直接修改 prompt,进行新一轮的生成,例如,我们想看看漫画风格或是多巴胺童话色彩风,重新生成后的新结果会出现在一个单独的分支,整整齐齐地排列着,而不是覆盖旧版,相比此前,大大方便了用户进行比对、挑选。
在这里,我们可以打开大图预览。当我们选中了第三次生成结果的第二张图后,鼠标悬置在图片上,就可以点击进行图生图、图生视频任务了,AI 自动搭建好节点,且每一个节点都可以通过手动拉取、替换连接线,进行自由调整。
確定好圖片,下一步,我們就可以繼續輸入自然語言,生成一個讓宇航員邊走邊跳的視頻了。
以下就是模型一次生成的效果,可以說是非常符合預期效果的了。
不过,和图片多轮生成一样,如果你想要修改动作,让 AI 再 " 保一条 ",也很简单。
例如换成宇航员边走边摇摆跳舞的搞笑类短視頻,你依然可以微调 prompt,然后再次生成。
在这个过程中, 我们可以像导演在监视器前一样,直观地对比两个 Take:A 版本的构图更好,B 版本的动作更流畅。我们最终选择了 B 版本,因为它更符合我们对动态的要求。
最後,當短片的雛形初具,我們意識到還需要音效來烘托氣氛。在傳統流程中,這意味著打包項目文件、上傳、發鏈接,等待音效師制作、再回傳……整個過程充滿了溝通和版本管理的混亂,在這裏我們只需要點擊視頻進入下一個配音環節,你就可以得到下面這個視頻了。
這就是節點式無限畫布帶來的連續性和全局感。
如果你還想這個短片繼續進行下去,只需要以其中一張作爲參考圖,繼續生成下一鏡的圖片,選中合適分鏡後,繼續生成視頻,循環這個操作,就讓節點不斷蔓延下去,讓劇情不斷進行下去。
對于複雜的故事短片創作而言,節點式創作依然是個大工程,于是,這塊畫布也爲協作而生的——你只需分享一個鏈接,就能邀請整個團隊加入。
協作模式下,不僅所有成員可以在同一個項目內同時進行創作,生成的結果共享,還可以看到其他人的光標位置,通過點擊右上角的成員頭像,可以快速定位到他的視圖位置。
這對團隊創作來說,意味著底層邏輯的徹底改變。过去,创作是一场线性的、充满等待和版本错乱的 " 接力赛 ";现在,它变成了一场围绕同一块画布的 " 实时共创 "。编剧、导演、视觉可以同时在线,创作不再是信息孤岛。
在清晰的可追溯的流程和自由可控的节点下, 从一个模糊的想法,到场景构建、镜头筛选、视觉衔接,再到团队协作,一部科幻短片的骨架,可以都在这个统一、直观的画布上一气呵成地搭建完成。
画布,而非对话:可灵选择了一条更 " 实在 " 的路
正如在 WAIC 的快手可灵生态论坛上,可灵 AI 视觉生成与互动中心负责人万鹏飞所说,可灵的技术迭代始终围绕两大主线:一是基础模型能力提升,二是与用户共创优化产品方向,形成 " 技术 + 用户 " 双轮驱动模式。
进入2025年,随着基础模型能力的提升,越来越多的人开始关注 AI 视频创作场景下难以工业化的痛点,越来越多的 Agent 也加入了 AI 视频创作的体验优化中。
但相比于 Agent,可灵 AI 选择了偏向于工作流搭建的画布式形态。
這是因爲,對于短片創作者而言,創作是一個多個環節的強時序的搭建過程。
通過上文的案例,我們可以看到在畫布形態下,整個創作過程——那些零散的素材、不同的版本、鏡頭的銜接關系——像樂高積木一樣攤開在你面前,讓你能看清、能觸摸、能隨時調整。
它從根本上承認了:真正的創作,是需要我們把手放在方向盤上的。
對專業創作者而言,這種節點式的畫布會讓人第一时间想到类似形态的 ComfyUI。
而对于不熟悉它的读者,可以将其理解为一套针对 Stable Diffusion 的、完全开源的图形用户界面。它在2023年初才真正进入大众视野,但凭借其極致的灵活性,在 GitHub 上迅速积累了超过8万颗星(Star),成为 AI 绘画领域一个现象级的存在。
过去两年,无数艺术家和创作者宁愿忍受它陡峭的学习曲线,就是因为它提供了最核心的东西:掌控力。它将 Stable Diffusion 的底层逻辑完全模块化、可视化,允许创作者像拼接电路一样,自由定义工作流的每一个细节——从加载模型、输入提示词,到控制采样器和各种插件。
但也正因如此,它極高的學習門檻也將無數普通用戶拒之門外。搭建一個理想的工作流,往往需要大量的時間和專業知識。
而可灵 AI 的靈動畫布,可以理解为,它把这种专业级的掌控力,用一种极其直观、友好的方式,交到了我们每一个人的手上。
當然,這一切能發生,也因爲一個重要的前提:AI 视频模型的基础能力达到了一定的水平,通过抽卡、图片参考,已经能够生产出具有一致性的下一帧了。
在模型的能力提升,正在不断补齐想象力的最后一块拼图的同时,靈動畫布则为创作者递上了一支真正能将想象力编织成故事的笔。
(舉報)