撰文/“中国视谷”融媒体中心 苏会会
當前,全球技術創新步入密集活躍期,國內“百模大戰”酣戰一年格局初顯,人工智能大模型整體呈現爆發式發展,逐漸成爲産業新型基礎設施,加速轉動商業化應用齒輪。
大勢之下,讓我們一起探尋全球大模型生態的發展步伐與湧現了哪些強悍的大模型,崛起了哪些新興應用?以杭州爲代表的國內城市又是如何搶灘大模型陣地,打造新質生産力加速發展的重要“引擎”?
一、溯源進階:科技巨頭引領全球創新潮流
大模型是全球科技競爭的新高地、未來産業的新賽道、經濟發展的新引擎。
追溯AI大模型的發展進程,2017年,Google提出基于自注意力機制的神經網絡結構——Transformer架構,奠定了大模型預訓練算法架構的基礎。次年,OpenAI和Google分別發布了GPT-1與BERT大模型,預訓練大模型成爲自然語言處理領域的主流。
图 大模型技术迭代历程 来源:《人工智能图景展望:跃迁点来临(2023)》报告
2022年,AIGC初步呈现爆发态势,最引发市场关注的是Stable Diffusion和ChatGPT。尤其是ChatGPT惊艳问世,在全球范围里掀起了一轮AIGC创新熱潮,开启“人机互生”新阶段。2023年3月15日成为AIGC时代来临的关键节点。OpenAI发布多模态预训练大模型GPT-4,由此引发了全球科技巨头“互掰手腕”、中国市场“百模大战”的连锁反应。随后,OpenAI又在今年打造了现象级“爆款”——视频生成大模型 Sora,60s一镜到底的电影级视频“硬控”了每一位见证者。
图 国内外大模型基座发展示意图 来源:《大模型关键技术与未来发展方向——从 ChatGPT 谈起》报告
從全球範圍看,世界各地積極推動大模型研發和應用,美國、中國是主要“玩家”,而英國、加拿大、新加坡等國家和地區尚處于前期嘗試階段,僅個別頭部企業開始應用。
現階段,國外大模型領域主要呈現三大發展模式,包括“龍頭大模型+原有業務”、“龍頭大模型+外部行業數據”、“開源大模型+自有行業數據搭建行業大模型”,較具代表性的有OpenAI模式、微軟模式、谷歌模式等,已在自然語言處理、計算機視覺、智能語音等領域取得了標志性技術突破,在模型精度、通用性和泛化能力等方面實現了跨越式發展。
二、大模型之爭:“千模大戰”與“四省爭霸”
大模型之争在国内产业界日趋“白熱化”,“百模大战”逐渐演变为“千模大战”。
相比國外大模型“龍頭效應”顯著,國內大模型的發展模式主要包括“自有通用大模型+外部行業數據”以及“自有或其他開源大模型+自有行業數據”。
而根据应用场景和目标人群的不同,可分为通用大模型和行业大模型两大类。我国具有代表性的通用大模型主要包含百度“文心一言”、阿里巴巴“通义千问”、科大讯飞“讯飞星火认知”等;行业大模型主要涵盖蜜度“文修”、容联云“赤兔”、用友“YonGPT”等。根据运行载体不同形成了端侧和云侧大模型,如端云结合的有vivo“蓝心”大模型,端侧主要以蔚来“NOMI GPT”大模型为代表。
截至目前,國內AI大模型市場尚未出現爆款級應用,面臨著算力限制和高質量訓練數據集匮乏兩大難題,有望倒逼算力基礎設施建設加強,以及數據在大規模、多模態、高質量三大維度上的全面提升,其紅利和貢獻還遠未被發掘。
图 基于大语言模型的多模态大模型通用结构 来源:《大模型关键技术与未来发展方向——从 ChatGPT 谈起》报告
大模型不仅在行业内“争奇斗艳”,也在城市之间“打”得火熱,托举中国大模型实力稳居全球首先梯队。
截至2024年3月28日,通過國家互聯網信息辦公室備案的大模型名單有117個,其中,北京51個,上海24個,廣東19個,浙江9個,大模型數量占全國總模型數量的88%。
图 浙江省生成式人工智能服务已备案信息 来源:杭州市“中国视谷”专项工作组
其中,浙江是大模型孕育的繁榮之地、大模型應用的領先之地。截至2024年4月29日,浙江已備案如阿裏巴巴“通義千問”、新華三“百業靈犀”、同花順“問財”等11項生成式人工智能服務。還有一大批垂直類大模型以及處于內測、未開放給公衆的大模型不斷壯大。
綜合來看,浙江省泛人工智能企業主要集中在環杭州灣地區,省內現有大模型也大多數誕生于杭州,來自“中國視谷”産業生態企業,成了杭州助力浙江加快培育新質生産力的強大引擎。
图:“中国视谷”精神堡垒 来源:杭州市“中国视谷”专项工作组
例如,“中國視谷”正前瞻布局一批大模型相關未來産業,培育發展超大模型類腦計算,將推進知識增強、跨模態統一建模、提示學習、持續學習等技術在超大模型中的創新應用,加快超大模型在機器視覺、多模態、人機交互等領域應用。同時,鼓勵龍頭企業、科研院所開展多模態通用大模型研發並向中小企業開放模型應用,圍繞模型開發搭建開源開放平台(社區),構建基于開源開放技術的軟件、硬件、數據、應用協同的産業生態。
三、城市案例:杭州打造“模型即服務”新模式
当前,杭州加速引领全省人工智能产业的特色化发展,推进“模型即服务”新模式,支持头部企业开展多模态通用大模型关键技术攻关、中小企业深耕垂直领域做精专用模型,鼓励相关技术和算法开源开放,推动“中国视谷”产业生态企业合力探索大模型的商業化應用进程,形成了“1+N+X”的协同创新、双向赋能产业生态。
图 MaaS模式下的AGI基础业态分析 来源:《人工智能图景展望:跃迁点来临(2023)》报告
例如阿裏巴巴“通義千問”已叠代2.5版本,落地應用速度不斷加快,賦能天文、PC、文旅、航空、礦業等多個領域。根據阿裏雲公布的比較新數據,目前通義大模型已經服務超9萬家企業,通義開源模型累計下載量突破700萬。
图 “通义千问”已迭代2.5版本 来源:阿里巴巴
新华三集团则一直积极推动智能算力的创新与发展,秉持“1+N”大模型策略,以国内首发的私域大模型百业灵犀(LinSeer)为基础,开放合作了N个业界优秀的通用大模型和行业细分大模型,为垂直行业和专属地域客户提供订制、独享、生长的智能化服务。为推动大模型、AIGC等应用与政企丰富场景的深稛嶷合,新华三业已率先推出了AIGC灵犀一体机。
图 灵犀大模型 来源:新华三
再看宇視科技的“梧桐”大模型。2023年,宇視領先AIoT行業率先推出了“梧桐”,並與多家行業龍頭聯合啓動“梧桐大模型種子合作夥伴計劃”,探索大模型在交通、教育、零售、體育公共服務等領域的端邊雲側的深入落地。經過一年的技術叠代和生態共建,宇視又推出了升級版AIoT行業大模型“梧桐2.0”,並發布“獵光2.0”AI-ISP圖像引擎感知終端等一系列大模型産品,打響了AIoT行業“裝備大模型化”的首先槍。
宇視科技創始人、總裁張鵬國認爲,“大模型技術是AIoT行業當下比較大的技術變量,必定會帶來新的市場機會點。一個大的機會點就是大量在網産品的更新叠代。借助于行業大模型技術,邊、端産品有望用更低的成本,在某些細分場景下實現更好的應用效果。”
此外,還有海康“觀瀾”,大華“星漢”、安恒信息“恒腦·安全垂域大模型”、恒生電子“Light-GPT”、實在智能“塔斯”,以及致力于大模型與智能體技術普惠落地的聯彙科技,近期全新發布了第二代思考大模型OmChatV2,推出了第二代多模態智能體OmAgent,並完成了與多款國産GPU的適配與性能驗證。
由此可見,杭州的大模型生態呈現“百花齊放”的態勢,充分發揮了鏈主作用,並部署集聚更多國內軟硬件設備廠商、核心元器件廠商、解決方案應用商協同發展,共同做強做優做大智能物聯産業集群。
聚焦大模型的“扼喉之處”的算力層面,根據《關于加快推進人工智能産業創新發展的實施意見》《關于高標准建設“中國視谷”高質量發展視覺智能産業的實施意見》等系列政策顯示,杭州一要建設算力中心,創建國家公共算力開放平台,打造算力高地和模型輸出高地;二要推進算力供給市政化,全市每年設立總額不超過5000萬元的“算力券”,重點支持中小企業購買算力服務。
預計到2025年,杭州將基本形成“高算力+強算法+大數據”的産業生態,打造成爲全國算力成本窪地、模型輸出源地、數據共享高地,人工智能創新應用水平全國領先、國際先進。
搶灘未來,杭州這座數字之城加快實施“人工智能+”行動推進數字經濟二次攀登、五大産業生態圈提能增效,推動以大模型爲代表的新技術加速規模化、體系化發展,在“中國視谷”的建設進展中不斷孕育發展新質生産力的關鍵變量。有朝一日,算力或許如水電一般即取即用,AIGC步入新一輪爆發期,人工智能全面賦能新型工業化,推動人類社會快速邁入高度智能化時代。
(推廣)