網站賺不到錢？立刻加入參與變現
字體超市--好字體用得起，買得起！
共建未成年人“清朗”網絡空間承諾書

百度智能雲Qianfan-VL系列模型開源！全尺寸領域增果優異，全自研芯片計算

2025-09-23 09:21 · 稿源：站長之家用户

今天，百度智能雲千帆正式推出全新視覺理解模型——Qianfan-VL，並全面開源!該系列模型包含3B、8B和70B三個尺寸版本，是面向企業級多模態應用场景，进行了深度优化的视觉理解大模型。即日起至10月10日，用户可在百度智能雲千帆平台免费体验8B、70B模型。Qianfan-VL不仅具备出色的基础通用能力，还针对产业落地中的高频需求，如OCR和教育垂直场景做了专项强化，使其在实际应用中表现更加卓越。

Qianfan-VL系列模型是由百度智能雲千帆模型研发团队，基于开源模型进行开发，并在百度自研昆仑芯 P800上完成全流程计算任务。昆仑芯P800提供了强大的算力支撑，确保模型能够高效处理海量数据与复杂算法，同时支持单任务5000卡规模的并行计算。这一结合不仅优化了模型计算的效率，更使得模型在性能表现上达到了新的高度，在通用和垂类任务评测中展现出SOTA水平。Qianfan-VL模型具備三大特點:

多尺寸模型滿足不同場景需求:提供3B、8B、70B三種規格的模型，讓不同規模的企業和開發者都能找到合適的解決方案。

提供思考推理能力:8B和70B模型支持通過特殊token激活思維鏈能力，覆蓋複雜圖表理解、視覺推理、數學解題等多種場景。

OCR與文檔理解能力增強:主打OCR全場景識別和複雜版面文檔理解兩大特色能力，在多項基准測試中表現優異，爲企業級應用提供高精度的視覺理解解決方案。

1、模型性能與效果

（1）通用能力基准測試表現

在通用能力基准测试中，Qianfan-VL 系列模型（3B、8B、70B）展现出显著核心优势。从视觉理解到专业领域问答，模型性能随参数规模增大提升显著，体现出很好的Scaling趋势。在 ScienceQA 等专业问答测试中，精准度表现突出;多模态任务如 RefCOCO 等，物体识别与关联能力优异;同时，在各类通用基准测试里，相较主流模型，整体表现也颇为亮眼，充分彰显出在视觉理解通用能力上的出色实力，为不同场景下的智能应用提供了有力支撑。

（2）OCR與文檔理解基准測試表現

Qianfan-VL系列模型（3B、8B、70B）在 OCR 与文档理解领域尽显卓越实力。一方面，具备OCR全场景识别能力，能精准识别手写体、数学公式、自然场景文字，还可对卡证票据信息进行结构化提取;另一方面，复杂版面文档理解能力突出，可自动分析版面元素，精准解析表格、图表，实现文档智能问答与结构化解析。从基准测试表现看，在 OCRBench、各类专业测试中，相较于主流模型，成绩优异且随参数规模提升持续向好，为企业级应用提供了高精度的视觉理解解决方案，有力推动文档智能处理场景的高效落地。

（3）數學解題基准測試表現

Qianfan-VL系列的8B和70B模型，在思考推理能力方面表現卓越。它們支持通過特殊token激活思維鏈能力，能覆蓋複雜圖表理解、視覺推理、數學解題等多類場景。這類任務需結合視覺信息與外部知識進行組合推理，而模型通過融合大量視覺類、文本類推理數據並用于後訓練，從benchmark表現來看，推理計算相關任務效果顯著提升。

在核心推理应用场景上，复杂图表理解与推理方面，可从复杂图表提取关键信息，进行数据分析、趋势预测、关联推理及统计计算;数学解题与视觉推理领域，能实现几何推理、公式识别、分步求解与逻辑推断。从數學解題基准測試表現看，在MathVista-mini、MathVision等多项测试中，相较于主流模型，成绩优异且随参数规模提升持续向好，为复杂推理场景下的应用提供了强力支持。

2、模型架構設計與技術特色

Qianfan-VL通過先進的多模態架構設計，憑借持續預訓練和三大技術創新，實現了領域增強的通用視覺-語言能力。

整體架構

能力增強訓練方案:創新的四階段訓練策略，在保持通用能力基礎上實現領域能力顯著提升

高精度數據合成管線:構建面向多模態任務的大規模數據合成管線，涵蓋文檔識別、數學解題、圖表理解、表格識別、公式識別、自然場景OCR等核心任務，通過精細化的管線設計和中間過程數據構造，實現高質量訓練數據的規模化生産。

昆侖芯驅動大模型高效計算:基于百度自研昆侖芯P800芯片，構建了業界領先的超大規模（5000卡）分布式計算系統，通過創新的並行策略和算子優化，顯著提升大模型任務的處理性能與運行效率。

3、模型應用案例

（1）OCR識別場景

（2）數學推理場景

（3）文檔理解場景

除上述場景應用案例外，Qianfan-VL同樣可應用在圖表分析、視頻理解等場景中，均呈現出卓越的模型效果。

Qianfan-VL系列模型的开源，对百度智能雲千帆来说，更像是“把模型放进真实生产力场景”的第一小步;未來，百度智能雲會秉持著對技術的執著追求與對應用場景的深度洞察，不斷推出全新的産業級模型，全方位助力AI技術在各行業落地。

（推廣）

特別聲明：以上内容(如有图片或视频亦包括在内)均为站長傳媒平台用户上传并发布，本平台仅提供信息存储服务，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任，相关信息仅供参考。站長之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站長之家提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明（點擊查看反饋聯系地址）。本網站在收到上述法律文件後，將會依法依規核實信息，溝通刪除相關內容或斷開相關鏈接。

相關推薦

關鍵詞：

薦AI日报：阿里推多模态模型Qwen3-Omni；谷歌推出AP2协议；百度推出Qianfan-VL 模型

本期AI日报聚焦多领域技术突破：阿里云推出全球首个全模态AI模型Qwen3-Omni，支持文本、图像、音频和视频统一处理；百度发布多尺寸視覺理解模型Qianfan-VL，优化企业级应用。苹果扩展Image Playground平台，引入ChatGPT等第三方模型。谷歌与PayPal合作推出AP2协议，推动AI支付安全创新。钉钉上线AI表格助手，支持自然语言生成表格。DeepSeek开源V3.1-Terminus模型，性能显著提升。Kimi推出Agent会员服务，智元机器人开源全球首个通用具身智能模型GO-1，降低技术门槛促进行业创新。

?AI模型 ?全模態 ?阿裏雲
直擊企業AI安全痛點，百度智能雲發布《千帆大模型平台安全白皮書》爲大模型落地護航

百度智能雲千帆大模型平台4.0发布《千帆大模型平台安全白皮书》，系统阐述企业级AI安全框架。白皮书聚焦平台安全、模型安全、数据安全、内容合规等六大维度，提出覆盖全生命周期的防护方案，包括混合云部署、数据加密传输、模型防窃取及内容过滤机制，助力企业安全使用大模型技术，推动AI在合规可信环境下赋能业务创新。

?大模型平台 ?企業級安全 ?數據安全
小度發布多模態智能攝像機，AI大模型重塑家庭看護體驗

小度科技推出首款多模態智能攝像機C800，搭載800萬像素4K超清攝像頭，支持AI大模型技術。該産品不僅能實現高清監控，還具備智能行爲識別、語音交互等功能，可自定義看護提醒。結合視覺與語音交互，支持複雜語義查詢和家庭設備聯動，擴展智能家居應用場景。目前産品已全網發售，年底還將推出三攝版本，持續探索AI硬件創新。

?AI大模型 ?智能硬件 ?小度科技
我国首个政务大模型安全国家标准发布百度深度参与制定

日前，我國首個針對政務大模型的安全國家標准《政務大模型應用安全規範》（下稱《規範》）正式發布。百度作爲核心參編單位，憑借其在人工智能安全及政務服務領域的深厚積累，深度參與了該標准的制定工作，爲政務大模型的安全選用、部署運行、護欄建設和合規落地提供了專業支持。《規範》由國家工業信息安全發展研究中心牽頭，聯合百度等國內領先企業共同制定?

?政務大模型 ?安全國家標准 ?百度參編
性能超越GPT-4o及Qwen2.5-VL，百度超轻量小模型PP-OCRv5 Blog持续登顶Hugging Face熱度第一

百度發布超輕量級文字識別模型PP-OCRv5，僅0.07B參數卻實現媲美700億參數大模型的OCR精度。在多項測試中超越GPT-4o等通用視覺大模型，尤其在文本定位和邊界框精度上表現優異。該模型支持5種文字類型識別，適用于教育、醫療、法律等多行業數字化需求，累計下載量超900萬，是GitHub上唯一Star數超5萬的中國OCR項目。

?PP-OCRv5 ?輕量級OCR ?文字識別模型
既能讀懂情緒，還能多模態交互！INDEMIND用空間智能重新定義陪伴機器人

TCL与INDEMIND合作推出的陪伴机器人“Ai Me”通过空间智能技术实现突破，从传统2D感知升级为3D语义感知，赋予机器人动态语义建图、实时环境适应及多模态交互能力。该平台借助立体视觉与多传感器融合，让机器人精准构建三维地图，识别家居属性，实现主动避障与个性化服务。同时，结合低算力混合模型与情感交互功能，机器人可感知用户情绪、提供安全防护，并支持宠物看护等场景拓展，从“工具”升级为有温度的“家庭伙伴”，真正满足复杂家庭需求。

?3D感知 ?多模態交互 ?陪伴機器人
薦如何正確理解Token經濟學？

去年5月，当大模型厂商卷起价格战时，Tokens大概率是出镜率最高的英文单词。简单来说，Tokens是大语言模型（LLM）用来切割自然语言文本的基本单位，可以直观的理解为“字”或“词”。就像工业时代用“千瓦时”度量电力消耗，互联网时代用“GB”度量数据流量，AI时代用“Token”来度量模型的工作量。一个Token可以理解为一个词或词片段（中文里可能是一个字或词语）。

?大模型 ?Tokens ?自然語言處理
重新理解「會員模式」

时至今日，「会员」在商业世界里已不是什么新鲜事。電商有会员、商超有会员、品牌有会员、视频网站有会员、社交媒体有会员……无论是阿里、京东，还是美团，各家平台对于会员的投入越来越明显和坚决。但不得不承认的是，就像“看电影时所有观众全都站了起来”的“剧院效应”，普通用户对于会员的价值感却在下降。当“加入会员”成为常态，会员好不好、值不?

?會員模式 ?商業結構 ?用戶粘性
模型即服務，應用即未來：阿裏雲助力中小企業AI應用規模化落地

阿裏雲針對中小企業AI落地“不會用、用不起、用不好”痛點，提出全鏈路解決方案。數據顯示，77%全球中小企業已定期使用AI工具，中國市場需求增長強勁。阿裏雲通過通義大模型技術叠代、AIStack一體化底座及4R服務框架，降低使用門檻與成本。典型案例如萬小智AI員工實現“分鍾級交付”，博登智能提升數據處理效率7倍。方案覆蓋制造、醫療等12大行業，助力企業從“有算力”到“能落地”，推動AI應用成爲行業常態。

?中小企業AI落地 ?AI解決方案 ?AI應用實踐
腾讯云智算三大核心升级推动AI Infra从“支撑”向“引擎”跨越

腾讯云在9月17日全球数字生态大会上宣布AI基础设施升级，聚焦智能体驱动云基础设施演进。发布多项成果，包括Agent+Infra解决方案、Cloud Mate云专家服务智能体，提升推理效率、安全性和自动化能力。预计未来两年企业部署智能体将翻倍，GenAI相关IaaS支出增速达192%。腾讯云通过“同源同构”技术优势，支持多环境部署，为交通、制造等行业提供全链路AI支撑，加速产业智能化转型。

?智能體 ?雲基礎設施 ?AI原生雲架構

今日大家都在搜的詞：

熱文

3 天
7天

站長商机

美女1级情感片下载二级1片欧美1级片 1级片网站 a1级片免费看1级片看1级片国产1级片三级1片三1级片

百度智能雲Qianfan-VL系列模型開源！全尺寸領域增果優異，全自研芯片計算

薦AI日报：阿里推多模态模型Qwen3-Omni；谷歌推出AP2协议；百度推出Qianfan-VL 模型

直擊企業AI安全痛點，百度智能雲發布《千帆大模型平台安全白皮書》爲大模型落地護航

小度發布多模態智能攝像機，AI大模型重塑家庭看護體驗

我国首个政务大模型安全国家标准发布百度深度参与制定

性能超越GPT-4o及Qwen2.5-VL，百度超轻量小模型PP-OCRv5 Blog持续登顶Hugging Face熱度第一

既能讀懂情緒，還能多模態交互！INDEMIND用空間智能重新定義陪伴機器人

薦如何正確理解Token經濟學？

重新理解「會員模式」

模型即服務，應用即未來：阿裏雲助力中小企業AI應用規模化落地

腾讯云智算三大核心升级推动AI Infra从“支撑”向“引擎”跨越

今日大家都在搜的詞：

熱文

小米17破今年国产手机首销纪录卢伟冰：需求远超预期

小米17系列开售5分钟破25年国产手机首销纪录

小米17/Pro/Pro Max今日首销：4499元起

5299元！小米17標准版新增16GB+1TB版本：10月5日發售

雷军：小米17 Pro Max很多门店已经缺货

AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Co

雷军晒第100次健身打卡提前3个月完成健身目标

iPhone调休闹钟上熱搜苹果客服回应：需手动设置

微信新功能上线：长按图片“搜一搜” 检索购物转表一键达

华为WATCH GT 6/Pro系列手表发布售价1488元起

小米17破今年国产手机首销纪录卢伟冰：需求远超预期

AI日報：接入MJ！誇克發布造點AI；Wan2.5-Preview發布；可靈推

AI日报：京东物流推出超脑大模型2.0；DeepSeek V3.1终结版发布

理想i6正式上市：首销直减1万限时售价23.98万元

AI日报：生数科技推出Vidu Q2；火山引擎推出炉米Lumi；通义千问

小米非常非常缺人上熱搜雷军谈小米成功秘诀

雷軍稱沒什麽好猶豫的：50歲正是闖的年紀

雷軍自曝壓力巨大：造車造芯把家底全押上了

站長商机