站長之家(ChinaZ.com)10月23日 消息:中科院國家天文台的開源星語 StarWhisper 天文大模型在甲骨文 AI 研究院与 LanguageX AI Lab 联合发布的 CG-Eval 上获得了总排名第二的成绩。该模型在数学推理和天文能力方面接近或超过了 GPT3.5Turbo。
星語StarWhisper是一個基于天文大模型StarGLM開發的開源項目,旨在提升大模型在天文通用知識和多模態任務上的能力,爲未來可部署于望遠鏡陣列的科學具身智能——司天大腦打下基礎。
項目地址:https://github.com/Yu-Yang-Li/StarWhisper
星語StarWhisper系列模型包括6B,7B,13B,14B,20B等規模,通過數據集清洗、監督微調、DPO等方法,緩解了大模型在天文領域的幻覺現象,提升了數學推理、代碼能力等方面的表現。
星语StarWhisper可以通过AI-wisemodel平台下载模型权重后加载,也可以通过Wenda(闻达)实现多种天文相关的文本处理、知识库回答、AI绘画禑嵛务。项目源码遵从Apache-2.0license,部分模型权重使用需遵从相应许可。
星語StarWhisper是司天工程的備選方案之一,司天工程是我國面向時域天文學所提出的“十五五”天文重大基礎設施,一期計劃在國內多個優選觀測台址布置54台(18組)口徑1米級的大視場望遠鏡,組成多波段同時監測網絡。
核心功能:
整合天文知識,緩解幻覺現象
處理天文多模態任務,如圖像生成與識別
提升數學推理、代碼能力等
適配司天工程的觀測Agent需求
開源代碼和部分模型權重
(舉報)