中国科学院国家天文台开源天文大模型 StarWhisper:解决天文领域数学推理和幻觉现象的新工具

中科院国家天文台的开源星语StarWhisper天文大模型在甲骨文AI研究院与LanguageX AI Lab联合发布的CG-Eval上取得总排名第二的成绩,展示出其在数学推理和天文能力方面接近或超越了GPT3.5Turbo。

StarWhisper是由StarGLM开发的一个开源项目,旨在提升大模型在天文通用知识和多模态任务上的能力,为未来可部署于望远镜阵列的科学具身智能——司天大脑打下基础。该项目包含不同规模的模型,如6B、7B、13B、14B和20B,通过数据集清洗、监督微调、DPO等方法,成功缓解了大模型在天文领域的幻觉现象,并提升了数学推理和代码能力等方面的表现。中国科学院国家天文台开源天文大模型 StarWhisper:解决天文领域数学推理和幻觉现象的新工具

StarWhisper模型可以通过AI-wisemodel平台下载模型权重后加载,也可以通过Wenda(闻达)实现多种天文相关的文本处理、知识库回答、AI绘画等任务。项目源码遵从Apache-2.0 license,部分模型权重使用需遵从相应许可。

作为司天工程的备选方案之一,StarWhisper旨在整合天文知识,缓解幻觉现象,并能处理天文多模态任务,如图像生成与识别。此外,它还能提升数学推理和代码能力等,并适配司天工程的观测Agent需求。

总的来说,StarWhisper是一个功能强大的开源天文大模型,具有广泛的应用前景。其总排名第二的成绩和对天文能力的提升使其成为未来科学具身智能发展的重要工具。

暂无评论

暂无评论...