Sky-T1 – NovaSky 开源的推理 AI 模型,可从零开始复现该模型
2025-03-31 14:23:33 小编:六六导航站
Sky-T1是什么
Sky-T1是加州大学伯克利分校Sky Computing实验室的研究团队NovaSky发布的开源推理AI模型,名为Sky-T1-32B-Preview。是首个开源推理模型,训练数据集和代码均已公开,用户可以从零开始复现该模型。模型的训练成本不到450美元。Sky-T1的训练数据由阿里巴巴的QwQ-32B-Preview推理模型生成,经过精心筛选和重构,基于OpenAI的GPT-4o-mini进行处理,更易于模型训练。在性能方面,Sky-T1在MATH500(一组“竞赛级”数学挑战)上的表现优于OpenAI早期版本o1的预览版本,同时在LiveCodeBench的编程评估中也表现更佳。

Sky-T1的主要特点
开源性:Sky-T1的训练数据集和代码均已公开,用户可以从零开始复现该模型。低成本训练:模型的训练成本不到450美元,显著低于以往同等性能模型的数百万美元训练成本。推理能力:Sky-T1能有效进行自我事实核查,避免一些常见陷阱,在得出解决方案时可能需要更长时间,从几秒到几分钟不等。其在物理、科学和数学等领域的可靠性更高。训练数据与硬件:Sky-T1的训练数据由阿里巴巴的QwQ-32B-Preview推理模型生成,经过精心筛选,基于OpenAI的GPT-4o-mini对数据进行重构,更易于处理。训练这款拥有320亿参数的模型仅耗时约19小时,使用了8台Nvidia H100 GPU。性能表现:在MATH500(一组“竞赛级”数学挑战)上的表现优于OpenAI的o1早期预览版本,还在一组来自LiveCodeBench(一种编码评估)的难题上击败了o1的预览版本。Sky-T1的项目地址
项目官网:https://novasky-ai.github.io/posts/sky-t1HuggingFace模型库:https://huggingface.co/NovaSky-AI/Sky-T1-32B-PreviewSky-T1的应用场景
数学问题解决:Sky-T1在MATH500(一组“竞赛级”数学挑战)上的表现优于OpenAI早期版本o1的预览版本,在解决复杂的数学问题时具有显著优势,适用于教育、科研和竞赛等领域。编程评估:在LiveCodeBench的编程评估中,Sky-T1也表现出色,能有效帮助开发者进行代码生成、优化和错误检测,适用于软件开发、编程教育和自动化测试等场景。科学研究:尽管在GPQA-Diamond测试中(包含物理学、生物学和化学领域的研究生水平问题)Sky-T1略逊于o1预览版,但在物理、科学和数学等领域的可靠性更高,适合用于科学研究和学术研究中的复杂问题解决。- 猜你喜欢
-
MusicTGA-HR提示指令
-
RappingAI提示指令
-
Boomy提示指令
-
TwoShot提示指令
-
Weet提示指令
-
Muzaic Studio提示指令
-
-
HookGen提示指令
-
DadaBots提示指令
- 相关AI应用
-
Playlistable提示指令
-
Riffusion提示指令
-
WZRD提示指令
-
-
Cyanite.ai提示指令
-
Piano Genie提示指令
-
Synthesizer V提示指令
-
Cosonify提示指令
-
Musico提示指令
- 推荐AI教程资讯
- Sky-T1 – NovaSky 开源的推理 AI 模型,可从零开始复现该模型
- 中国算力网络铺开,竟是运营商走在前列?
- FaceLift – Adobe 联合加州大学推出的单张图像到 3D 头部模型生成技术
- SVFR – 腾讯优图联合厦门大学推出的通用视频人脸修复统一框架
- TimesFM 2.0 – 谷歌研究团队开源的时间序列预测模型
- AI性能基准测试从此有了「中国标准」!英伟达、谷歌可以试试这套算力卷
- NeuralSVG – 文本驱动矢量图形生成技术,转化为有层次结构的矢量图形
- ViTPose – 基于 Transformer 架构的人体姿态估计模型
- 商汤首付56亿!上海建成亚洲最大AI“发电厂”,万亿参数大模型训练无压力
- Nemotron-CC – 英伟达推出的大型预训练数据集