TinyR1-Preview – 奇虎360联合北大团队推出的推理模型
2025-03-13 16:01:05 小编:六六导航站
TinyR1-Preview是什么
TinyR1-Preview是北京大学计算机学院与360公司联合推出的32B参数量的推理模型。模型仅用5%的参数量,逼近Deepseek-R1-671B的性能,TinyR1-Preview在数学领域(AIME评测78.1分)逼近原版R1(79.8分),远超70B的Deepseek-R1-Distill-Llama(70.0分)。TinyR1-Preview基于“分治-融合”策略,分别训练数学、编程、科学三大垂直领域模型,借助Mergekit工具实现智能融合,突破性能上限。

TinyR1-Preview的主要功能
强大的数学推理能力:在复杂数学问题(如 AIME 2024)上表现出色,快速准确地解决高难度数学题目。高效的编程辅助:支持代码生成和调试,帮助开发者快速解决问题,提升编程效率。科学问题解答:支持处理复杂的科学问题,提供准确的答案和解释。轻量级部署:仅需 32B 参数量,相比大型模型,推理成本更低,适合资源受限的场景。TinyR1-Preview的技术原理
分治策略:基于 DeepSeek-R1 生成的海量领域数据,分别训练数学、编程、科学等垂直领域的子模型,每个子模型专注于特定领域的任务。智能融合:基于 Arcee 团队的 Mergekit 工具,将不同领域的子模型进行智能融合,突破单一模型的性能上限,实现多任务的均衡优化。蒸馏技术:基于模型蒸馏方法,将大型模型的知识迁移到较小的模型中,仅用 5% 的参数量达到原版 R1 模型 95% 以上的性能。优化训练:基于领域数据训练和智能融合,TinyR1-Preview 在推理效率和性能上显著提升,保持轻量级的特点,适合快速部署和应用。TinyR1-Preview的项目地址
HuggingFace模型库:https://huggingface.co/qihoo360/TinyR1-32B-PreviewTinyR1-Preview的应用场景
教育领域:辅助数学学习和编程教育,提供解题思路和代码生成。科研学术:帮助科研人员解答科学问题,设计实验和分析数据。软件开发:生成代码、优化算法,提升开发效率。企业应用:支持数据分析和流程优化,辅助企业决策。个人生活:作为智能助手,提供知识查询和学习支持。- 猜你喜欢
-
MusicTGA-HR提示指令
-
RappingAI提示指令
-
Boomy提示指令
-
TwoShot提示指令
-
Weet提示指令
-
Muzaic Studio提示指令
-
-
HookGen提示指令
-
DadaBots提示指令
- 相关AI应用
-
Playlistable提示指令
-
Riffusion提示指令
-
WZRD提示指令
-
-
Cyanite.ai提示指令
-
Piano Genie提示指令
-
Synthesizer V提示指令
-
Cosonify提示指令
-
Musico提示指令
- 推荐AI教程资讯
- TinyR1-Preview – 奇虎360联合北大团队推出的推理模型
- SurveyX – 人民大学联合悉尼大学等推出自动化生成学术综述的系统
- Flame – 开源的多模态前端代码生成模型
- OctoTools – 斯坦福推出解决复杂推理任务的开源智能体框架
- PhotoDoodle – 字节联合新加坡国立大学等推出的艺术化图像编辑框架
- video-subtitle-master – 开源AI字幕生成工具,支持批量为视频或音频生成字幕
- DualPipe – DeepSeek 开源的双向流水线并行技术
- EPLB – DeepSeek 开源的专家并行负载均衡器
- Profiling Data – DeepSeek开源训练和推理框架的性能分析数据
- Phi-4-Multimodal – 微软最新推出的多模态语言模型
- 精选推荐
-
Drumloop AI2025-02-14提示指令
-
ChatMindAI2025-01-27提示指令
-
Peppertype.ai2025-02-13法律助手
-
AI PaperPass写论文2025-01-28法律助手
-
Gladia2025-02-20提示指令
-
Embra2025-02-06提示指令