Qwen2 – 阿里云开源的新一代通义千问大模型
2025-02-28 10:21:57 小编:六六导航站
Qwen2是什么
Qwen2是由阿里云通义千问团队开源的新一代大语言模型,该系列涵盖了从0.5B到72B不等的五个规模模型,在中文和英文基础上增加了27种语言的高质量数据,大幅提升了模型的自然语言理解、代码编写、数学解题和多语言处理能力。Qwen2支持最长达128K tokens的上下文长度,优化了模型的泛化性和应用潜力。该系列模型在多个评测基准上表现优异,赶超Meta的Llama-3-70B,目前已在Hugging Face和ModelScope平台开源。

Qwen2的模型信息
模型名称参数量 (B)非Embedding参数量 (B)是否使用GQA是否Tie Embedding上下文长度 (tokens)Qwen2-0.5B0.490.35是是32KQwen2-1.5B1.541.31是是32KQwen2-7B7.075.98是否128KQwen2-57B-A14B57.4156.32是否64KQwen2-72B-Instruct72.7170.21是否128K参数量:模型总的参数数量,以B(十亿)为单位。非Embedding参数量:除去词嵌入(Embedding)部分的参数数量。是否使用GQA:模型是否采用了GQA(Generalized Query Answering)技术。是否Tie Embedding:模型是否使用了输入和输出层共享参数的技术。上下文长度:模型能够处理的最大上下文长度,以tokens为单位。Qwen2的官网入口
官方博客介绍:https://qwenlm.github.io/zh/blog/qwen2/GitHub地址:https://github.com/QwenLM/Qwen2Hugging Face地址:https://huggingface.co/QwenModelScope地址:https://modelscope.cn/organization/qwenHugging Face在线Demo:https://huggingface.co/spaces/Qwen/Qwen2-72B-InstructQwen2的模型评测
Qwen2系列在多个评测基准上表现出色,特别是在Qwen2-72B模型上,实现了大幅度的效果提升。在自然语言理解、知识、代码、数学和多语言等多项能力上,Qwen2-72B显著超越了当前领先的模型,如Llama-3-70B和Qwen1.5的110B模型。在16个基准测试中,Qwen2-72B-Instruct展现了在基础能力和对齐人类价值观方面的平衡,超越了Qwen1.5的72B模型,并与Llama-3-70B-Instruct相匹敌。
Qwen2的模型亮点
代码 & 数学:Qwen2在代码和数学方面的能力显著提升,成功融合了CodeQwen1.5的经验,并在多种编程语言上实现效果提升。数学能力通过大规模高质量数据支持,实现了解题能力的飞跃。
- 猜你喜欢
-
HookGen提示指令
-
DadaBots提示指令
-
Playlistable提示指令
-
Riffusion提示指令
-
WZRD提示指令
-
-
Cyanite.ai提示指令
-
Piano Genie提示指令
-
Synthesizer V提示指令
- 相关AI应用
-
Cosonify提示指令
-
Musico提示指令
-
Loudly提示指令
-
Beatopia提示指令
-
Trending sounds提示指令
-
Staccato提示指令
-
RIFFIT Reader提示指令
-
Brain.fm提示指令
-
A.V. Mapping提示指令
- 推荐AI教程资讯
- Qwen2 – 阿里云开源的新一代通义千问大模型
- Follow-Your-Emoji – 腾讯等推出的基于扩散模型的人像动画框架
- ToonCrafter – 腾讯等开源的卡通动画视频插帧工具
- Stability AI开源Stable Diffusion 3 Medium文生图模型
- MimicBrush – 阿里等开源的AI图像编辑融合框架
- Hallo – 复旦百度等开源的AI对口型肖像视频生成框架
- Unique3D – 清华大学团队开源的图像到3D生成模型
- 琴乐大模型 – 腾讯推出的AI音乐创作大模型
- Diffutoon – 阿里推出的AI将视频转卡通风格的框架
- CriticGPT – OpenAI推出的识别GPT输出代码错误的模型
- 精选推荐
-
Drumloop AI2025-02-14提示指令
-
讯飞听见写作2025-02-03法律助手
-
ChatGPT for Youtube2025-02-02提示指令
-
ChatGPT Gratis2025-02-12提示指令
-
Superpower ChatGPT2025-02-01提示指令
-
Jeda.ai2025-02-01法律助手