行业动态

阿里云开源千问2代模型,推动中文AI生态发展

阿里云正式开源千问2代(Qwen2)系列模型,包括从70亿到720亿参数的多个版本,在中文理解和多语言能力上表现优异。

发布于 2024年5月1日作者: FIA技术团队
阿里云开源千问2代模型,推动中文AI生态发展

阿里云开源千问2代模型,推动中文AI生态发展

阿里云今日宣布正式开源千问2代(Qwen2)系列大模型,这是继去年开源千问1代后的重要升级,新模型在多项基准测试中表现出优异性能,特别是在中文理解和处理方面。

完整的模型系列

此次开源的千问2代包括多种规格:

  • Qwen2-7B:70亿参数基础模型
  • Qwen2-14B:140亿参数中型模型
  • Qwen2-33B:330亿参数大型模型
  • Qwen2-72B:720亿参数超大模型

每个模型均提供基础版和对齐版(Chat),覆盖不同应用场景和算力需求。

性能突破

根据官方公布的评测结果,千问2代在多个基准测试中表现优异:

  • 在中文C-Eval测试中,Qwen2-72B达到86.5分,超越同类开源模型
  • 在英文MMLU测试中,Qwen2-72B达到80.2分,接近闭源顶级模型
  • 多语言评测MGSM上,覆盖26种语言的平均成绩提升32%
  • 代码能力评测中,各版本模型均实现显著提升

阿里云智能技术总经理周靖人表示:"千问2代不仅在性能上有显著提升,更重要的是我们优化了模型在实际应用中的表现,特别是在中文理解、逻辑推理和代码生成方面。"

技术创新

千问2代系列在多个技术方面实现了创新:

  1. 改进的Transformer架构:优化了注意力机制和前馈网络
  2. 高质量训练数据:使用更全面、更高质量的中文和多语言数据
  3. 更高效的训练方法:采用分阶段训练策略,提高计算效率
  4. 增强的指令跟随能力:通过高质量的RLHF提升模型的对齐效果

开源许可与使用条件

阿里云采用了更加开放的许可模式:

  • 所有模型权重完全开源,支持学术研究和商业应用
  • 基于Apache 2.0许可证开放API接口
  • 提供本地部署和云服务两种使用方式
  • 企业级应用可免费进行商业落地

生态建设举措

为促进千问2代的应用生态发展,阿里云同时宣布:

  • 提供1亿元的开发者支持基金
  • 推出开源适配工具,支持主流框架和硬件平台
  • 建立开发者社区和技术支持体系
  • 启动行业共建计划,支持垂直领域应用开发

行业影响

分析师认为,千问2代的开源将对中文AI生态产生重要影响:

  • 降低国内企业和开发者使用先进大模型的门槛
  • 促进中文大模型技术的发展和创新
  • 加速各行业AI应用落地
  • 推动国产大模型技术的国际竞争力

某头部科技企业AI负责人评价:"阿里云开源千问2代是中国AI开源社区的重要里程碑。相比国际模型,千问2代在中文语境下的理解能力和生成质量有明显优势,将帮助更多中国企业快速构建基于大模型的应用。"

阿里云表示,将持续投入千问系列的研发和生态建设,计划在未来引入更多创新功能和更大规模的模型版本,推动大模型技术普惠化和产业化。