首页 美股新闻 正文

通义千问开源320亿参数模型 已实现7款大语言模型全开源

今早我梦醒了坎
254 0 0
  阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。

  通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本,其中,几款小尺寸模型可便捷地在端侧部署,720亿参数模型则拥有业界领先的性能,多次登上HuggingFace等模型榜单。此次开源的320亿参数模型,将在性能、效率和内存占用之间实现更理想的平衡,例如,相比14B模型,32B在智能体场景下能力更强;相比72B,32B的推理成本更低。通义千问团队希望32B开源模型能为下游应用提供更好的解决方案。
  基础能力方面,通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异,性能接近通义千问720亿参数模型,远超其他300亿级参数模型。
  Chat模型方面,Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分,与Qwen1.5-72B-Chat之间的差距相对较小。
  多语言能力方面,通义千问团队选取了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言,在考试、理解、数学及翻译等多个领域做了测评。Qwen1.5-32B的多语言能力只略逊于通义千问720亿参数模型。
LogoMoney.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表LogoMoney.com立场,且不构成建议,请谨慎对待。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

  •   当地时间周四,美股三大股指集体收涨,其中道指和标普500指数实现“八连涨”。不过,三大股指均在尾盘出现小幅跳水。   苹果、亚马逊于周四美股盘后公布了最新业绩,尽管业绩有所超出预期,但仍有令市场不满 ...
    jiangu12
    前天 10:28
    支持
    反对
    回复
    收藏
  •   得益于贸易战缓和迹象和强劲非农就业报告,周五标普500指数连续第九个交易日收高,创下自2004年以来最长连涨走势,并收复了特朗普4月初宣布全面加征关税后的全部跌幅。   接下来,市场的注意力将部分转向美联 ...
    宝贝七七
    7 小时前
    支持
    反对
    回复
    收藏
  •   上个月,美国宣布自5月2日起取消对中国小额包裹免税政策。   日前,美国一家物流行业数据分析平台负责人在接受美国媒体采访时就表示,高关税下美国零售商从国外进口的货物会越来越少,造成消费者可选择的商品 ...
    枫叶五1
    7 小时前
    支持
    反对
    回复
    收藏
  •   5月2日,全球电商巨头亚马逊公布了2025年第一季度财报。亚马逊第一季度净销售额为1556.67亿美元,较2024年第一季度同比增长9%;净利润为171.27亿美元,较2024年第一季度增长64%;每股摊薄收益1.59美元,较上年同 ...
    独品金莲芳
    昨天 10:16
    支持
    反对
    回复
    收藏
今早我梦醒了坎 注册会员
  • 粉丝

    0

  • 关注

    0

  • 主题

    34