通義千問開源320億パラメータモデルはすでに7種類の大言語モデルの全開源を実現した
安民告示
发表于 2024-4-7 17:04:51
4864
0
0
阿里雲通義千問開源320億パラメータモデルQwen 1.5-32 Bは、性能、効率とメモリ占有のバランスを最大限に考慮し、企業と開発者により高い性価格比のモデル選択を提供することができる。現在、通義千問は7種類の大言語モデルをオープンし、国内外のオープンソースコミュニティで累計ダウンロード数は300万を突破した。
通義千問はこれまで5億、18億、40億、70億、140億、720億パラメータの6つの大言語モデルを開発し、いずれも1.5バージョンにアップグレードした。そのうち、いくつかの小サイズモデルは端側に簡単に配置でき、720億パラメータモデルは業界をリードする性能を持ち、HuggingFaceなどのモデルランキングに何度も登場した。今回オープンソースの320億パラメータモデルは、性能、効率、メモリ占有の間でより理想的なバランスを実現する。例えば、14 Bモデルよりも32 Bの方がスマートボディのシーンで能力が強い、72 Bに比べて32 Bの推論コストは低い。通義千問チームは、32 Bオープンソースモデルが下流アプリケーションにより良いソリューションを提供することを望んでいる。
基礎能力の面では、通義千問320億パラメータモデルはMMLU、GSM 8 K、HumanEval、BBHなど多くの評価の中で優れており、性能は通義千問720億パラメータモデルに近く、他の300億級パラメータモデルをはるかに上回っている。
Chatモデルでは、Qwen 1.5-32 B-ChatモデルはMT-Bench評価得点が8点を超え、Qwen 1.5-72 B-Chatとの差は相対的に小さい。
多言語能力については、通義千問チームがアラビア語、スペイン語、フランス語、日本語、韓国語などを含む12言語を選び、試験、理解、数学、翻訳など多くの分野で評価した。Qwen 1.5-32 Bの多言語能力は通義千問720億パラメータモデルにわずかに劣っている。
Logomoney.com 情報発信プラットフォームであり、情報保存空間サービスのみを提供しています。
本文はLogomoney.comの立場を代表するものではなく、提案を構成するものではありません、慎重に対応してください。
本文はLogomoney.comの立場を代表するものではなく、提案を構成するものではありません、慎重に対応してください。
あなたが好きだと思う
- マイクロソフト、ユーザーデータを用いた人工知能モデルの訓練を否定
- 奇富科技:デジタル金融安全レベルと金融大モデルの着地応用の向上に助力する
- OpenAIオンライン満血版o 1大モデルおよび月額200ドルのChatGPT Pro
- OpenAIにまたキング爆弾が!AIビデオ生成モデルSoraを正式にリリース
- 新東方は「遅ればせながら」、教育大モデル時代が来たのか。
- グーグル、最強モデルを放出OpenAIの重心をAIエージェントに狙撃
- OpenAIに挑戦、グーグルが新アクション!生成型AIを大幅に更新し、ビデオモデルVEO 2と最新版Imagen 3をリリース
- ますます真偽の見分けがつかない?グーグル、次世代ビデオ生成モデルVeo 2を発表
- 蔚来第3ブランドホタル初モデル2025年4月発売
- マイクロソフトは365 Copilot製品に非OpenAIモデルを追加することに力を入れているという