Metaが発表した「最強オープンソース大モデル」オープンソースとクローズソースの争い新しいページの大モデルを開くか、シャッフルを迎える
愿为素心人
发表于 2024-7-28 10:40:20
258
0
0
Metaは現地時間7月23日、最新バージョンの言語大モデルLlama 3.1を正式に発表した。今回の発表はAIコミュニティから「オープンソース後進論」への強力な反撃とされ、Meta創業者でCEOのザッカーバーグ氏も発表時に「オープンソースAIは未来への道だ」と述べた。
従来、OpenAIはChatGPTの閉鎖性のため、「Open」と呼ばれているが実際には「Close」のことをしていると非難されてきたが、ChatGPT-4 oに代表される閉源大モデルの実力は業界を退却させることが多く、「閉源大モデルの性能は必ず開源大モデルより強い」という考えがデフォルトになっているようだ。
しかし、今回のLlama 3.1のリリースはこの構造を上書きするようだ。今回のMetaは、8 B、70 B、405 BのLlama 3.1の3つのバージョンをリリースしました。このうち405 Bは「トップフィット」バージョンで、Metaは最高の閉源モデルに匹敵する性能を誇ると言われています。
「最強オープンソース大モデル」
Llama 3.1 405 Bはなぜ最高の閉源モデルと競争できるのか。Llama 3.1を発表すると同時に、Metaも「The Llama 3 Herd of Models」と題する論文を発表し、その中でLlama 3モデルの研究開発の詳細を詳しく述べた。
まず、使用上、Llama 3.1は8つの言語をサポートし、3つのバージョンのコンテキストウィンドウはGPT-4 Turboと同じ128 Kに拡張されています。同時に、Llama 3.1 405 Bは4050億個のモデルパラメータを持ち、訓練規模はLlama 2の50倍であり、より安定した性能を維持するために密集Transformerアーキテクチャを採用している。これにより、Llamaが一度に処理できるテキストの数は9.6万字に達し、同時に長いテキストでも短いテキストでも、「思い通りに」処理することができる。
論文では、MetaもLlama 3.1 405 BとChatGPT-4 oとClaude 3.5 Sonnetのこれらの頭部閉源大モデルの性能比較データを発表した。テストの結果、Llama 3.1 405 Bは汎用性能、長テキスト処理、多言語処理の多方面で得点がリードしていることが分かった。例えば、ZeroSCROLLSプロジェクトのテストでは、Llama 3.1 405 Bのスコアは95.2で、後の両方は90.5です。
優れた性能と膨大な訓練基数を表現することで、Llama 3.1は「最強オープンソース大モデル」の称号を持つようになったが、現在のLlama 3.1は依然として言語処理を主とする大モデルであり、画像、ビデオ、音声の処理をサポートしていない。これは、多モードタスク処理において、ChatGPTが依然として際立った能力を持っていることを意味する。
「オープンソースAIは未来の道」
Llamaの実際の使用体験はまだ完璧なほどではないかもしれないが、今回のLlama 3.1 405 Bの発表は、世界中のAIワーカーにとって最大の意味はやはり大モデルのオープンソースとクローズソースの争いが新たなページを開いたことにある。
メッタの公式サイトでザッカーバーグ氏は公開書簡を発表し、「オープンソースAIは未来への道だ」と力強く宣言した。同書によると、複数の企業が先行するクローズドソースモデルを開発しているにもかかわらず、オープンソースは急速に差を縮めているという。Llamaを例にとると、昨年のLlama 2は汎用大モデルの古いバージョンにしか匹敵できなかったが、今年のLlama 3は最先端の大モデルと競争し、一部の分野でリードしている。
そのため、ザッカーバーグ氏はLlamaを大モデル時代のLinuxにして、オープンソースAIの業界標準にしたいと考えている。「高性能コンピューティングの初期には、主要技術会社が独自のクローズドソースUnixバージョンの開発に巨額を投じていました……今日、オープンソースのLinuxはクラウドコンピューティングとモバイルデバイスのほとんどを実行するオペレーティングシステムの工業標準的な基礎となり、人工知能は同様の方法で発展すると信じています」
Logomoney.com 情報発信プラットフォームであり、情報保存空間サービスのみを提供しています。
本文はLogomoney.comの立場を代表するものではなく、提案を構成するものではありません、慎重に対応してください。
本文はLogomoney.comの立場を代表するものではなく、提案を構成するものではありません、慎重に対応してください。
あなたが好きだと思う
- マイクロソフト、ユーザーデータを用いた人工知能モデルの訓練を否定
- 奇富科技:デジタル金融安全レベルと金融大モデルの着地応用の向上に助力する
- OpenAIオンライン満血版o 1大モデルおよび月額200ドルのChatGPT Pro
- OpenAIにまたキング爆弾が!AIビデオ生成モデルSoraを正式にリリース
- 新東方は「遅ればせながら」、教育大モデル時代が来たのか。
- グーグル、最強モデルを放出OpenAIの重心をAIエージェントに狙撃
- OpenAIに挑戦、グーグルが新アクション!生成型AIを大幅に更新し、ビデオモデルVEO 2と最新版Imagen 3をリリース
- ますます真偽の見分けがつかない?グーグル、次世代ビデオ生成モデルVeo 2を発表
- 蔚来第3ブランドホタル初モデル2025年4月発売
- マイクロソフトは365 Copilot製品に非OpenAIモデルを追加することに力を入れているという