テンセントがオープンソースのAIの新たな一手を発表!Hunyuan-A13Bモデルが登場、13Bパラメータが80Bの巨大モデルに挑戦

robot
概要作成中

生成型AIが新たな段階に入る中、超大規模モデルは強力である一方で、高額なリソースコストとデプロイの難易度を伴います。テンセントの最新のオープンソース大型言語モデルHunyuan-A13Bは、軽量で高効率な新しいアプローチを採用しました。総計800億パラメータを持ちながら、推論時には130億パラメータのみを使用し、「Mixture-of-Experts(MoE)」アーキテクチャを通じて推論コストを大幅に圧縮し、言語理解と推論能力を犠牲にすることはありません。

効率とリソースのボトルネックを打破する:Hunyuan-A13Bの技術的基盤の解析

Hunyuan-A13Bは疎なMoEアーキテクチャを採用しており、64の専門家モジュールと1つの共有専門家を持っています。推論のたびにその中から8つの専門家のみを活性化し、SwiGLU活性化関数とGQA(Grouped Query Attention)技術を組み合わせることで、メモリ使用効率と推論スループットを効果的に向上させることができます。

さらに、その事前学習データ量は20兆トークンに達し、その中にはSTEM分野からの2500億の高品質データが含まれており、モデルの数学、科学、論理的推論における性能を強化しています。全体のトレーニングは、基礎事前学習、ファストアニーリングトレーニング、長文コンテキスト拡張トレーニングの3つの主要な段階を経て、最終的に最大256Kトークンのコンテキスト処理能力をサポートします。

推論の2つのモードを自由に選択:クイック vs. ディープシンキングの切り替え

Hunyuan-A13B 特別導入デュアルモード推論機構(Dual-mode Chain-of-Thought)。これは、タスクの複雑さに応じて「クイックシンキング」と「スローシンキング」モードを自動的に切り替えます。クイックシンキングは日常の簡単なクエリに適しており、低遅延と高効率を強調します。スローシンキングは、より長いChain-of-Thought推論経路を起動し、多段階の論理と複雑な推論問題を処理し、正確性とリソースの使用をバランスさせます。

評価結果が素晴らしい

多くの公認ベンチマークテストにおいて、Hunyuan-A13Bのパフォーマンスは非常に優れています。数学的推論(AIME 2024、MATHなど)では首位を獲得し、論理的推論(BBH、ZebraLogicなど)でも上位にランクインしています。モデルの深さを試す長文テスト(LongBench-v2やRULERなど)においても、Hunyuan-A13Bは驚くべき文脈保持能力と論理統合能力を示し、はるかに多くのパラメータを持つQwen3-A22BやDeepSeek-R1を打ち負かしました。

オープン環境の課題に直面し、ツールの呼び出し能力が全面的にアップグレードされました。

言語能力と推論能力に加え、Hunyuan-A13Bはエージェント能力を大幅に向上させました。BFCL v3やComplexFuncBenchなどのツール呼び出し、計画、マルチターン対話に関するテストでは、Qwen3-A22Bを上回るだけでなく、C3-Benchテストでも首位に立ち、複雑なタスクフローへの適応力の強さを示しています。

推論スループットが爆発的で、展開効率に注目する価値があります

報告によると、Hunyuan-A13Bは推論効率においても驚異的です。既存の推論フレームワークであるvLLMやTensorRT-LLMなどと組み合わせて、32バッチ、14Kトークンの出力長で、近く2000トークン/sのスループットを達成できます。INT8やFP8などの量子化精度を使用する場合でも、性能を維持でき、企業の展開にとって重要です。

高効率かつ高コストパフォーマンスを兼ね備え、オープンソースモデルが新たな選択肢を迎えました

テンセントはHunyuan-A13Bを通じてオープンソース言語モデル界に新たな標準を打ち立てました。このモデルは「小さなモデルが大きなモデルに敵わない」という固定観念を打破しただけでなく、柔軟な推論と多タスク適応能力を提供し、オープンソースLLM分野の新しいフラッグシップとなりました。リソースが限られているが高効率なAIソリューションを追求する開発者や企業にとって、Hunyuan-A13Bは間違いなく注目すべき強力な新しい選択肢です。

この記事は、テンセントが再びオープンソースのAI大技を発表しました!Hunyuan-A13Bモデルが登場し、13Bのパラメータが80Bの巨大モンスターに挑戦します。これは、チェーンニュースABMediaに最初に掲載されました。

原文表示
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
  • ピン
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)