Hunyuan

hunyuan

Hunyuan(混元)by テンセント

ここでは、中国のテンセントが開発した大規模言語モデル「Hunyuan(混元)」について紹介します。

開発企業

Hunyuanは、中国を代表するテクノロジー企業であるテンセント(Tencent/腾讯)によって開発されました。 テンセントは、SNS、ゲーム、フィンテック、クラウドコンピューティングなど、多岐にわたるサービスを提供するグローバル企業です。

公式サイトURL

Hunyuan及び関連情報については、以下のリンク先で情報が公開されています。

利用料金(有料プラン料金)

Hunyuanは、Tencent Cloudを通じてAPIとして提供されており、利用量に応じた料金体系が設定されています。

2024年5月には、Hunyuanの一部のモデルで大幅な価格改定が行われました。

  • Hunyuan-lite: APIの入出力合計長が256kにアップグレードされ、完全に無料で利用可能になりました。
  • Hunyuan-standard: API入力価格が0.01元/1000トークンから0.0045元/1000トークンに(55%削減)、API出力価格が0.01元/1000トークンから0.005元/1000トークンに(50%削減)引き下げられました。
  • Hunyuan-standard-256k: 38万文字以上の超長文処理に対応し、API入力価格は0.015元/1000トークン(87.5%削減)、API出力価格は0.06元/1000トークン(50%削減)となりました。
  • Hunyuan-pro: API入力価格が0.1元/1000トークンから0.03元/1000トークンに(70%削減)引き下げられました(出力価格は据え置き)。

また、Hunyuan T1という新しいAI推論モデルも発表されており、こちらは入力100万トークンあたり1元、出力100万トークンあたり4元といった料金設定がされています。

動画生成モデルのHunyuanVideoや3Dモデル生成のHunyuan3Dについては、オープンソースとして公開されているものもあり、ローカル環境やHugging Faceなどのプラットフォームで試すことが可能です。 ReplicateなどのAPIサービス経由での利用では、実行ごとにおおよそ0.81ドル程度の費用がかかる場合もあります。 Hunyuan3Dの公式サイトでは、登録ユーザーは1日20回まで無料で3Dモデルを生成できるといった情報もあります。

最新の料金情報やプラン詳細については、Tencent Cloudの公式サイトをご確認ください。

特徴やバージョンの変遷

Hunyuanは、テキスト生成、画像生成、動画生成、3Dモデル生成など、多岐にわたるタスクに対応可能なマルチモーダルAIモデル群として進化を続けています。

大規模言語モデル (LLM) としてのHunyuan:

  • 初期発表 (2023年9月): 1000億以上のパラメータと2兆を超えるトークンの事前学習データを持ち、強力な中国語処理能力、高度な論理的推論能力、信頼性の高いタスク実行能力を特徴として発表されました。 当初より、テンセント社内の50以上の製品(Tencent Cloud、Tencent Meeting、Tencent Docs、Weixin Search、QQ Browserなど)に接続・活用されています。
  • Hunyuan-Large (Hunyuan-MoE-A52B): 業界最大級のオープンソースTransformerベースMoE(Mixture of Experts)モデルとして公開されました。総パラメータ数は3890億、アクティブパラメータ数は520億に達します。 高品質な合成データによる学習、KVキャッシュ圧縮技術(GQA、CLA)、専門家ごとの学習率スケーリング、最大256K(Instructモデルでは128K)の長文コンテキスト処理能力などを特徴としています。 数学、コード生成、論理推論、長文理解などの分野で高い性能を示しています。
  • Hunyuan Turbo S: 速度と効率を重視したモデルで、応答速度の向上とコスト削減を実現しています。ハイブリッドMamba-Transformerアーキテクチャを採用している点が特徴です。
  • Hunyuan T1: 大規模強化学習を活用したAI推論モデルで、MMLU Proベンチマークで高いスコアを記録するなど、優れた性能と価格競争力を両立させています。

動画生成AIとしてのHunyuan (HunyuanVideo):

  • テキストからの動画生成 (Text-to-Video)、画像からの動画生成 (Image-to-Video) に対応しています。
  • 130億パラメータを持つ大規模モデルであり、高品質な動画生成が可能です。
  • オープンソースとしてコードやモデルの重みが公開されており、GitHubやHugging Faceを通じて利用できます。
  • LoRA(Low-Rank Adaptation)によるファインチューニングに対応しており、特定のスタイルやキャラクターに特化した動画生成も可能です。
  • ComfyUIなどのツールと連携して利用することも可能です。
  • 特徴としては、優れた視覚的忠実度、スムーズなシーン遷移、自然な動きの表現などが挙げられます。

3Dモデル生成AIとしてのHunyuan (Hunyuan3D):

  • テキストや画像から高品質な3Dモデルを数秒で生成できます。
  • Hunyuan3D-2.0 / v2.5: 初期バージョンから大幅に進化し、高解像度のジオメトリとテクスチャ生成を実現しています。 v2.5では有効な幾何学的解像度が1024に達し、総パラメータ数は10億から100億に増加、4Kの高解像度テクスチャやバンプマップもサポートしています。
  • オープンソースとしても公開されており、GitHubやHugging Faceでコードやデモが利用可能です。
  • スケッチからの3Dモデル生成機能も追加されています。
  • ゲーム開発、建築デザインなど様々な分野での活用が期待されています。

活用方法

Hunyuanは、その多様な機能により、様々な分野での活用が期待されています。

  • コンテンツ作成:
    • 文章作成: ブログ記事、広告コピー、シナリオ、メール作成など。
    • 画像生成: プロンプトに基づいたオリジナル画像の作成。
    • 動画生成: テキストや画像からの短尺動画、プロモーションビデオ、アニメーションなどの制作。 ECサイトの商品紹介動画や映像制作における絵コンテ作成などでの活用事例があります。
    • 3Dモデル制作: ゲームのアセット作成、製品デザイン、建築物のビジュアライゼーションなど。
  • 業務効率化:
    • 会議アシスタント: Tencent Meetingでは、Hunyuanを搭載したAIアシスタントが議事録を自動作成するなどの機能を提供しています。
    • ドキュメント作成支援: Tencent Docsでは、様々なテキスト作成シナリオをサポートし、ワンクリックで定型文を生成できます。
    • 顧客対応: カスタマーサービスにおける自動応答や問い合わせ対応。
  • 研究開発:
    • 自然言語処理、コンピュータビジョン、マルチモーダルAIなどの研究分野での活用。オープンソースモデルは研究者コミュニティによる探求や最適化を促進します。
  • 特定業界での応用:
    • 金融: 市場分析、リスク評価、顧客向けパーソナライズドサービスなど。
    • 公共サービス: 情報提供、手続きの自動化など。
    • Eコマース: 商品説明の自動生成、パーソナライズド広告、ショッピングガイドの作成など。
    • ゲーム開発: キャラクターデザイン、背景作成、NPCの対話生成など。

Hunyuanは、テンセントのMaaS (Model-as-a-Service) の一部としても提供されており、企業はHunyuanを基盤として自社ニーズに合わせた独自のAIモデルをトレーニングし、業務に組み込むことが可能です。 これにより、各産業に特化したインテリジェントなサービスの創出が期待されます。