
StepFun:マルチモーダルAIで可能性を広げる中国発の注目企業
StepFun(阶跃星辰)は、中国・上海を拠点とするAIスタートアップ企業で、大規模言語モデル(LLM)やマルチモーダルAIの開発において急速に頭角を現しています。マイクロソフトアジア研究所の元主任科学者であるJiang Daxin氏によって設立され、「すべての人々の可能性を広げる」というミッションを掲げています。 中国のAIスタートアップの中でも「六小虎」の一角として注目されており、その堅実な技術開発力で評価を得ています。同社のStep-2-16K-Expは2025年5月Chatbot Arenaで1305を記録し、このスコアは中国系ではDeepSeek、Tencent、Alibaba、Zhipuに次ぐ位置にあります。2025年4月には復旦大学と統合スケーラブルベクターグラフィックス(SVG)生成モデル「OmniSVG」を共同で発表するなど、復旦大学との連携も進めています。
公式サイトURL: https://www.stepfun.com
StepFunの主な特徴
StepFunは、テキスト、画像、動画、音声など、複数のモダリティに対応したAIモデルの開発に注力しています。 特に、オープンソースコミュニティへの貢献も積極的で、高性能なモデルを公開することで技術の発展を後押ししています。
主なプロダクトやモデルには以下のようなものがあります。
- Step-1 / Step-2 LLM: テキスト生成、対話、情報検索などを行う大規模言語モデルです。Step-2は1兆を超えるパラメータを持つとされ、OpenAIのGPT-4に迫る性能を持つと言われています。
- Step-1V (マルチモーダルモデル): テキストと画像を組み合わせたタスクに対応可能なモデルです。
- Step-Video-T2V: テキストから動画を生成するモデルで、300億パラメータを持ち、最大204フレームの動画生成が可能です。オープンソースで公開されており、中国語と英語のバイリンガルに対応しています。
- Step1X-Edit: テキスト指示に基づいて高度な画像編集を行うことができるオープンソースのAIツールです。
- Step-Audioシリーズ: 音声理解、音声生成、音声対話などを行うモデル群で、多言語や方言にも対応しています。
- Step1X-3D: 高忠実度で制御可能な3Dコンテンツを生成するオープンソースの3D大規模モデルです。
- 跃问 (YueWen / StepChat): StepFunが開発したAIチャットボットで、情報検索、文書要約、クリエイティブな作成などをサポートします。
バージョンの変遷と開発状況
StepFunは創業以来、ハイペースで技術のアップデートとAIモデルの発表を繰り返しています。 2024年には、1000億パラメータと1兆パラメータの大規模言語モデルに加え、画像理解、動画理解、画像生成、動画生成、音声再現、音声生成、音声識別に関連する計11の基盤モデルを発表しました。
同社は、シングルモーダルからマルチモーダルへ、そしてマルチモーダル理解と生成の統一、ワールドモデル、汎用人工知能(AGI)へと発展させる方針を掲げています。 2024年末にはシリーズBで数億ドル(数百億円)を調達し、基盤モデルの開発や推論能力の強化、一般ユーザー向けプロダクトやエコシステムの提供を加速しています。
利用料金(有料プラン料金)
StepFunのモデルの一部はオープンソースとして公開されており、無料で利用できるものがあります。 例えば、Step-Video-T2VやStep1X-EditはMITライセンスで公開されており、商用利用も可能です。
一方で、API連携やクラウドサービスとしての提供については、利用量に応じた料金体系が設定されている可能性があります。 具体的な最新の有料プランの料金については、API提供プラットフォーム(https://platform.stepfun.com/)で確認が必要です。 Google Playストアでは、StepFunのアプリが提供されています。
活用方法
StepFunのAIモデルは、その多様な機能から幅広い分野での活用が期待されています。
- コンテンツ作成: テキスト、画像、動画、音声、3Dコンテンツなど、様々なメディアの自動生成や編集に活用できます。
- 情報検索・要約: 大量の情報の中から必要な情報を効率的に見つけ出し、要約することができます。
- 対話システム・チャットボット: 自然な対話を通じてユーザーをサポートするAIアシスタントやチャットボットの開発に利用できます。
- クリエイティブ支援: 小説の作成やアイデア発想など、クリエイティブな作業を支援します。
- 研究開発: オープンソースモデルを活用して、新たなAI技術の研究開発を進めることができます。
- ビジネス利用: 広告制作の効率化、製品デザイン、顧客対応など、様々なビジネスシーンでの活用が可能です。
StepFunのモデルは、Hugging Faceなどのプラットフォームを通じてダウンロードしたり、オンラインで試したりすることができます。 また、ComfyUIなどのツールと連携して利用することも可能です。
関連リンク:
- GitHub: https://github.com/stepfun-ai
- Hugging Face: https://huggingface.co/stepfun-ai
- 阶跃AI:https://yuewen.cn/
StepFunは、その高い技術力とオープンな姿勢で、世界のAI開発に大きな影響を与えうる企業の一つとして、今後の動向が注目されます。