ChatGLMとは
ChatGLMは、中国の清華大学のKEG研究室と、そこからスピンオフしたAI企業である智譜AI(Zhipu AI)によって共同で開発された大規模言語モデル(LLM)ファミリーです。 日本語にも対応していますが特に中国語と英語に特化しており、高い中国語処理能力が特徴です。
開発企業
ChatGLMは、2019年に設立されたAI企業、「智譜AI(Zhipu AI)」が中心となって開発しています。智譜AIは清華大学の知識工学研究室からのスピンオフであり、大規模言語モデルの研究開発で知られています。
公式サイトURL
ChatGLMの公式サイトは chatglm.cn です。加えて、モデルの詳細はHugging FaceやGitHubでも公開されており、研究者や開発者がアクセスできるようになっています。
智谱清言(消費者向けアプリ):https://chatglm.cn/
智谱AI(モデル等の紹介):https://www.zhipuai.cn/
利用料金 (有料プラン料金)
ChatGLM自体は無料で利用出来ますが、智譜清言アプリにて消費者向けには月39元~のVIPプランも準備されています。また、ChatGLMのAPIを利用する際には料金が発生する可能性があり、またChatGLMを基盤としたサービスにおいて有料プランが提供されている可能性はあります。例えば、智譜AIの提供するAPIプラットフォームでは、GLM-4などのモデルが利用可能であることに言及している情報もあります。なお、ChatGLM-6Bモデルのウェイトは、学術研究目的には完全にオープンソースであり、非営利目的の商業利用についても申請により可能とされています。
特徴やバージョンの変遷
ChatGLMは、General Language Model (GLM) フレームワークをベースとした対話特化型モデルです。中国語と英語のバイリンガルモデルとして設計されており、特に中国語での質問応答や対話において強みを発揮します。
これまでに複数のバージョンがリリースされており、初期のChatGLM-6Bは62億のパラメータを持ち、コンシューマー向けGPUでも動作可能なように量子化技術が採用されました。その後、ChatGLM2-6B、ChatGLM3とバージョンアップが進み、性能や機能が向上しています。例えば、ChatGLM3では画像認識機能やコード実行機能(Code Interpreterに類似)、ウェブ検索機能などが強化されました。最新のGLM-4シリーズはマルチモーダルに対応し、テキストと画像の入力を処理できます。これらのモデルは、数千億から1兆トークンにも及ぶ大規模なデータセットで事前学習されています。
活用方法
ChatGLMの活用方法は多岐にわたります。
- 対話システム・チャットボット: 自然な対話生成能力を活かし、カスタマーサポートや情報提供のためのチャットボットとして活用できます。
- テキスト生成・要約・翻訳: 文章作成、コンテンツの要約、多言語翻訳など、多様なテキスト処理タスクに利用可能です。
- コード生成・分析: CodeGeeXといった関連モデルもあり、プログラミングコードの生成や分析に役立てることができます。
- 知識グラフ構築: 大量のテキストデータから情報を抽出し、知識グラフの構築を支援する用途も検討されています。
- 教育分野での応用: 電磁気学のような特定の専門分野において、学生の質問応答や教材生成、実践的な演習の補助ツールとして利用する研究も行われています。
- ローカル環境での利用: ChatGLM-6Bのような比較的小規模なモデルは、比較的容易にローカル環境にデプロイできるため、データのプライバシーを重視する場合やオフライン環境での利用に適しています。
APIを通じたサービス連携や、ローカルでの実行環境など、様々な形でChatGLMを利用するための手段が提供されています。
AutoGLM 沉思 (Chensi) について
ChatGLMファミリーの進化は、対話能力だけでなく、AIが実際にタスクを実行する「AIエージェント」の方向にも進んでいます。「AutoGLM 沉思」は、智譜AIが開発したAIエージェント製品であり、特に「沉思(Chensi)」つまり「熟考する」能力に焦点を当てています。
この「沉思」能力とは、与えられた複雑な問題を分解し、自律的に情報を検索・分析し、思考プロセスを経て結果を生成する能力を指します。これは、AIが単に学習済みのデータに基づいて回答するだけでなく、未知の問いに対しても調査・検討を行い、より深く、根拠に基づいた回答を生成することを可能にします。
AutoGLM 沉思の最大の特徴は、その「操作能力」にあります。従来の多くのAIエージェントがAPIを介してサービスと連携するのに対し、AutoGLMはGUI(グラフィカルユーザーインターフェース)を理解し、人間のようにマウスやキーボードを使ってブラウザやデスクトップアプリケーションを直接操作することができます。この「手眼協調(手と目を協調させる)」のようなアプローチにより、ウェブサイトでの情報収集や、特定のアプリケーションを使った作業など、より幅広いタスクの実行が可能になります。
技術的には、AutoGLM 沉思はGLM-4などの基盤モデルをベースに、GLM-Z1-Airのような推論モデル、そして思考能力を強化するためのGLM-Z1-Ruminationといった「沉思モデル」を組み合わせて構築されています。これは、複雑なタスクにおける長距離推論や自己検証、動的なツール呼び出しを可能にします。現在、AutoGLM 沉思は智譜清言のウェブ版およびPCクライアントから利用可能となっており、ユーザーは複雑な調査タスクやウェブ操作を伴うタスクをAIに指示することができます。
AutoGLM 沉思のAndroid携帯版について
AutoGLM の機能は、PCやウェブブラウザだけでなく、Android携帯でも利用可能になっています。智譜AIは「AutoGLM」モバイルベータ版を提供していて、このモバイル版AutoGLMは、ユーザーが音声コマンドなどで指示するだけで、スマートフォン上の様々なアプリケーションを操作し、タスクを自動で実行することができます。例えば、オンラインショッピング、メッセージ送信、情報の検索や整理など、複数のアプリを横断するような複雑な作業も、AIエージェントが代行することが期待されています。これは、スマートフォンを「賈維斯(アイアンマンのAI助手)」のように進化させる可能性を秘めているとも評されています。Android版は主要なアプリストアや智譜AIの公式サイトからダウンロード可能であり、モバイル環境でのAI活用の幅を広げています。
AutoGLMでどの様なことが出来るかは、以下のコンセプトムービーもご参照ください。