AIのIQテスト

近年の生成AIの発展は目覚ましく、その性能向上を測る一つの指標として、「AIのIQテスト」が注目されています。

AIテストを公開しているTrackingAI.orgでは、様々なAIモデルを対象にIQテストを実施し、その結果を公開しているウェブサイトです。このサイトでは、Offline quiz(AIが事前学習していないテスト内容)とMensa Norway Test(オンラインで公開されていて、AIが事前学習している可能性がある内容)の2種類のテスト結果を主に提供しており、AIの推論能力や問題解決能力を測定しています。テスト結果は継続的に更新されており、AIの性能進化を追跡することができます。
サイトURL: https://trackingai.org/home

2024年11月と2025年5月の差

ここで、TrackingAI.orgで公開されている最新のテスト結果と半年前の結果について見てみます。

2024年11月下旬時点では、殆どのLLM汎用モデルがIQ 100以下のスコアでした。このため、AIを使われる皆さんから見ても、「まだAIはそれ程では無いよね。自分の方が良いアウトプットが出せるよね」といった感覚を持たれる方は多かったのではと思います。これが、2025年5月時点では以下の様になります。

テストにより結果は異なりますが、上位集団はIQ120前後に迫るものとなっています。IQ120だと上位1割、偏差値で60台はあり日本だとそれなりに優秀な大学に入れるレベルとなります。最近、AIが賢くなってきたなと感じられる背景には、実際に人並みの知能で受け答えが出来るようになって来ているとの状況があります。このままスコアが伸び続き、アインシュタイン(一説にはIQ160~190)の様な天才的な知能を発揮するAIの登場もそう遠くない日にやって来るのではと期待されます。