理系学生日記

おまえはいつまで学生気分なのか

AIとの協働も結局のところコミュ力・対話力が必要なのかよ

Claude CodeやCopilotを使っている人を見てると、同じツールを使っているのに、使い方が全然違うなぁと感じることがあります。ある人はAIと対話しながら複雑な問題をスムーズに解決していく。一方で、期待に添えない回答ばかり得てしまい悲しい思いをする人もいる。 この差はいったい何なのか。技術力の差、経験の差、それともプロンプトの書き方の問題でしょうか。

そんな折に出会ったのが、Quantifying Human-AI Synergyという論文でした。

667人の開発者を対象にしたこの研究が、意外な答えを出しています。AIとのコラボレーション成功を予測するのは、プログラミング能力や技術的知識ではなく、「Theory of Mind(wikipedia:心の理論)」だといいます。つまり、相手の状態を推測し、適切にコミュニケーションをとる能力です。

AIに対して「心」を想定する必要があるのか、と思うかもしれません。しかし、この研究結果が示しているのは、チームで成果を出すために必要だったスキルセットが、AI協働でも引き続き重要だということです。今日はこの研究を深掘りしながら、「なんだよ結局コミュニケーションスキルかよ」という話を見ていきたいと思います。

AIとの協働は社会的スキルである

こんな記事を読みました。

たくさんの観点を含む内容でとても示唆に富んでいるのですが、そのうちの1つは「AIとの仕事は根本的に社会的スキルである」ということでした。

冒頭で紹介した研究によると、AIとの協働で成功を予測するのは技術的深さやプロンプトエンジニアリングではありません。Theory of Mind(他者の視点をモデル化し、その場で適応する能力)こそが重要だといいます。そして記事は続けます。「優れたエンジニアは常に効果的なコミュニケーターであり、思慮深いコラボレーターだった。以前それはチームメイトや同僚を意味していた。今はClaudeも含まれる」

The best engineers have always been effective communicators and thoughtful collaborators. That used to mean teammates and colleagues. Now it includes Claude.

🔚 This is the End

つまり、求められるスキルが根本的に変わったわけではない。チームメイトと協働するために必要だったスキルが、AIとの協働でも同じように必要だということです。では、その「Theory of Mind」って具体的に何でしょう?

Theory of Mind - 相手の心を推測する能力

Theory of Mind(ToM)とは、他者の信念・意図・知識を推測し、それに基づいて自分の行動を調整する能力のことです。

心の理論(こころのりろん、英: Theory of Mind, ToM)は、ヒトや類人猿などが、他者の心の状態、目的、意図、知識、信念、志向、疑念、推測などを推測する直観による心の機能のことである

wikipedia:心の理論

これは日常的にも使っている能力ですね。たとえば会議で誰かに何かを説明するとき、相手がその話題についてどれくらい知っているかを推測します。初心者なら基礎から丁寧に説明するし、専門家なら詳細に踏み込む。こうした「相手の知識レベルに合わせた調整」が、Theory of Mindの働きです。

では、なぜこれがAIとの協働に関係するのでしょうか? 実は、このToMこそがAI協働の成否を分けるという研究があります。

667人の対話ログが明らかにした事実

この研究では、667人の参加者に問題を2つの解き方で解かせました。1つは単独で、もう1つはAI(GPT-4oまたはLlama-3.1-8B)と協働で取り組んでもらう形です。興味深いのは分析手法で、AIとの対話ログからToMを測定しています。さらにIRT(Item Response Theory:項目反応理論)という統計モデルを使って「個人の能力」と「AIとの協働能力」を分離しました。つまり、「この人が成功したのは本人が優秀だからか、それともAIとうまく協働できたからか」を切り分けたわけです。

分析の結果、AIとの協働タスクでの成功と強い相関を示したのは、個人の単独能力ではなく、Theory of Mindでした。一方で、興味深いことに、ToMは個人の単独能力をほとんど説明しませんでした。つまり、ToMは一般的な「賢さ」を測る指標ではなく、「AIを相手にして意図・前提・限界を推測し、対話を設計する能力」——AIとの協働能力を測る良さげな指標だったということです。

じゃあ、具体的にToMが高い人と低い人で何が違うのでしょうか。

「丸投げ」と「対話」- 具体的な違い

研究では、High ToMとLow ToMの違いを具体的な行動パターンとして分類しています。ここでは、それぞれの特徴を見てみましょう。

High ToMを示す人は、AIを「独自の知識と能力を持つパートナー」として扱います。たとえば、「私は物理学の初心者です」と自分の知識レベルを伝えたり、「これは難しい問題ですよね」とAIの認識プロセスに言及したりします。さらに、「これからあなたに質問をします」といった協力計画を示すマーカーを使ったり、「私が意図したのはそういうことじゃない」と誤解を修正したり、「その答えは分数形式で」と期待を明確にしたりします。

こうした行動の背景にあるのは、知識のギャップを認識し、それを埋めようとする姿勢です。「あなたのアプローチは間違っているかもしれません」と指摘したり、「なぜその方法を選んだのか理由も教えてほしい」と推論プロセスの説明を求めたりするのも、AIを思考するパートナーとして理解している証拠です。会話の中でAIのコミュニケーションスタイルに合わせて自分の表現を調整する、といった適応行動も観察されています。

一方、Low ToMの特徴は、こうした配慮の欠如です。事前に文脈を確立せずに「この質問に答えて」とだけ言ったり、「お腹が痛い鋭い痛み」のようにAIを検索エンジンとして扱ったりします。AIが何を知っていて何ができるのか、そもそも理解していないのです。関連性のない情報を共有したり、共有されていない前提を勝手に仮定したりするのも、相手の認識状態を考慮していない表れなのでしょう。

なぜTheory of Mindが重要なのか

では、なぜこうしたToM的なふるまいが、AI協働で重要なのでしょうか。答えはシンプルで、AIとの協働は、どうも結局コミュニケーションの問題っぽいからです。

ToMが高い人は、AIのメンタルモデルを構築できます。AIが何を把握していて、何を把握していないのか。どんなコンテキストが必要で、どこまで詳しく説明すべきなのか。「このAIは前の会話を覚えてないから、背景から説明し直さないとな」という判断ができるわけです。

適応的にコミュニケーションできるのも特徴です。最初の回答がイマイチなら、別の角度から質問してみる。AIが誤解してそうだなと気づいたら、「あ、今の説明だと誤解されそうだから言い換えよう」と軌道修正する。AIが創造的なアイデアを得意とする一方、プロジェクト固有の制約を把握していないことを理解し、制約を明示的に伝える——そういった判断も自然とできます。

そして何より、対話的に問題を解決する姿勢があります。AIの出力を見て「この部分はいいけど、ここは違うな」とフィードバックを返す。試行錯誤しながら、最適な使い方を見つけていく。

よく考えると、これって人間同士のコミュニケーションでも同じですよね。相手が新人なら丁寧に説明するし、ベテランならポイントだけ話す。相手が誤解してたら言い換えるし、うまくいかなかったら別のアプローチを試す。AIが相手でも、やることは変わらない。

技術とコミュニケーションの両輪

ここで誤解してほしくないのは、「技術的な深さは不要」という話ではないということです。むしろ逆で、技術を理解していれば、AIに良い質問ができるし、出力を正しく検証できます。コードの品質を評価したり、AIの提案が妥当かを判断したりするには、技術力が不可欠です。ToMは「技術の代わり」ではなく、「技術を最大限活かすための手段」なんだと思います。

対人スキルとしてのAI協働

冒頭で書いた、AIを使いこなす人と使いこなせない人の差。その正体は、プロンプトのテクニックや技術的知識ではなく、「AIを対話のパートナーとして扱えるか」という姿勢なのかもしれません。 667人の対話ログから見えてきたのは、コードを書く力、アーキテクチャを設計する力はもちろん今でも大切な一方、それと同じくらいコミュニケーション能力が差を生むということでした。

このあたり、チーム開発で成功する人の条件と似ているなと思います。他者の考えを汲み取りながら協働できる人は、チームの生産性を引き上げられる。AIが相手でも、それは変わらないということなのでしょう。

技術的な深さを追求しつつ、同時にToMを意識した協働スタイルを磨く。明日からのClaude Codeとの対話を、僕ももう少し丁寧にやってみようと思います。