生成AIに関わるようになっていまして、流れの早いこの界隈の知識にキャッチアップしなきゃと焦っているところです。 私の周辺だと生成AIがアツいと言うことで、論文を読んだり、本を読んだりで、本についてはまずはこの書籍を読みました。
チャット型AIの課題
チャット型AIに対して自分の意図する回答をしてもらおうと思うと、プロンプトエンジニアリングが大きな鍵を握ります。一方で、プロンプトエンジニアリングを学び、さらにその知見を組み込んだプロンプトを作成することはそこそこ負荷がかかります。その作成負荷は必ずしも一度ではなく、AIの出力を見ながら調整する必要もあります。一般に負荷がかかることは流行らない。自発的には利用されず、そのまま「生成AIって使えない」というレッテルを貼られることもあります。
AIエージェントとは
それを何とかする仕組みの一つが自律エージェントなわけですが、書籍の中では自律エージェントを
自分が置かれている状況や状況に適応しながら、自分自身の目標を達成するために動くシステム
と述べています。自律エージェント自体は歴史も古いですし、いわゆるSwarm Intelligenceは自然界の中の自律エージェントの有名な例でしょう。私が大学の時に研究していたのもこの分野でしたが、私のこれまでの理解だと、この手の「自律エージェント」システムにおける「エージェント」は能力が限定されていることが常でした。能力が限定されている中で各エージェントのフィードバックループによって「系」としての振る舞いを創発し目的を達成する、というのが多かった。
一方で、ここでいうLLMエージェントは、汎用的な知的能力を持っています。 私が知っている自律エージェントシステムとは異なり、人と同程度の言語能力を持つエージェントが互いにコミュニケーションをとりながら、状況に適応しながら目標を達成するシステム、それがこの書籍の対象のようでした。
AIエージェントの構成要素
研究においては、AIエージェントには4つの要素があり、それらが相互作用することによって動作するとされています。
- 個性
- 記憶
- 計画
- 行動
この4つの要素を持つエージェントが、状況に適応しながら目標を達成すると言うのはまさに人間と同様でしょう。
人間も、多様性がある各個人が過去の反省と経験をもとに計画を立て、相互に議論しながら方向性を見出し行動に移します。AIエージェントの振る舞いも、このような人間の振る舞いと相似形になっており、人間のベストプラクティスが概念的にはそのままAIエージェントに適用されるのは面白く感じました。
一方で、人間が多様な他者と共通見解を見出していくプロセスには多くの時間がかかります。議論自体も一時間もしたら疲労しますし空中戦になり、一度時間をおくこともあります。AIエージェントはプログラムであるがゆえに、このような人間の限界を容易に超えることができると言うのが大きな魅力に思えます。
AIエージェント以降の人間の役割
ではこのようなAIエージェントが自然と使われるようになった時、人間の役割はどうなるのでしょうか。
トランスフォーマーベースのAIエージェントはあくまで確率的に生成された文章を提示するだけであり、その文章に価値があるのか、それを実際に採用するかどうかは人間に委ねられます。AIエージェントに高品質な文章・アウトプットを生成させるために、コンテキストや目的・評価指標や基準を具体的に定義することも人の役割になります。
この辺りの明確な言語化が人に求められるのは今でも同じなんですが、これまでは誰々に能力がないから成果が出ない、といった人への責任転嫁が横行していたように思います。皆が同種のLLMにアクセスできるようになった時、目的を見出しその言語化ができる人・できない人の差がより顕著になるのかなぁとか思いました。