ChatGPTの内部をわかりやすく説明してくれる本の紹介

今回は、ChatGPTの内部について、AIの専門家がわかりやすく説明してくれる本をご紹介します。

ChatGPTの登場は、インターネットに匹敵するイノベーションと言われています。様々な使い方が試されていますが、特にビジネスの生産性向上に威力を発揮するため、今後はビジネスパーソンに必須のスキルとなりそうです。

一方で、その内部に目を向けてみると人間と同じように文章を作成できるので、「人間の思考方法」との関連性が議論されます。そして、非常に興味深いのが、なぜこんなに自然な言語を生成できるのかについてはまだわからないことが多いということです。

とても神秘的なものを感じます。大袈裟かもしれませんが、ChatGPTは単なるテクノロジーではなく、もしかしたらもっと未知の世界につながる扉なのかもしれません。。

ChatGPTの内部について少しでも知っておけば、そのような可能性、さらにはこれから予想もしない進化を遂げた時に、どう向き合うか自分で考えることができる気がします。ぜひこれらの本を読みながら、AIが織り成す未来に思いを馳せてみていただければと思います。

大規模言語モデルは新たな知能か岡野原大輔、2023.06

日本のAIのトップ企業であるPreferred Networks（PFN）の共同創業者による著書です。ChatGPTに代表される「大規模言語モデル」の活用、リスク、課題、登場までの経緯、そしてその内部について、一般向けにわかりやすく説明してくれます。

なかでも第６章の「大規模言語モデルはどのように動いているか」では、ニューラルネットワーク、ディープラーニングから、大規模言語モデルを実現したトランスフォーマーまでを50頁ほどでコンパクトにまとめられているのが非常に貴重です。ここだけでもしっかりと読めば、トランスフォーマーの肝ともいえる「自己注意機構（Attention）」までざっくりとわかります。

さらに、終章の「人は人以外の知能とどのように付き合うべきか」を読めば、AIとのポジティブな向き合い方がわかります。大規模言語モデルを人以外の知能ととらえる視点が非常に面白いと思いました。そう考えれば、人間とAIの共栄こそが、望ましい姿であることがわかります。

大規模言語モデルは新たな知能か――ChatGPTが変えた世界 (岩波科学ライブラリー)

岩波書店

Amazonで見る

Amazonで検索

ChatGPTの頭の中 Stephen Wolfram、稲葉通将 (監訳)、高橋聡 (訳)、2023.07

数学科や物理科ではおなじみだと思いますが、「Mathematica 」という数式処理システムがあります。1980年代にリリースされ、常に数式処理の代表的なシステムとして広く利用されています。そのネーミングについては、当初の案をスティーブ・ジョブズに相談したらダサいと言われて変更したエピソードまであります。その「Mathematica」の開発者がこの本の著者です。

本書では、ChatGPTの原理を丁寧に解説しています。「大規模言語モデルは新たな知能か」と同様にニューラルネットワークから順を追って説明されています。ただし、説明の仕方が異なります。こちらは数学的な説明が多いので、２冊両方を読めばかなり理解が深まると思います。

本書の中で特に興味深かったのが、「たった」数千億個のパラメータからなるニューラルネットワークで、ChatGPTがこれだけの成果を出せたということは、もしかしたら人間の言語にはもっとシンプルな規則が存在することの暗示ではないかという考え方です。

このように本書では、人間の言語との関連性について様々な考察がされています。なかでも、ChatGPTは「人間のような部分」は実にうまくこなすという特徴は、今後の付き合い方を考えるうえで非常に重要だと思います。つまり、後から厳密性を補う必要があります。私たちが文章を書くときも、曖昧さをなくすために後から推敲します。ChatGPTについても、出力をそのまま使うのではなく、推敲が重要になります。

本書は哲学的な記述も多いので、実にいろんなことを考えさせてくれます。ChatGPTの成功が暗示するものは何なのか、筆者と一緒に考えてみてはいかがでしょうか。