ChatGPT(OpenIAI)、Copilot(Microsoft)、Gemini(Google)などの生成AIが話題になっています。実際に利用されている方も少なくないのではないでしょうか。
今回は、生成AIにおける「学習」の基本的な仕組みを解説しましょう。
生成AIを定義するのはなかなか難しいのですが。
現在の生成AIの用途から考えると、「たくさんの情報(データ)から学習して、新しい文章や画像、音楽などを自動的に作り出すことができるコンピュータープログラム」といったところでしょうか。
多くの本を読んだ人が新しい物語を書いたり、多くの絵を見た人が新しい絵を描いたりするように、AIが学習した内容をもとに、これまで世の中になかった、オリジナルのコンテンツを生み出すことができるのが、生成AIです。
生成AIができることをピックアップしましょう。
- 文章の作成
ブログ記事、メール、レポートなど、様々な種類の文章を作成できます。 - 文章の要約
- 文章の翻訳
- 質問への回答・対話
質問に対して自然な文章で答えたり、チャットボットとして対話したりできます。 - アイデア出し
キャッチコピーや企画のタイトルなど、新しいアイデアを提案してくれます。 - 画像の生成
言葉による指示(プロンプト)に基づいて、写真のようなリアルな画像やイラスト、デザインなどを生成できます。 - プログラムコードの生成
コンピュータープログラムのコードを作成したり、修正したりするのを手伝います。 - 分析や提案
与えられたテーマについて、分析レポートを作成することができます。
その他にも、動画・音声・音楽などを生成・編集できる生成AIも誕生しています。
生成AIは、人間が経験から学ぶように、「学習(トレーニング)」と呼ばれるプロセスを通じて知識を身につけます。具体的には、インターネット上の文章、たくさんの画像、音楽など、膨大な量の「お手本」となるデータをコンピューターが読み込み、分析します。
この過程でAIは、データの中に隠されたパターンやルール、関連性を見つけ出そうとします。
例えば、文章データなら、「『こんにちは』の後には『元気ですか?』が来やすい」といった言葉の繋がりや文法ルールを学習します。
例えば、画像データなら、「猫の絵には、とがった耳とひげがあることが多い」といった特徴を捉えます。
このように、大量のお手本データに触れることで、AIはその分野の「コツ」のようなものを掴んでいきます。
AIの学習プロセスを、私たちの身近な学習に例えてみましょう。
- 料理のレシピを覚えるシェフ
AIの学習は、料理人がたくさんのレシピを読んで料理を覚えるのに似ています。
何千ものレシピ(学習データ)を読むことで、料理人はどの材料をどう組み合わせると美味しくなるか、どのような手順で調理すればよいか、といった料理の法則(パターン)を学びます。
たくさんのレシピを学べば学ぶほど、料理人は料理全般について深く理解できるようになります。同様に、生成AIも大量のデータからその世界の法則を学んでいるのです。 - 絵の描き方を学ぶ画家
画家がたくさんの名画を見て描き方を学ぶように、画像生成AIも大量の画像データから学習します。様々な絵画(学習データ)を見ることで、形、色、構図、特定の画家のスタイル(パターン)などを理解していきます。そして、学んだ知識をもとに、新しい絵を描けるようになるのです。 - 動物を覚える子ども
子どもが「犬」というものを覚えるとき、たくさんの犬の写真を見たり、実際に触れ合ったりします。その中で、「耳があって、鼻があって、しっぽを振る」といった共通の特徴(パターン)を見つけ出し、「犬とはこういうものだ」と学習していきます。生成AIも、データの中から共通の特徴を見つけ出して、物事を「理解」していくのです。
このように、生成AIは大量のお手本からパターンやルールを抽出し、それを知識として蓄積していくわけです。
生成AIが賢くなるためには、学習に使うデータの「量」と「質」が極めて重要です。
AIは与えられたデータからしか学習できないため、データの内容がAIの性能や性格を大きく左右してしまうからです。
学習データに偏りがあると、AIの考え方にも偏りが生まれてしまいます。
もし、医者の画像ばかり学習したAIがいたら、「医者=男性」という偏見を持ってしまうかもしれません。また、学習データに間違った情報が含まれていれば、AIもそれを正しいこととして学習してしまい、間違った情報を生成する原因になります。
そのため、質の高い、多様で偏りのないデータを大量に用意することが、賢くて公平なAIを作る上で非常に大切なのです。この学習データの重要性は、後で説明するAIの注意点(間違いや偏見など)にも深く関わってきます。
また、生成AIにおける学習とは、人間とは違い、「理解」ではなく「統計的なパターン認識」であることにも留意すべきです。
AIは、大量のデータの中から、「この単語の後には、この単語が来る確率が高い」「こういうピクセルの並びは『猫』と呼ばれることが多い」といった、データ上の関連性や頻度を計算し、それをモデル(AIの脳)に記録していきます。人間のように言葉の意味や世界の仕組みの本質を把握し、本当に「理解」しているわけではありません。
生成AIの「統計的なパターン認識」という性質を知っておくことは重要です。
なぜなら、これがAIが時々、人間から見ると奇妙な間違い(ハルシネーション)を犯したり、文脈を読み間違えたりする理由だからです。
AIは、データの中に現れるパターンには非常に詳しいですが、データには書かれていない常識や、言葉の裏にあるニュアンスを理解することは苦手なのです。AIを過度に人間扱いせず、その能力と限界を正しく知ることが大切です。
以前、秋元通信では「ハルシネーション」についても解説記事を書いていますので参考にしてください。
※当該記事は本記事執筆の約半年前に執筆しました。生成AIはすさまじい勢いで進化しているため、この記事の内容に、現在の状況にそぐわない内容が含まれていることをご留意ください。
学習(トレーニング)を終えたAIは、新しいコンテンツを「生成」できる段階に入ります。このプロセスは「推論(Inference)」と呼ばれます。
推論とは、学習によって得た知識(パターンやルール)を使って、与えられた指示(プロンプト)に基づいて、新しいデータを作り出すことです。
AIが学習した知識を使って新しいものを生成する「推論」のプロセスも、身近な例で考えてみましょう。
- 料理のレシピ応用
たくさんのレシピを学んだシェフ(学習済みAI)に、「辛くて、野菜だけのパスタを作って」とお願い(プロンプト)したとします。シェフは、学んだパスタの作り方、野菜料理の知識、辛い味付けの知識(学習したパターン)を総動員して、今まで作ったことのない、リクエストに合った新しいパスタ(生成されたコンテンツ)を考案し、作り上げます。 - 絵の描き方応用
様々な画風を学んだ画家(学習済みAI)に、「ゴッホ風のタッチで、猫の絵を描いて」と依頼(プロンプト)します。画家は、「猫」の特徴と「ゴッホ風」の筆遣いや色使い(学習したパターン)を理解しているので、それらを組み合わせて、依頼通りの新しいスタイルの猫の絵(生成されたコンテンツ)を描き上げます。 - 動物園での識別
本や写真でたくさんの動物について学んだ(学習した)後、初めて動物園に行った(新しい状況)とします。目の前に見たことのない大きな動物がいても、その角や体の特徴(入力データ)から、「これはバッファローだな」と判断(推論)できます。これは、学んだ知識を新しい状況に適用している例です。AIも同様に、学習した知識を新しい指示(プロンプト)に適用して、答えや作品を生成するのです。
このように、推論とは、学習によって蓄積された知識を、新しい状況や要求に応じて応用し、具体的なアウトプットを生み出すプロセスなのです。
生成AIを使う上で、その学習の仕組みを知っておくことは極めて重要です。
なぜなら、これを知っておかないと生成AIのリスクをきちんと理解することができないからです。
次号では、生成AIのリスクや限界を考えていきます。