この記事ではLLMについてまとめておこうと思う。ChatGPTを使いだすと必ずこの「LLM」という言葉が出てくるので、備忘録も兼ねて整理しておく。
LLMとは(Large Language Model)の頭文字を取った言葉で、日本語では「大規模言語モデル」と訳されいる。
LLMとは、膨大な量のテキストデータからパターンや関連性を学習することで、与えられた単語やフレーズのパターンや構造を捉え、それに基づいて反応する能力を持った「深層学習(ディープラーニング)モデル」であり、以下のようなことができる。
- 文章生成: 与えられたテーマやキーワードに基づいて、新しい文章を作成することができる
- 質問応答: ユーザーからの質問に対して、適切な答えを提供することができる
- 機械翻訳: 1つの言語で書かれた文章を、別の言語に変換することができる
- 文章要約: 長い文章を短く、要点を押さえた形でまとめることができる
これらは「自然言語処理タスク」と呼ばれ、この自然言語処理タスクを驚くべき精度で実行するのがLLMである。
代表的なLLMを挙げると以下のようなものがある。
- OpenAI:「GPT-3.5」「GPT-4」
- Google:「PaLM2」
- Google:「LaMDA」
- Meta LLaMA2
このように人間を超える能力を持っているように見えるLLMの注意点をおさえておこう。
- LLMの性能を最大限に引き出すためには、大量のデータと高度な計算能力が必要となる。膨大なエネルギーが必要とされるというわけだ。
- 単に学習データのパターンを学習するだけであり、人間のように意味を理解する能力はない。意味を理解して文章を作ったり、応答しているわけではないことをよく理解していないと、間違った利用方法になってしまう。
注意点は結構大事だな…。
最後にChatGPTとLLMの関係について整理しておく。結構、ごっちゃになって使い方があいまいになってしまうよね。
GPT-3.5、GPT-4はLLMの一種である。GPTとは「Generative Pre-trained Transformer」の頭文字をとっている。
ChatGPTはGPT-3.5もしくはGPT-4といったGPTモデルを利用して、会話形式のテキスト生成に特化した対話型AIサービスである、というわけだ。ChatGPTは正確に言うとLLMではない。
では。
コメント ログインすると書き込めます