生成AIの概要について
世の中のトレンドとして昨今注目されている生成AI、私たちも生成AIをどう自社のビジネスと結びつけて新しい価値を提供できるのか、をテーマに検証や議論を繰り返してきました。その過程で得た知見を共有したいと思います。
まず、生成AIでできることは何か?というところから話を展開します。生成AIは名前の通り、何かを作り出すことができるAIのことです。例えば、テキストを生成したり、画像を生成したり、動画を生成したりすることができます。非常に高品質な画像やテキストを生成することができるため、ビジネスへの応用の期待が非常に高まっています。
本ブログでは、生成AIの中でもテキスト(大規模言語モデル:LLM)に着目して考えます。私たちのビジネス(特にBtoB)において、画像生成や音声生成が必要になるケースよりも、テキスト生成が重要になるケースが圧倒的に多いと考えられるためです。
大規模言語モデル(LLM)について深掘りする
では、LLMについて深掘りしていきましょう。LLMは入力と出力に自然言語を利用します。
自然言語は私たち人と人とのコミュニケーションのツールです。私たちの普段のコミュニケーションツール(自然言語)を入力/出力としたシステムを作ることができる、ということになります。自然言語による入力・出力が重要となるシステムにおいてはLLMの利用が好ましいケースであると考えられます。
身近なケースとしては、Q&A用のチャットボットがイメージしやすいかと思います。自然言語で色々な観点からの質問を受け付け、自然言語で回答する必要があります。
そのほかの例として、自然言語が重要な役割を担うケースとしては「翻訳」や「要約」もあります。LLMは翻訳も得意なため、様々な言語での問い合わせに対して、それぞれの言語で回答することも可能です。また、大量の文章を要約して重要なポイントに絞って回答することもできます。
重要ポイント:システムにおいて自然言語による入力・出力が重要なケースではLLMは相性が良い(チャットボット、翻訳、要約など)
LLMはテキスト生成モデルですが、役割を持たせることで専用のアシスタントとして利用することもできます。
例えば、「あなたは優秀なプログラマーです」や、「あなた英語の先生です」といった形で役割を与えることで、その役割に沿った回答を生成することができます。優秀なプログラマーという役割を与えることで、プログラミングのアドバイスを受けたり、英語の先生という役割を与えることで、英語学習のアドバイスを受けたりすることができます。
重要ポイント:LLMのプロンプトに役割を与えることにより、専用のアシスタントを作ることができる
また、LLMの応用として、LLMを利用したエージェント機能についても注目されています。
Lilian+’23 – LLM Powered Autonomous Agents.
LLM単体ではインターネットからデータを検索したり、数値計算が苦手といった弱点があります。しかし、LLMを頭脳として利用し、複数のツールを連携することでより高度なことを実現することができます。
例えば、「明日の京都の平均気温と湿度を教えて」とエージェントに質問するとエージェントは回答までのプランを作成し、それを実行して回答を導きます。
ある程度想定されるユースケースであれば、自然言語で作業を依頼し、エージェントが自動的に判断して処理を実行することができます。
AIエージェントはユーザからのリクエストに対して、自動的に必要なタスクを組み立て、実行、要求を満たしているのかチェック、までのサイクルを自動的に繰り返します。これにより、AIエージェントが自律的に行動することが可能になります。
重要ポイント:AIエージェントを利用することで、ユーザからのリクエストに対して、自動で必要な作業を組み立て、実行、チェックまでできる
私たちのビジネスとLLMをどう結びつけるのか
ここまでで簡単にLLMについて説明してきました。では、ここからLLMをどうビジネスに適用するのか、という部分を説明します。私たちIoT.kyotoではお客様のDX支援をビジネスの軸として展開しています。
話をより具体的にするために、以下の仮想的な顧客について考えたいと思います。
要求仕様: 工業内の特定の区画の温度管理を実施したい 空調などはなく、夏場に温度が上がりすぎると機器に悪影響を与える可能性があるため、現状把握を実施したい |
まず、今回のユースケースにおいて自然言語の入力・出力が重要であるかを考えます。温度変化の可視化ということであれば、基本的にはグラフでの時系列データの表示などが一般的でしょう。システムを作成する場合に重要となるのは、顧客の課題に対して最適な解決策を提示すること、です。今回のケースにおいては自然言語を利用するよりもグラフ表示の方がはるかに適しています。
ここでお気づきかもしれませんが、顧客課題に対する最適解において、自然言語が最適解になるケースはあまり多くありません。自然言語は非常に柔軟な入力である一方、多くの曖昧さを含むことになります。理想的なシステムは多くの人が迷いなく利用でき、期待する結果が返ってくるように作成すべきです。そう考えると、入力を自然言語にするよりも、例えば選択式のボタンにする、といった方が適していることが多いと思います。入力を自然言語にすると、何を入力をするのかわかりにくく、逆に使いにくくなるケースも多くあります。
重要ポイント:システム作成においてLLMが最適解となるケースはそこまで多くない
では、私たちのビジネス領域においてLLMは全く利用できないものなのでしょうか。BotBにおけるLLMのユースケースとしては以下が検討されることが多いと思います。
- データの検索(RAG:検索拡張生成)
- ドキュメントの作成
企業には多くのデータが存在しており、それを効率よく検索するニーズは非常に高いです。また、議事録や定型のレポートの作成など多くのドキュメントの作成業務が存在しています。一般的にはこれらのユースケースにおいて自然言語が利用されることが多く、LLMは有効であると考えられます。
LLM導入における注意点
LLMは過去のデータに基づいて新しいデータを生成します。つまり、生成したテキストが正しいという保証がありません。ハルシネーションとは、生成AIが事実とは異なる内容を生成する、という事象のことを指します。
過去の事例でもハルシネーションが原因で損失が発生したり(エア・カナダの例)、企業の株価が低下した例(Googleの例)もあります。
LLMが出力するデータは間違っている可能性がある、という点を考慮しシステム作成をすることが重要です。
また、セキュリティについても考慮が必要です。例えば、プロンプトに機微な情報が含まれる場合、その情報を返すと情報漏洩に繋がります。また、本来の用途とは関係ない情報(差別的、宗教的、政治的な内容)を返すことも好ましくありません。自然言語というより自由な選択肢を利用するからこそ、システムとしてより多くの不確定要素を抱えることになる、という点を理解する必要があります。
最後に
ビジネスに生成AI(特にLLM)をどう取り入れていくのか、について私たちIoT.kyotoの知見を共有しました。生成AIは現在非常に早い速度で技術革新が起きています。特に業務効率化などの分野では非常に重要な技術として確立されつつあります。生成AIを用いることで可能性が広がりましたが、生成AIはあくまで技術、ツールの一つにしかすぎません。ツールを使うことを目的とせず、どの場面での利用が最適な使い方であるのかを見極めて使っていくことが重要であると考えています。