歴史転換期におけるChatGPTのビジネス活用の展望〜松尾豊教授 × PKSHA代表 上野山勝也 対談〜
プロンプトという「変なもの」、巨大テック企業が「戦闘速度」で競争開始、スタートアップにはチャンスあり
2023年4月4日、東京大学 松尾豊教授 × PKSHA代表 上野山勝也による対談が行われました。OpenAIが2022年11月にサービスを提供開始したChatGPTの可能性はどのようなものか。またChatGPTをめぐり日本企業はどのような態度を取るべきか——それらの問題意識を深掘りした議論の全容をここに公開します。
対談は以下の6つの「テーマ」に関して語り合うスタイルで進められました。
テーマ1:「ChatGPT」は一時的トレンドか技術的転換か
松尾 ChatGPTは一時的なトレンドなどではない。使うと分かるが、そうとう深く学習している。ChatGPTの動作は大規模言語モデルが次の単語の予測(next token prediction)をやっているだけだが、モデル作成の過程で相当複雑な概念の操作を学習している。それをプロンプトでうまく引き出すと「いい答」が出てくる。これは従来のAIではできなかったこと。世の中に広まることは間違いない。
上野山 インターネット上のデータを学習し、抽象化・圧縮してモデルに置き換えているのだと思いますが、それが新しい「知」を生んでいるのか否か。「私と松尾先生のお話を作って下さい」というと、AIが話を作ってくれます。それはインターネット上にはない情報。これは新しい知識を生み出しているのでしょうか?
松尾 生み出していると思います。人間とAIのコンビネーションで生み出している。GPTがやっていることは問いに対する類型化か混ぜ合わせだ。学習しているのはインターネット上のデータだが、「僕と上野山さんの話を書いてください」というのはある種の混ぜ合わせ。だいたいの創造は類型化と混ぜ合わせなので、ChatGPTがやっていることは、かなり創造的だと思う。
今まではクラスタリング(注:ラベルなしの分類)やクラシフィケーション(注:ラベル付きの分類)はできても、それを生成側で適切に混ぜ合わせることができず、類型化と混ぜ合わせの両方の要素を含む文は書けなかった。
上野山 では、GPTにできなくて人間ができるもう一段高次な知能とはなんでしょうか?
松尾 目的を考えることです。人間には「楽しい」ことや「嬉しい」ことがある。これは報酬系、脳でいうと大脳基底核(注:大脳の深部にあり運動調節・認知機能・感情・動機づけや学習などを司る)の機能。人間は「嬉しいこと」や「楽しいこと」をしたい、そのためにはどうすればいいかと考える。そこから派生して「世の中のためになる」といったいろいろな目的に照らして知能を使うことができる。ここがAIとの違いです。
テーマ2:AI研究者がみる「ChatGPT」の本質的な価値
上野山 ChatGPTをめぐって研究界隈は湧いているんですか?
松尾 騒然としているんじゃないですか。いろいろな意味で変わり目にある。先日、言語処理学会が沖縄で開かれて「ChatGPTで自然言語処理は終わるのか?」というパネルがありました。ただ、松尾研の中で話していたことですが、今まではディープラーニングの研究が進むと論文が出ていた。それが産業化するにつれてクローズになってきた。アカデミアでできる研究が限られてくるかもしれません。
テーマ3:「ChatGPT」は日本人の日常生活をどう変えるか
松尾 相当変えるんじゃないですか。上野山さんは「世の中の問題のほとんどはコミュニケーションの問題」だと言っているが、その大半が解決するか、大幅に軽減される可能性がある。
上野山 補足しますと、私が学生の頃に仮説を一個立てました。「世の中で、こんなにもみんなががんばっているのに、解けない問題がある。その根底にあるのはコミュニケーションの不具合ではないか」という仮説です。いろいろな問題があります。例えば私が松尾先生に集中すると、会場にいる皆さんの顔が急に見えなくなっていく。同様に、例えば政治家やNPOの人でも、何かしら自分が問題だと思っている課題にフォーカスしている間は他の課題が見えなくなっていると思います。人間の脳の認知が有限であるがゆえに、いろいろな問題が解けない。
そこでどうするか。我々の会社ではFuture of Work、AI powered Workplaceという話をしているんですけど、社内でチャットエージェントを解き放つんです。大企業の社内のコミュニケーションは「壊れている」可能性があります。例えばある事業部が「こういうことをやりたい」と言うと、実は別の事業部が2年前に検討してある理由でできなかったことが分かったりする。これは明らかにコミュニケーションロスです。
そこにAIエージェントを介在させる。まずAIエージェントと話せば、その内容を適切な相手に伝えてくれるようになるかもしれません。このようにAIは人間の組織が持っているコミュニケーション構造を根底から変える可能性がある。これはめちゃくちゃ面白いことです。
松尾 僕の周りの人も、ほとんどの人は情報加工業を営んでいる。今日の参加者の皆さんは記者が多いですが、情報加工業として入ってきた情報を加工してアウトプットしている。ほとんどの方がメールを受け取ったり、ウェブを調べたり、人から話を聞いたりして何かにまとめる。これは情報加工業であって、AIが発達すると情報流通業における中抜きがおこる。エンドポイントしか価値がなくなり、一番先端で情報を作っている人か、最後の消費者しか価値がなくなる。「日常生活をどう変えるか」という問いに対してはそういう説明の仕方もある。
上野山 日常生活では、学習や教育はどうでしょうか。
松尾 教育の話はよく質問されるのですが、分からないですね。教育分野は今まで、技術や社会背景が急激には変わらない中で、20年、30年、40年と「どういう教育がいいか、悪いか」という話をしてきた。ところがChatGPTの登場で3カ月前から世の中が激変している。「そういうスピード感の中で、10年、20年単位の教育について分かる訳がないじゃないですか」と言っても許してもらえない(笑)。
ただ、うまく使えばAIを使うことで「学び」のいいツールができるはずです。従来は先生が教室の全員に教えないといけなかったから個別の学びができていなかった。そこはかなり変わってくる。
上野山 「GPTと会話することで、どういう学習ができて、どういう学習ができないのか」という問いを今立ててみました。どうでしょうか。
松尾 ほとんどの学習はできますよね。
上野山 そうなんですか? 例えばですけど、「今後教育で何が大事ですか」と聞かれたときの私の「仮説1」は、ロバストネスというか、環境が変わっても適応できるような能力です。それってGPTで学習できますか。
松尾 それは今の教育でもあまりできていない部分ではある。
上野山 AIの変化はここ10年ずっと起こっていて、松尾先生は「ディープラーニングは凄い」と言っていた。GPTのようなLLM(大規模言語モデル)は何かというと巨大なディープラーニングネットワークなんですよね。ネットが巨大になり、学習方法の創意工夫とともに人と話せるレベルに届いてきた。これは非連続に「ぼん」と動いたというより、インクリメンタルな変化を続けているうちにユーザーに届いちゃった。それがChatGPTの形で爆発的に普及している。
松尾 今、私たちはこうやって喋ってますけど、例えば岸田総理が喋るとき、こんなに「生」では喋らないですよね。セリフが決まっていて、それ以外喋らない。そう考えると、ここでAR(拡張現実)グラスをかけて、そこにAIのアシストで「これを喋ったらいい」とか「これを喋ったらまずい」という表示が出るのが普通になるかもしれない。そうなると、生身で喋ると「怖い」と感じるようになるかもしれない。「失言して失職したらどうしよう」とか(笑)。
上野山 実際、AI SaaSのプロトタイピングが世界中で盛んです。Zoomミーティングの横で営業サポートしてくれるエージェントもありますし、エンジニアが遊びでARグラスを付けて、質問されたらテキストを載せるようなことはやり始めています。
松尾 こういうイベントでも、その辺のモニターに質問ポイントがいくつか表示されるようになるかもしれませんね。
上野山 次にどうしようかと考えていると、ここに(モニターにサジェストが)出てくれると。
松尾 そうすると我々は読み上げているだけになる(笑)。
上野山 それは、仕事が、教育が、人間がどうなるんだろうという問いにつながってくると思います。
テーマ4:「ChatGPT」活用を事業成長につなげるためには
松尾 このテーマも面白い。いろんな活用の仕方があると思います。
上野山 ChatGPTというか、LLMをどう使うか。事業を考えるとき、事業主体の会社をいくつかに分類して考えた方がいいと思っています。日本を代表するジャパニーズ・トラディショナル・カンパニー、いわゆるソフトウェア企業じゃない企業の話と、ソフトウェア企業の話と、スタートアップで、ぜんぶゲームのルールが違うかなと思います。
トラディショナル・カンパニーではAI/DXの流れが加速する。「AIをどう使うか」という話とDXの課題は相似形になっている。伝統的な大企業がデジタルを導入すると実インパクトは大きい。
今までのAIはソフトウェアのバックエンドで動いていたんですよね。ChatGPTでは貫通してフロントエンドに関わる。これで、かなりいろいろな事ができると思います。ソフトウェアと対話できるアプリケーションをいくらでも作れるようになる。人事システムも、そういうものになるかもしれない。動的システムをどうデザインするか、大きな会社の人事システムをどうするか。今まであまり議論されなかったタブーの領域と重なってくる。そこで本質的な議論ができるかどうかが問われている。
一方、我々はAI SaaSをコミュニケーション領域でやっています。我々はChatGPTが出る前は、人とソフトウェアを最も日本語で対話させていた会社です。だから「ChatGPTを自社製品にうまく組み込む」が基本的な結論です。ブースターになるんですよね。いままでできなかった雑談の領域に広げられる。我々のようなソフトウェア企業、スタートアップ企業はAIをうまく使えば良い。ゼロイチをやっている人達は新しいチャンスがあるので、面白いタイミングといえます。
松尾 その通りなんですけど、強調したい点はプロンプトエンジニアリングという「変なもの」が生まれた点です。僕が自民党で喋ったスライド(注:https://note.com/api/v2/attachments/download/a29a2e6b5b35b75baf42a8025d68c175)がやたらバズっていろいろな人に見てもらったんだけど、あれの続編でプロンプトエンジニアリングについて書いた方がいいと思っています。
例えばChatGPTと社内にある顧客DBを連携させようとしたときどうするか。これが、めちゃくちゃ面白いんですね。LangChain(注:大規模言語モデルを利用したサービス開発のためのフレームワーク)などが中でやっている話なんですけど、ChatGPTが顧客と対話する。そのとき、プロンプトで「あなたはスポーツジムの申込みを担当するアシスタントです。お客さんと話してどのプランがいいか案内してください」と書いておくと、案内してくれる。
そこで、お客さんが過去に来たことがあるかどうかを調べるには、社内の顧客DB(データベース)を引きにいかないといけない。そこで「お名前を聞かせてください」とAIが言う。お客が「松尾豊だ」というと、社内DBに「松尾豊」を検索するクエリーを出して顧客IDを取り、その人の入会履歴などを取りにいく。ChatGPTはお客さんとシステム側の両方と話をするわけです。そのやり方をプロンプトに書いておく。「あなたはアシスタントです」と書いた次に「こういうツールがあります」、「データベースをアクセスできて、お客さんからIDを得られます。IDから購入履歴を得られます。ツールを使うかどうかもyesかnoで選択してください」というプロンプトを書くんですよ。AIが「ツールを使いますか?」と出して、お客が「yes」と回答すると、返答をお客さんに投げるのではなくシステム側に投げる。システムのDBを引いて、返ってきたものをChatGPTの結果に入れて教えてあげる。これがプロンプトという、日本語ないし英語で書かれているんですよ。こんな変なプログラミングはありますか。
両方にどう喋ったら良いかも指示書で書く。変数名を定義すると勝手に値が入る。顧客の「楽しさ」を定義するだけで、楽しさを勝手に計算してくれる。今までにない変なものが生まれている感があって。従来のプログラミングのパラダイムとChatGPTのつなぎ目というか、非常に不思議な現象が起こっている。
上野山 いまの現象を人が認知できる一つの解釈としては、文字ドキュメントを大量に学習すると、その中に内在している現実世界の縮図のようなものをモデルの内部表現で持っていて、それを操作する指示書がプロンプトになっていて、という感じなんですかね。
松尾 そうです。人間の世界の法律や社内規定も一種のプロンプトですよね。何かのマニュアルのような手順書に「こういう手順でやってください」と書くと、人間というLLMを備えた知性が手順書を見てその通りに動く。それで工場などが稼働する。そう考えると、むしろ今までのプログラミングが変で、LLMをどう動かすかの一連の手順書の方がこれまでの人間社会ではよく用いられてきた。そういうパラダイムが揺れ動いている。新しいものが出来つつある。
上野山 昔考えていたワールドモデルは連続空間上の、現実の物理空間の抽出モデルだった気がします。今の話は、言語ドキュメントを抽象化した離散空間の中に世界が存在するということですね。
松尾 それをちゃんと学習しちゃっている。離散空間の、記号の、言語の空間の中での世界モデルを学習しているし、必要ないろいろな概念、行動概念も学習しちゃっている。
上野山 それはある種の抽象化なので、新しい知が生まれている訳ではないのでは。その解釈だとクリエーション(創造)はできないのかなと。
松尾 クリエーションとは何かという話になりますが、内挿ではなく外挿はクリエーションと呼ばれることが多かった。「僕と上野山さんの話を作って下さい」というのはクリエーションと呼ばれることが多かった。でもChatGPTが出てきて、それが出来てしまう。なので、もはやそれをクリエーションに入れない(笑)。コンピュータにできることが増えると、人間は戦いを避けるので定義を変える。
上野山 クリエーションのどの領域がAIに食われて、どの領域が残るのでしょうか?
松尾 1割ぐらいのクリエーションは残ると思うんだけど、9割のクリエーションと称していたものは、単なる類型化+混ぜ合わせです、ということになる気がします。
上野山 発見みたいなもの、知の構造のホワイトスペースを見つけるようなことはAIにできますか?
松尾 それも普段は一緒にしない二つのことの混ぜ合わせでできる。それがどれくらい自明かどうかに関わってくる。
テーマ5:コミュニケーションテクノロジーの未来
上野山 ここは弊社の話も絡めて話しますけど、我々は顧客接点と社内コミュニケーションの2つの領域にAIエージェントをばら撒きまくるということをずっとやっていまして。いまだいたい5000体ぐらいのロボ、というかAIエージェントが動いています。人とインタラクションして、会話したりソフトウェアを操作したりしています。
これがGPTでさらに知能化すると思います。例えばマネージャのマネージメント能力を拡張するため動き回ることもあると思います。例えばサッカーチームのコーチがやっている事は、選手の顔色を見て「今日、大丈夫か?」と声をかける。その解像度と量が多いとチームが強くなるんです。同じように、人と人の間にAIエージェントが介在して、例えばLINEでプッシュしてコミュニケーションすることで、チームが強くなる要素を注入できる。
AIによってコミュニケーションがエンパワーされたり、コミュニケーションの悲劇的な不具合が減っていくことになると思います。今、企業の中で部下と上司の個別面談のコミュニケーションのような状況を考えると、けっこう壊れていますよね。お互い分かってくれない。そこをサポートしてくれるツールが増えてくると思います。
企業と顧客のつながりにおいても同じことが言えます。コンタクトセンターへの顧客の連絡の2割ぐらいがクレーム。5%ぐらいは「誰かと話したい」という理由で抗議の電話をしてくる。そういう理不尽な電話を、会ったこともない人が受けて平謝りしている。そういうものもソフトウェアによって滑らかになっていく。
松尾 コミュニケーションの問題が増えているのにも関係しますけど、お客さんが欲しいもの、嫌なものをちゃんと認識できていないから、いろいろな事が起こる。そこを直していきたいのに、社内でいろいろな事が分かってもらえなくて動けない。新しい技術を使えばもっといいことができるのに、それが事業側や営業側に伝わっていない。
そう考えると、例えば政治家も、社会を構成する人々が「こうしたい」と思っている事を、町内会で挨拶したり飲み会で飲んだりしながら一人一人聞き取りをし、それから全体の意思を汲み取っていくんですけど、もっといいやり方があるんじゃないか。
上野山 それがEBPM(注:エビデンス・ベースト・ポリシー・メイキング。証拠に基づく政策立案)の本格形になる可能性はあって。政治家の方が——誰か計算していましたけど——365日、1人10分会い続けて挨拶し続けて、ようやく投票規模の数パーセント、そもそも認知できない。AIコミュニケーションツールを使うことで、そういう状況が変わる可能性があります。
松尾 そういうふうにやろうとしながら、一部しか見えない人がいて、その人がまたいろんな事をいったりするので、全体がいい方向にいかないとか、いろんな問題が発生しているんですね。
上野山 学校だとモンスターペアレントとか、コンタクトセンターでも一部のクレーマーに1電話で2時間もかかって、オペレーターの心が壊れていく。そうではなく、AIエージェントがクレームをする人をうまくなだめてくれるべきです。人が平謝りするのは、おかしい。
松尾 最後には人が平謝りしてもいいかもしれないですが、もうちょっと貴重な資源として使いたいですよね。
テーマ6:AIの新時代における日本企業の勝機につなげるには?
松尾 難しいですねえ。LLMを作った方がいいんじゃないですかね。
上野山 たぶん、そうだと思います。確実に、LLMも今後いろいろなものが出てきたり、レイヤー構造に分かれると思いますので、どのレベルのLLMかという議論はありますけど、何も作らないのはあり得ない。
松尾 その上で、どういうアプリケーションを作っていくのか、それが日本のローカルな産業として成り立つのはいいんだけど、日本企業の勝機というからにはグローバルで勝ち目があるのかということですよね。
上野山 日本規模ですらLLMを作るの、という議論が出て足踏みするということは、もっと小さな国はどうするんだ、という話になる。イギリスが1000億円ぐらい予算を付けるとか(注:英国は2023年春期予算でAI用スーパーコンピュータに9億ポンド、約1457億円を計上)。
松尾 イタリアは一時禁止(注:2023年3月31日、イタリア政府データ保護当局はプライバシー侵害などを理由にChatGPTの禁止措置を発表)。
上野山 例えばアジア全体で医療に特化したモデルをデータ共有しながら作る、それを日本がリードすることはありえる。
松尾 新時代なので、今この瞬間は何をやっても、何に関してもチャンスがあると思うんですよね。ぜひ大きな構想をやっていきたいですよね。
上野山 私も10年ぐらいビジネスを手がけましたが、今ほど新しくフロンティアが開けている瞬間は珍しい。松尾先生、インターネットやスマホが出てきたときと比べてどうですか?
松尾 今回はChatGPTという、OpenAIからしても予想外のクリーンヒットが生まれてしまったが故に、期せずして「ヨーイドン」の一斉競争になってしまった感があります。LLMが着々と性能を上げて、それが凄いということは研究者の間では広まっていた。それが昨年の11月30日にChatGPTが公開されて、史上最速の速さで1億人が使うようになり、一気に多くの人が理解してしまった。みんな話題にするし、お金も人もそちらに流れる。そういう未来がくると、みんなが信じちゃった。そういう意味ではヨーイドン感は強い。
インターネットの時には一部の「分かっている人」がやっていて、それが時間をかけてじわじわと広がった。古い人たちは「オタクのものだ」とバカにしていたんだけど、バカにしている間にインターネットはどんどん強くなった。
AIの場合は違う。ほとんどの人が「これはヤバい」と思っている。Big Tech(注:巨大テック企業、いわゆるGAFA)も凄い勢いで本気を出して走り始めている。しかもみんな速い。そこでイーロン・マスクも「半年止まろうよ」と言い出す。
これで強さとは速さだと再認識しました。今までのBig Techはだいたい勝負が決まっていたので、速いとはいっても巡航速度だったんですけど、今は戦闘モードですよね。
上野山 松尾先生はずっと前から、日本企業でも強い企業は顧客のニーズを吸い上げてプロダクトに反映するサイクルが爆速に速いんだと言っていました。キーエンスのように「強い」といわれるほとんどの会社の特徴はハイサイクルだと。
松尾 ハイサイクルが大事、スピードが大事、ということを言ってきた自分は遅かった、みたいな感じです(笑)。この2カ月ぐらい、OpenAIとかMicrosoftのスピードを見ると「自分はなんて遅いんだろう」と再認識して絶望的な気分になっています。もっと速く動かないといけない。
編集部より
PKSHA Technologyでは、2012年の創業以来一貫して自然言語処理技術の研究・開発に取組んでいますが、今後、更に社会実装を加速するため、PKSHA AI Solution「PKSHA LLMS(パークシャ エルエルエムズ)」をリリースしました。「PKSHA LLMS」は複数の大規模言語モデル(LLM)を統合的にカスタマイズできる環境を提供します。
また、LLMを始めとする生成AIがもたらす新たな市場機会に対し、様々なスタートアップと連携し事業を創造していくため、松尾研究所と共同でベンチャーキャピタルファンドを設立しました。AI領域におけるPKSHAと松尾研究所の知恵と経験を結集する事で、投資先企業の成長を後押しします。
技術がかつてないスピードで進化しAIが盛り上がりを見せる中、これらの先端技術を追い風にし、あらゆる事業にとっての価値につなげることが必要不可欠です。PKSHAグループは長年のAI・ソフトウエアの社会実装の実績のもと、様々な角度から「人と共進化する未来のソフトウエア」の展開を加速していきます。