ChatGPTですが、中身について語るサイトが余りないので、ちょびっと解説。ChatGPTのGPTとは、Generative Pre-trained Transformerの略。簡単に言えば、従来の自然言語処理には大規模なデータセットが必要かつ、(正しいことを教える)トレーニングも必要なためコストと時間がかかっていたのですが、新たな大規模言語モデル(LLM)が提案され、これにより少ない事前トレーニングでより洗練された出力が可能になりました。
ChatGPTで使用されている、GPT-3(最新ですが、微調整版の3.5がある)では、約45TBの大規模なテキストデータのコーパス(データベース)から、高い精度である単語の次にくる単語の予測を事前に学習しているため、あたかも人間が書いたような文章を自動で生成することができるのは、今話題になっているとおりです。(この前まではコーパスが小さくたいしたことは無かった) ChatGPTはOpenAIがリリースしたものですが、中身は下記URLで。
もともと、このLLMはGoogleとトロント大学の研究者により発表されたBERT(2017年発表)と呼ばれる言語モデルが発端です。なので、Googleが最近発表した(デモでどじった)BARDの言語モデルはLaMDAですが、これもLLMのGoogle版です。
Siriと何が違うのかというのもありますが、Siriは音声認識が主眼です。認識後は大規模なデータベースから、返答(や操作)が選ばれますが、質問に対する応えは外部の知識データサービスを使っていたり、単に外部のサイトを教えてくれるだけです。ナンセンスな答えも用意されており楽しませてくれたりもしますが、これは大量の返答データセットを用意しているだけでしょうから、今後はChatGPTのようなサービスが追加で組み込まれる可能性は高いですね。
ともかく、LLMがさらに研究され様々な用途に適応されるのは明らかでしょう。
#ちょびっと解説
#ChatGPT
OpenAIとは
https://ja.wikipedia.org/wiki/OpenAI
https://www.intellilink.co.jp/column/ai/2022/070800.aspx