ChatGPT の説明 — AI 研究者からハーバードの学生へ

May 09 2023
ChatGPT でクールなものを構築するのに役立つ言語モデルの最も簡単な説明。誰でも視聴可能。

ChatGPT でクールなものを構築するのに役立つ言語モデルの最も簡単な説明。誰でも視聴可能。

CS50 は、ハーバード大学のコンピュータ サイエンス入門コースです。

彼らは、誰でも視聴できるように、Youtube チャンネルでChatGPT を説明する講義を公開しました。

この記事では、マギル大学の AI 行動の研究者であるSil Hamiltonによる ChatGPT の説明に焦点を当てます。

この簡単な説明は単純ですが有益でした。私の脳が情報を取り込むための最良の方法。

ChatGPTとは?

ChatGPT に付けられるさまざまな流行語があります。

これは、大規模な言語モデル、コンテンツ ジェネレーター、または単に便利なツールとして説明できます。

実際には、それはすべて3つです。モデルができることは非常に多いため、その機能にラベルを付けるのは困難です。それらを説明することはほとんどありません。

複雑なタスクにもかかわらず、Sil は ChatGPT を言語モデルとして説明します。

UnsplashのAndrew Neelによる写真

ChatGPT は言語モデルです。あれは何でしょう?

言語モデルは、人間の言語を理解して生成するように訓練された計算モデルです。

このモデルは、いくつかのボキャブラリで確率分布を生成します。

入力テキストのコンテキストに基づいて、文の次の単語またはシーケンスを予測しようとします。

たとえば、モデルに「I like to」というフレーズを与えると、モデルは最も可能性の高い答えを見つけようとします。

実際、私たちは日常的に言語モデルに遭遇しています。

たとえば、検索エンジンを介して。検索エンジンに「I like to」または任意のフレーズを入力すると、検索する可能性が最も高い単語の文字列を予測しようとします。

言語モデルはどのように機能しますか?

この記事では、最も基本的な説明を提供します。私はコンピュータ サイエンスの学生ではないので、私の脳が理解できる唯一の方法です。実際のメカニズムは、人々が一生かけて研究、研究、構築するものです。

ChatGPT は、命令チューニングと呼ばれるプロセスを通じて学習します。

基本的に、モデルにインターネットから多くの情報を提供します。これはディープ ラーニングとも呼ばれます。

このプロセスには、単語やフレーズ間の関係を理解するために、書籍、記事、インターネット テキストなどの大量のテキスト データが含まれます。

このモデルは、文法や構文などを含むデータの統計的パターンを分析して、言語の仕組みを理解します。

モデルにより多くの情報が与えられると、予測の精度が向上し、さらには少し賢くなります。

UnsplashのAlex Knightによる写真

質問と回答

ChatGPT は、質問と回答の形式でトレーニングされます。

インターネットによって強化された大規模なコンピューティング能力が与えられています。次に、その情報を使用して質問に答えるように訓練します。

これは、その作成者 (OpenAI の科学者) からの慎重なトレーニングが必要だったものです。

質問と回答の形式は、ChatGPT をあなたと私にとって非常に直感的にするものです. 質問としてプロンプトを入力すると、GPT からの応答が出力として期待されます。

質問と回答の形式により、ChatGPT は構築に優れた形式になっています。したがって、プラットフォームの将来は、モデルを操作してそのコンピューティング機能を使用する新しいツールを構築する開発者になるでしょう。これは、AutoGPT のような例ですでに見られます。AutoGPT は、本質的に、目標を達成するためのプロンプトを独自に作成します。

したがって、主なポイントは、ChatGPT はそれ自体が強力であるということですが、本当のブレークスルーはまだ見られていません.

それだけです…とりあえず

誰もが理解できる最新の AI の開発について詳しく知りたい場合は、フォローしてください。