最終更新日: 2023 年 11 月 13 日

人工知能と自然言語

自然言語処理 (NLP) アルゴリズムとは何ですか?

あ古典的な計算アルゴリズム有限 (有限のステップ数の後に停止する) および明確な (明確で正確な) 命令と操作の集合を使用して、特定のタスクを実行できます。言い換えれば、古典的なアルゴリズムは正確な結果を生成するようにプログラムされており、曖昧さがなく、適応の余地がありません。

あAIアルゴリズム明示的にプログラムせずにトレーニングデータから学習するように設計された人工ニューラルネットワークに基づいています。
AI アルゴリズムは、経験を積んで学習し、改善し続けることができるため、完成したものではありません。これらは、同様のデータ入力に対して異なる結果を生成するため、曖昧であることがよくあります。これらは非線形モデルであり、入力の小さな変動が出力の大きな変動につながる可能性があります。ニューラルネットワークに非常に多くのパラメータがあるのはこのためです。これらの設定は、トレーニングプロセス中に接続の重みがどのように調整されるかを制御します。

接続の重みを調整する概念は何ですか?

重み調整の概念は、機械学習と人工ニューラルネットワークの基本的な概念です。このコンセプトは人間の脳の機能からインスピレーションを得ています。

人間の脳では、生物学的ニューロンはシナプスによって互いに接続されています。 2つのニューロン間の結合の強さは「」と呼ばれます。シナプス重量」。シナプスの重みは人間の学習プロセス中に変更されます。このプロセスはまだよく理解されていませんが、「」と呼ばれています。シナプス可塑性」。シナプス可塑性は、経験に基づいて接続の強さを変えるシナプスの能力です。

さらに、AI アルゴリズムは統計数学モデルに基づいて設計されています。これは、正確な結果ではなく、可能性のある結果が生成されることを意味します。同じニューラルネットワークが同様のデータ入力に対して異なる結果を生成する可能性があります。
これらの影響を最小限に抑えるには、シナプスの重みをパラメータ化する必要があります。
ChatGPT の場合、1,750 億のパラメーターがモデルの動作を決定します。

AI ではパラメータは何に使用されますか?

パラメータはモデルのトレーニングデータに基づいて調整されます。
たとえば、言語モデルのパラメーターには、単語が文中に出現する確率、単語の後に別の単語が続く確率、単語が特定のコンテキストで使用される確率などが考えられます。
ChatGPT の場合、トレーニングに使用される言語モデルデータは 5,000 億語のテキストとコードのセットでした。 ChatGPT モデルパラメーターは、トレーニングデータ内のテキストと同様のテキストを生成するために使用されます。つまり、特定の文にどの単語が現れる可能性が最も高いかということです。
たとえば、トレーニングデータに「家は白いです」のような文が含まれている場合、モデルは「the」、「house」、「is」、「white」という単語が同時に出現する可能性が高いことを学習します。
学習モデルに文が多く存在するほど、この文に関連付けられたシナプスの重みがより高く更新されます。これは、モデルが「家は白い」という文を出力として生成する可能性が高いことを意味します。
このモデルは、文のコンテキストとそれが出現する環境も考慮します。たとえば、「家は白いです」という文は、旅行代理店について語る文脈よりも、団地について語る文脈で出現する可能性が高くなります。
言語規則も、文が出現する可能性に影響を与える可能性があります。たとえば、「家は白いです」という文はフランス語では文法的に正しいですが、「白い家はある」という文は文法的に正しくありません。
言語モデルからの出力として文が表示される可能性を決定する要因は他にも多数あります。これらの要因は、モデルまたはアプリケーションドメイン固有である可能性があります。

注意: 言語モデルはコピー機ではありません。データを学習し、トレーニングデータに類似したテキストを生成できますが、トレーニングデータからテキストをそのままコピーすることはできません。

AI はコンピューティングにおける重要なマイルストーンに到達しました。

AI は、「」と呼ばれる学習技術を使用するエキスパートシステムやレコメンデーションシステムなど、古典的な計算アルゴリズムを使用してプログラムできます。機械学習」。ただし、複雑な問題や構造化されていない問題を解決する場合、これらの手法には限界があります。さらに、従来のコンピューティングでは、まだ遭遇していない問題を考慮することは困難です。

技術の発展のおかげで、ディープラーニング(複数の隠れ層)、AI は明示的にプログラムする必要がなく、複雑で非構造化の問題を解決できます。ディープラーニングを使用すると、コンピュータープログラムがデータから学習できるようになります。
ただし、機械学習モデルは複雑です。これらには数十億のパラメータが含まれる可能性があり、そのすべてを学習し、重み付けし、最適化する必要があります。これには大量のデータと計算能力が必要です。多くの場合、学習プロセスは長くなり、多くの時間がかかる場合があります。これらの制約にもかかわらず、AI の開発はエキスパートシステムの開発よりもはるかに生産的です。人工ニューラルネットワークの概念がなければ、人間がこれほど短期間で ChatGPT を達成することは不可能でした。