What is an OpenAI API and How to Use It?

What is an OpenAI API and How to Use It?
sinceretechnology

 

 

 

 

この記事は以下のサイトを、 DeepL版プロの翻訳家 テンプレートを使用して翻訳して引用しています。AI翻訳のため一部訳がおかしい箇所がありましたらご容赦ください。

 

What is an OpenAI API and How to Use It?

by Nikhil Azza  Oct 7, 2023

 

 

 

 

 

急速に進化する人工知能の状況において、OpenAI API は、アクセス可能な AI 機能の素晴らしい例です。 AI 研究のリーダーである OpenAI は、開発者が事前トレーニングされた AI モデルをアプリケーションにシームレスに統合する方法を提供します。

Microsoft の Azure でホストされている OpenAI API は、多くの強力な AI 機能へのゲートウェイです。 これにより、開発者はトレーニング モデルの複雑さを一から理解しようとせずに、AI を制御して使用できるようになります。 この投稿を読むと、OpenAI API とは何か、そしてその使用方法を知ることができるようになります。

 

 

 

 

OpenAI APIとは何ですか?

 

Microsoft の Azure 上にある OpenAI API は、強力なクラウド中心のシステムです。 開発者が最先端の事前トレーニング済み AI モデルに簡単にアクセスできるように、優れた設計で作られています。

このプラットフォームは、開発者コミュニティに、選択したプログラミング言語に関係なく、最上位の AI 機能をソフトウェアに統合するシームレスな手段を提供します。

OpenAI Python API の可能性を解き放つことで、開発者は高度な AI 機能を活用し、ソフトウェア アプリケーションのインテリジェンスと効率を向上させることができます。

 

 

 

 

OpenAI APIの使い方は?

 

 

OpenAI API の利用は簡単で、標準的な API 使用アプローチに従っています。

 

  • まず、pip を使用して「openai」パッケージをインストールします。「pip install openai」を実行するだけです。 あるいは、ノードを選択した場合は、npm: 'npm install openai' を利用してこれを実現できます。
  • 次に、 API キーを取得します 。 OpenAI ダッシュボードにアクセスし、右上隅にあるプロフィール アイコンを見つけて選択します。

 
API キーを取得する

 

  • 「API キーの表示」に移動し、「新しい秘密キーの作成」に進み、固有の API 秘密キーを生成します。

     
    APIキーを表示する

     

  • Python や JavaScript (ノード) などのサーバー側言語を使用して、選択したモデル エンドポイントに向けられた API 呼び出しを開始します。 これらの呼び出しをカスタム API に統合し、エンドポイントを検証します。
     
  • React、Vue、Angular などの著名な JavaScript フレームワークを通じてカスタム API を取得します。
     
  • ユーザーのリクエストとモデルの応答をカプセル化したデータを、美しいユーザー インターフェイス (UI) で表示します。 これにより、アプリケーションは実際に使用できるようになります。

 

 

 

 

OpenAI API を使用して何ができるのですか?

 

 

 

OpenAI API を使用できるさまざまなインスタンスがあります。 これらには次のものが含まれます。

 

 

 

1. OpenAIアカウントの作成

 

まだ OpenAI ユーザーに登録していない場合は、OpenAI 公式 Web サイトに記載されている手順に従ってサインアップする必要があります。

pip を使用すると、OpenAI パッケージを Python 開発に組み込むのは簡単です (「pip install OpenAI」を実行するだけです)。

一方、Node を使用している場合は、npm (「npm install OpenAI」) を使用してインストールも同様に簡単です。

OpenAI アカウントが設定されると、指定された電子メール アドレスに電子メール検証リンクが送信されます。

電子メールの受信箱に移動し、検証リンクを見つけてクリックし、電子メールを検証します。

 

この後、OpenAI アカウントに関連付けられた電子メール アドレスを入力し、対応するパスワードを入力して OpenAI アカウント ダッシュボードにアクセスします。

 

 

 

2. 音声からテキストへの変換

 

OpenAI の文字起こしおよび翻訳エンドポイントを使用して、音声音声を変換および解釈できます。

音声テキスト変換機能は、大規模な弱い監視下での広範なトレーニングから得られた Whisper v2 ラージ モデルを利用しています。

特に、OpenAI は、自社の Whisper モデルとオープンソースでアクセス可能なモデルとの間に区別はないと主張しています。

この発見により、多言語文字起こしおよび翻訳 AI をアプリケーションに大規模にシームレスに統合するための多くの可能性が開かれます。

これらのエンドポイントの採用は簡単です。 モデルにオーディオ ファイルを提供し、書き起こしか書き起こし+翻訳によって対象のエンドポイントを呼び出すだけです。 

これらのエンドポイントには、mp3、mp4、MPEG、MPGA、m4a、wav、webm などのほとんどのオーディオ ファイル タイプをサポートする便利な機能が備わっており、最大ファイル サイズの上限は 25 MB です。

 

 

 

3. APIをテストする

 

OpenAI API キーを使用して、選択したモデル エンドポイントに単純なテキスト リクエストを作成し、特定のモデルの詳細を取得します。 JavaScript (ノード) や Python などのサーバー側プログラミング言語を使用できます。

 

OpenAI API キーを認証した後、視覚的に魅力的なユーザー インターフェイスでデータを表示します。 完了すると、アプリケーションを実際に使用できるようになります。

 

 

 

4. コード補完

 

コード補完エンドポイントは、自然言語とパブリック リポジトリからの広範なコード データセットの両方を使用してトレーニングされたモデルのグループである OpenAI Codex に基づいています。

現在、エンドポイントは限定的なベータ段階にあり、無料で使用できます。 JavaScript、Python、Go、PHP、Ruby、Shell、TypeScript、Swift、Perl、SQL など、多数の最新のプログラミング言語を支援します。

code-davinci-002 または code-cushman-001 モデルを使用すると、コード補完エンドポイントは、ユーザーの入力に基づいてコード行を自動的に追加したり、コード ブロックを作成したりできます。 code-davinci-002 モデルは、若干速度が遅くなりますが、オートコンプリートのためのコード挿入が可能になるため、より堅牢なオプションです。

たとえば、ターゲット プログラミング言語のプロンプトをコメントとしてエンドポイントに送信することで、コード ブロックを作成できます。

 

 

 

5. OpenAI APIキーを生成する

 

OpenAI アカウントを設定またはログインした後、OpenAI ダッシュボードの右上隅にあるイニシャルとプロフィールのアイコンを見つけます。 自分の名前をクリックしてメニューを開き、[API キーの表示] を選択して OpenAI API キーを生成します。

 

次のウィンドウの中央に「新しい秘密キーの作成」オプションがあります。 OpenAI API キーをまだお持ちでない場合は、このオプションをクリックして取得してください。

ウィンドウを閉じると完全な OpenAI API キーにアクセスできなくなるため、この新しく作成した API キーはすぐに保存してください。

 

 

 

6. テキストの比較

 

OpenAI API は、text-embedding-ada-002 第 2 世代埋め込みモデルを通じてテキスト比較機能を提供します。 このモデルを使用して、API はベクトル表現間の距離を分析することでテキスト間の関係を評価します。 差が大きいほど、比較されるテキストの関連性は低くなります。

この埋め込み機能には、テキストのクラスタリング、相違点、関連性、推奨事項、感情、分類が含まれます。 料金は使用されるトークンの量に基づきます。

OpenAI のドキュメントでは、他の第 1 世代の埋め込みモデルの可用性について言及していますが、text-embedding-ada-002 モデルは手頃な価格です。 ただし、テストで実証されているように、OpenAI は埋め込みモデルにおける潜在的な社会的バイアスを認識していることに注意することが重要です。

 

 

 

7. 画像生成

 

OpenAI API のイメージ生成機能は、DALL.E イメージ モデルに依存する直感的で顕著な機能です。 自然言語プロンプトに基づいて画像バリエーションを生成、編集、作成するためのエンドポイントを提供します。

 

ベータ版であり、アップスケーリングなどの高度な機能はありませんが、スケーリングされていない出力は、Midjourney や Stable Diffusion などのジェネレーティブ アート モデルと比較して特に印象的です。

イメージ生成エンドポイントを利用する場合は、プロンプト、イメージ サイズ、およびイメージ数を入力する必要があります。 一方、画像編集エンドポイントには、他のパラメータに加えて、編集する画像と編集ポイントをマークする RGBA マスクが必要です。

バリエーション エンドポイントの場合、ターゲット イメージ、必要なバリエーション数、および出力サイズを指定するだけで済みます。 現時点では、OpenAI のベータ版イメージ エンドポイントは、256×256、512×512、および 1024×1024 ピクセルのサイズの正方形のフレームと互換性があります。

 

 

 

 

OpenAI API を使用すると何を作成できますか?

 

OpenAI API は、さまざまなアプリケーションで機械学習と強化学習を実装する実用的な方法を提供します。 これらの API を使用する可能性のあるアプリケーションをいくつか示します。

 

  • チャット完了エンドポイントを使用して、ユーザーフレンドリーな仮想アシスタント チャットボットを Web サイトまたはアプリに組み込みます。
  • コード エディターおよび統合開発環境 (IDE) 用の特定のプログラミング言語に合わせたコード補完プラグインを開発します。
  • 画像生成エンドポイントを使用して、画像の指定された位置にオブジェクトをシームレスに挿入できる画像編集および操作アプリを設計します。
  • Speech-to-Text モデル エンドポイントを使用して、ビデオ、オーディオ、ライブ会話の字幕と翻訳を強化および修正します。
  • OpenAI のモデル微調整エンドポイントを使用して、カスタム機械学習モデルを最初から構築します。
  • OpenAI 埋め込みモデル エンドポイントを使用して、アプリ内の否定的な感情を検出します。

 

 

 

 

総括

 

OpenAI API は AI 環境における変革をもたらし、最先端の言語モデルにアクセスして活用するためのシームレスな手段を提供します。

この API を効果的にマスターすることは、その計り知れない可能性を解き放ち、自然言語処理で可能なことの限界を押し上げる鍵となります。

利用可能なエンドポイントを調査し、リクエストを構造化する方法を理解し、レスポンスを効果的にデコードすることで、開発者はこの API を利用するアプリケーションを調整して人間のようなテキストを作成し、顧客サービス、コンテンツ作成などの分野に革命を起こすことができます。

また、アップデートや進歩に関する情報を常に入手し、AI 主導のソリューションの継続的な適応と強化を確実に行うことも重要です。

 

 

 

 

 


この記事に関するご質問やご意見などございましたらお問い合わせフォームからお気軽にご連絡ください。