Groq:AI大規模モデル推論アクセラレーションソリューションプロバイダー、高速無料大規模モデルインターフェース

吐司AI

Groq総論

 

カリフォルニア州マウンテンビューに本社を置くGroq社は、GroqChip™とLanguage Processing Unit™(LPU)を開発した。低レイテンシーのAIアプリケーション向けに開発されたテンソル処理ユニットで知られる。

Groqは2016年に設立され、その名前は同年に正式に商標登録された。Groqの主要製品は言語処理ユニット(LPU)であり、AIモデルを訓練するためではなく、それらを迅速に実行するために設計された新しいクラスのチップである。GroqのLPUシステムは、新世代のAIアクセラレーションを先導し、シーケンシャルデータ(例えば、DNA、音楽、コード、)自然言語)を処理し、GPUを凌駕するように設計されています。

 

Groqは、PyTorch、TensorFlow、ONNXなどの標準的な機械学習フレームワークをサポートしている。Groqは、PyTorch、TensorFlow、ONNXなどの標準的な機械学習フレームワークをサポートしている。これに加えて、Groq Compilerなどのワークロードのカスタム開発や最適化のためのツールを含むGroqWare™スイートも提供している。

 

Groq:AI大模型推理加速解决方案提供商,高速免费大模型接口

 

 

Groq 機能リスト

 

  • リアルタイムAIアプリケーション処理
  • 標準的な機械学習フレームワークをサポート
  • SaaSおよびPaaSの軽量ハードウェアのサポート
  • 高速で正確なAIパフォーマンスを提供
  • カスタム最適化ワークロードのためのGroqWare™スイート
  • 正確でエネルギー効率に優れ、再現可能な大規模推論性能を確保

 

 

Groq ヘルプ

 

  • 開発者はGroqCloud上のPlaygroundを通じて開発者アクセスをセルフサービスできる
  • 現在OpenAI APIを使用している場合、Groqに変換するために必要なのは、Groq APIキー、エンドポイント、モデルの3つだけです。
  • データセンター・スケールで最速の推論が必要なら、私たちはこう話すべきです。

 

できる。ここをクリックAPIKEYを無料で申し込み、申し込み完了後に機種を選択する:

チャット完了

身分証明書1分あたりのリクエスト数1日あたりのリクエスト数トークン 毎分トークン/日
ジェマ7bイット3014,40015,000500,000
ジェマ2-9b-イット3014,40015,000500,000
llama-3.1-70b-versatile3014,40020,000500,000
ラマ3.1-8b-インスタント3014,40020,000500,000
llama-3.2-11b-text-preview307,0007,000500,000
llama-3.2-1b-プレビュー307,0007,000500,000
llama-3.2-3b-プレビュー307,0007,000500,000
llama-3.2-90b-text-preview307,0007,000500,000
ラマガード-3-8b3014,40015,000500,000
ラマ3-70b-81923014,4006,000500,000
ラマ3-8b-81923014,40030,000500,000
llama3-groq-70b-8192-tool-use-preview3014,40015,000500,000
llama3-groq-8b-8192-tool-use-preview3014,40015,000500,000
llava-v1.5-7b-4096-preview3014,40030,000
(制限なし)
ミックストラル-8x7b-327683014,4005,000500,000

 

テキストへのスピーチ

身分証明書1分あたりのリクエスト数1日あたりのリクエスト数オーディオ秒/時1日あたりのオーディオ秒数
ディスティル・ウィスパー・ラージ-V3-エン202,0007,20028,800
ウィスパーラージ-V3202,0007,20028,800

 

次にcurl形式を例にとると、このインターフェイスはOPENAIのインターフェイス形式と互換性があるので、Groqを利用するだけでなく、OPENAI APIをカスタマイズできるインターフェイスがあれば、想像力を働かせてください。

curl -X POST "https://api.groq.com/openai/v1/chat/completions" \
-H "Authorisation: Bearer $GROQ_API_KEY" \ \
-H「Content-Type: application/json」。
-d '{"messages": [{"role": "user", "content": "低遅延LLMの重要性を説明する"}], "model": "mixtral-8x7b-32768"}'.

 

使用例:Immersive翻訳プラグインで使用するGroqキーの設定
Groq:AI大模型推理加速解决方案提供商,高速免费大模型接口

© 著作権表示
AiPPT

関連記事

コメントなし

なし
コメントはありません