主要LLM API 料金比較 【2026年7月版】
各社公式料金ページを直接参照し、本ページ作成時点で該当ページから再現確認できた数値のみを掲載しています。
確認できなかったモデル・数値は表に含めず「公式料金ページを参照」と案内します。
単位はすべて USD / 1M tokens(100万トークン)。
OpenAI
⚠️ 本ページ作成時点で openai.com/api/pricing の料金表を直接取得・再現確認できませんでした
本サイトの掲載基準(公式ページからの直接確認)を満たせなかったため、表への数値掲載を見送ります。
最新の正確な料金は公式ページを直接ご確認ください:
→ openai.com/api/pricing
Anthropic(Claude)
📋 適用条件: 標準API(第一者API直接利用)/ テキスト入力 / キャッシュなし標準レート
| モデル | 入力 (Base Input) |
キャッシュ書込 5分 (Cache Write 5m) |
キャッシュ読込 (Cache Hit) |
出力 (Output) |
備考 |
|---|---|---|---|---|---|
| Claude Sonnet 5 New |
$2.00 〜2026-08-31 $3.00(2026-09-01以降) |
$2.50 $3.75(2026-09-01以降) |
$0.20 $0.30(2026-09-01以降) |
$10.00 〜2026-08-31 $15.00(2026-09-01以降) |
2026-06-30公開。新トークナイザー採用。同じテキストで約30%多いトークン数になる場合があります(約1.3倍) |
| Claude Opus 4.8 | $5.00 | $6.25 | $0.50 | $25.00 | 最高性能フラッグシップ |
| Claude Sonnet 4.6 | $3.00 | $3.75 | $0.30 | $15.00 | バランス型。1Mコンテキスト全域フラット |
| Claude Haiku 4.5 | $1.00 | $1.25 | $0.10 | $5.00 | 大量処理・分類タスク向け |
その他のモデル(Opus 4.7以前、Haiku 3.5等)は 公式料金ページを参照してください。
一次情報: platform.claude.com/docs/en/about-claude/pricing (取得日時: 2026-07-02 JST)
公式ページ記載の補足事項(直接確認済み)
- Batch API(Message Batches API)で全モデル 50%割引
- キャッシュ書込(5分)= 通常入力の 1.25倍、キャッシュ書込(1時間)= 2倍
- キャッシュ読込 = 通常入力の 0.1倍(90%割引)
- Opus 4.8・Sonnet 5・Sonnet 4.6 は 1Mトークン全域フラット料金(長文プレミアムなし)
- Sonnet 5 は 新トークナイザー を採用。同じテキストで約30%多いトークン数になる場合があります(約1.3倍)(公式ページ記載)
- US-only データレジデンシー使用時は通常料金の 1.1倍
Google(Gemini Developer API)
📋 適用条件: Gemini Developer API 有料ティア / Standard tier / text・image・video 入力時 / 標準API
| モデル | 入力 (text/image/video) |
入力 (プロンプト>200K時) |
出力 | 出力 (プロンプト>200K時) |
備考 |
|---|---|---|---|---|---|
| Gemini 3.1 Pro Preview Preview | $2.00 | $4.00 | $12.00 | $18.00 | Preview価格・変更の可能性あり |
| Gemini 2.5 Pro | $1.25 | $2.50 | $10.00 | $15.00 | |
| Gemini 2.5 Flash | $0.30 | — | $2.50 | — | audio入力は $1.00/1M |
| Gemini 2.5 Flash-Lite | $0.10 | — | $0.40 | — | audio入力は $0.30/1M |
その他のモデル(Gemini 3 Flash等)は 公式料金ページを参照してください。
一次情報:
ai.google.dev/pricing
(取得日時: 2026-07-02 JST)
本表の数値は ai.google.dev/pricing の該当行を 2026-07-02 JST に手動確認して転記しています。Preview価格や無料枠・モダリティ別価格は変更される可能性があるため、契約前に必ず公式ページをご確認ください。
公式ページ記載の補足事項(直接確認済み)
- Gemini 3.1 Pro Preview は Preview モデルのため、価格・仕様は変更の可能性があります
- Batch API利用で 約50%割引(各モデルとも対応)
- Context caching(コンテキストキャッシュ)は各モデルで別途読み込み料金あり(公式料金ページ参照)
- audio 入力はテキスト・画像・動画入力より高い料金が設定されています
- 有料ティアではプロンプトがGoogleの製品改善に使用されません(無料ティアは使用される場合あり)
- Gemini 2.0 Flash-Lite は 2026年6月1日にサービス終了(公式ページに記載あり)
💡 コスト削減の基本
適切な最適化で API コストを大幅に抑える3つの基本戦略
⚡ Batch API(非同期処理)
最大 50% OFF
リアルタイム応答が不要なタスク(バッチ評価・データ加工・要約)は Batch API を使うと全モデルで約50%割引。 Anthropic・Google いずれも対応(公式ページで確認済み)。
🗃️ プロンプトキャッシュ
キャッシュ読込で最大90%割引(入力のみ)
共通のシステムプロンプト・ドキュメントをキャッシュに乗せると再送時の入力コストが大幅割引。 Anthropic は最大90%割引(公式ページで確認済み)。 長い固定プレフィックスがある用途で特に効果大。
🔀 モデルルーティング
タスク難易度で使い分け
シンプルな分類・抽出タスクは軽量モデル(Haiku 4.5・Flash-Lite)、 複雑な推論はフラッグシップ、というルーティングで同品質を低コストで実現。
⚠️ 免責事項
- 本ページの料金情報は各社公式ページを直接参照し、再現確認できた数値のみを掲載しています(取得日時: 2026-07-02 JST)。
- 料金は予告なく変動することがあります。契約・本番利用前に必ず各社公式ページをご確認ください。
- Preview・期間限定価格・ベータ機能は変更・終了の可能性があります。
- 本サイトは情報提供目的です。特定プロバイダーの推薦・代理ではありません。