LLM Preisrechner

Wählen Sie ein Modell und Token-Zählungen aus, um die Kosten in USD pro API-Aufruf zu schätzen. Nützlich für Budgetierung, Modellvergleich und kostenbewusstes Design.

Datenschutz: lokal verarbeitet, nie hochgeladen.

↓ Fügen Sie in den Eingabebereich unten, um sofort Ergebnisse zu sehen

价格为参考值,请以各厂商官方定价为准。

预估费用 (USD)

$0.0027

输入单价

$0.15/1M

输出单价

$0.6/1M

Hinweise

计费说明

按每百万 Token 单价估算单次请求成本。实际账单可能含缓存折扣、批量价等,仅供参考。

Wählen Sie ein Modell und Token-Zählungen aus, um die Kosten in USD pro API-Aufruf zu schätzen. Nützlich für Budgetierung, Modellvergleich und kostenbewusstes Design.

Schnellstart

  1. Modell auswählen

    Inklusive GPT, Claude, Gemini Referenzsätze.

  2. Geben Sie Tokens ein

    Legen Sie die geschätzten Eingangs- und Ausgangs-Tokenzahlen fest.

Preisquelle

Die Preise sind indikativ; Rechnungen können Caching, Batch-Preise oder regionale Unterschiede enthalten.

Eigenschaften und Anwendungsfälle

Schätzen Sie die pro-Anruf- und monatlichen LLM-Kosten aus der Anzahl der Token und der Modellpreise mit einem Nebenvergleich.

Verwendung für Produktpreise, Modellauswahl, Budgetgenehmigungen und Kostenabweichungsuntersuchungen.

Typischer Workflow

1. Modell auswählen: Wählen Sie das Ziel LLM (z.B. GPT-4 oder Claude 2) - die Preise variieren bis zu 10x zwischen den Modellen. 2. Schätzung von Token: Testen Sie Probeingänge im Spielplatz oder verwenden Sie Faustregel (Englisch: 1 Token≈1,3 Zeichen, Chinesisch≈2 Zeichen). 3. Berechnen Sie die Kosten für einen einzelnen Anruf, multiplizieren Sie dann mit täglichen Anrufen für monatliche Schätzungen.

Pro-Tipp: Vergleichen Sie mehrere Modelle nebeneinander. Beispiel: GPT-3.5 gegen Llama 2 für Langtextszenarien bewerten oder stufige Strategien entwerfen (einfache Abfragen) → billiges Modell, komplexe Aufgaben → Premium-Modell). Passen Sie die Tokens live an, um die Preisempfindlichkeit zu sehen.

Beispiele

Beispiel

Input

gpt-4o-mini, 10k in / 2k out

Output

~$0.0027 USD

FAQ

Bild-Tokens?

Nur Text-Tokens; Überprüfen Sie Anbieterdokumente für multimodal.

Sind Systemaufforderungen in der Tokenzahl enthalten?

Ja, Systemaufforderungen (z.B. Anweisungen zur Rolleneinstellung) zählen als Eingabetoken. Einige Plattformen wie OpenAI haben jedoch spezielle Abrechnungsregeln für Systemaufforderungen - empfehlen das Testen mit der tatsächlichen API.