Wenn Sie LLM-Aufforderungen erstellen, fügen Sie Ihren Text hier ein, um die Nutzung von Tokens in Echtzeit zu überwachen. Das Tool hebt Warnungen hervor, wenn sich Modellgrenzen nähern (z. B. 8k-Kontext des GPT-4). Redundanzen oder Split-Aufforderungen in dieser Phase schneiden, um die vollständige Nachrichtenübermittlung zu gewährleisten.
Für lange Texte wie technische Übersetzungen verwenden Sie den Absatzmodus für eine Abschnitt-für-Abschnitt-Überprüfung. Priorisieren Sie Überschriften und Schlüsselsätze und lassen 20% Token-Headspace für Antworten. Hinweis: Chinesische Zeichen verbrauchen jeweils etwa 1,5 Token in gemischten Sprachtexten.