Contrôleur de fenêtre de contexte

Collez des invites ou des documents pour voir les limites de contexte et l'utilisation estimée des jetons par modèle principal. Décidez si vous avez besoin d'une découpe ou d'une fenêtre plus grande.

Confidentialité : traitée localement, jamais téléchargée.

↓ Collez dans la zone d'entrée ci-dessous pour voir les résultats instantanément

待检查文本

粘贴 Prompt、文档或对话内容,查看各模型上下文占用。

模型估算 Token上下文上限占用状态
GPT-4o22128,0000.0%可容纳
GPT-4o mini22128,0000.0%可容纳
GPT-4.1221,047,5760.0%可容纳
o3-mini22200,0000.0%可容纳
Claude Sonnet 422200,0000.0%可容纳
Claude Haiku 3.522200,0000.0%可容纳
Gemini 2.0 Flash221,048,5760.0%可容纳

Notes

如何解读

绿色「可容纳」表示估算 Token 未超过模型上下文窗口;红色「超出」需裁剪或换更大窗口模型。 Token 为启发式估算,与官方计数器可能略有偏差。

Collez des invites ou des documents pour voir les limites de contexte et l'utilisation estimée des jetons par modèle principal. Décidez si vous avez besoin d'une découpe ou d'une fenêtre plus grande.

Démarrage rapide

  1. Coller le texte

    Longs documents et code pris en charge; Mises à jour des tableaux en direct.

  2. Vérifier l'état

    Coups verts; rouge débordement signifie garniture ou modèle de commutateur.

vs Estimateur de jetons

Cet outil compare les fenêtres par modèle; Token Estimator se concentre sur les statistiques de caractères et de mots.

Caractéristiques et cas d'utilisation

Estimez le nombre de jetons par rapport aux fenêtres de contexte du modèle commun et avertissez sur une éventuelle troncation.

Utiliser avant les questions et réponses du long document, la sélection du modèle et la planification de l'assemblage contextuel RAG.

Flow de travail typique

Lorsque vous vous préparez à soumettre un long texte à un modèle d'IA, collez d'abord votre contenu ici. Le système calcule automatiquement le nombre de jetons et affiche les limites de fenêtre contextuelle des modèles principaux. Les indicateurs verts indiquent les modèles compatibles, tandis que les drapeaux rouges suggèrent la coupe ou le passage à des modèles de plus grande capacité.

Pour les fichiers de code, envisagez de supprimer les commentaires et les lignes vides avant de vérifier. Lorsque vous approchez des limites (par exemple, GPT-4 affiche une utilisation de 90 %), cliquez sur « Conseils d’optimisation » pour obtenir des conseils ciblés tels que la fraction de paragraphes ou le passage au streaming API.

Exemples

Prompt long

Input

10k+ char document

Output

Per-model fit/overflow

FAQ

Comptes officiels du match ?

Heuristique uniquement; vérifier les cas de bord avec chaque tokenisateur de fournisseur.

Pourquoi le nombre de jetons varie-t-il d'un outil à l'autre?

Les variations découlent des versions d'encodeur (par exemple, ancien vs nouveau GPT-3.5) ou si des jetons spéciaux (comme les invites système) sont comptés. Notre outil prend en charge la commutation d'encodeur et marque clairement les jetons de méta-instruction, en alignement avec les API officielles.