Estimateur de jetons

Coller des invites ou des articles pour les estimations de jetons en direct; rester dans les limites du contexte du modèle. CJK et anglais mixtes pris en charge.

Confidentialité : traitée localement, jamais téléchargée.

↓ Collez dans la zone d'entrée ci-dessous pour voir les résultats instantanément

在此粘贴 Prompt 或文本

实时统计字符、词数与 Token 估算,适合控制 LLM 上下文长度。

Sortie

字符数

81

词数

10

行数

1

中日韩字符

17

GPT 估算 Token

31

Claude 估算 Token

30

Notes

Token 估算说明

以下为启发式估算,与 OpenAI tiktoken 等官方计数器可能略有偏差,但足以做上下文预算与 Prompt 长度规划。 ~31 GPT tokens estimated.

Coller des invites ou des articles pour les estimations de jetons en direct; rester dans les limites du contexte du modèle. CJK et anglais mixtes pris en charge.

Démarrage rapide

  1. Coller le texte

    Invitations en plusieurs lignes, blocs de code, langues mixtes.

  2. Voir les statistiques

    Voir les caractères, les mots et les comptes CJK en un coup d'œil.

  3. Vérifier le budget du modèle

    Utilisez les colonnes d'estimation GPT / Claude pour la planification contextuelle.

Qu'est-ce qu'un token

Les LLM divisent le texte en jetons pour la facturation et les limites. Anglais est ~4 caractères par jeton; CJK varie selon le tokenizer.

À quel point est-ce précis

formules heuristiques ; peut différer légèrement du tiktoken officiel, mais bien pour la budgétisation et la coupe.

Flow de travail typique

Lors de l'élaboration d'invites LLM, collez votre texte ici pour surveiller l'utilisation des jetons en temps réel. L'outil met en évidence les avertissements lors de l'approche des limites du modèle (par exemple, le contexte 8k du GPT-4). Trimmez les redondances ou les invites de séparation à ce stade pour assurer la livraison complète des messages.

Pour les textes longs comme les traductions techniques, utilisez le mode paragraphe pour l'examen section par section. Prioriser les rubriques et les paragraphes clés, laissant 20 % d’espace pour les réponses. Remarque Les caractères chinois consomment environ 1,5 jetons chacun dans les textes en langues mixtes.

Exemples

Prompt court

Input

Summarize this article in 3 bullet points.

Une courte ligne anglaise est approximativement une douzaine de jetons.

FAQ

Correspondance avec les comptes ChatGPT ?

Pas toujours identique, mais même parc de ballon; bon pour les contrôles pré-vol.

Et le code ?

heuristique du caractère; symbole-lourd code peut se fausser haut.

Pourquoi le nombre de jetons varie-t-il considérablement pour les textes avec des comptes de mots similaires?

La tokenisation diffère selon la langue: l'anglais utilise des mots / sous-mots tandis que le chinois utilise des caractères / mots. Par exemple, 深度学习' peut être divisé en 2-4 jetons. L'outil utilise la bibliothèque tiktoken d'OpenAI pour la facturation conforme à l'API.