Token Estimador

Colar solicitações ou artigos para estimativas de tokens ao vivo; permaneça dentro dos limites do contexto do modelo. Mista CJK e Inglês suportado.

Privacidade: processado localmente, nunca carregado.

↓ Colar na área de entrada abaixo para ver os resultados instantaneamente

在此粘贴 Prompt 或文本

实时统计字符、词数与 Token 估算,适合控制 LLM 上下文长度。

Output

字符数

81

词数

10

行数

1

中日韩字符

17

GPT 估算 Token

31

Claude 估算 Token

30

Notas

Token 估算说明

以下为启发式估算,与 OpenAI tiktoken 等官方计数器可能略有偏差,但足以做上下文预算与 Prompt 长度规划。 ~31 GPT tokens estimated.

Colar solicitações ou artigos para estimativas de tokens ao vivo; permaneça dentro dos limites do contexto do modelo. Mista CJK e Inglês suportado.

Iniciação rápida

  1. Passe texto

    Prompt de várias linhas, blocos de código, línguas mistas.

  2. View Estatísticas

    Veja caracteres, palavras e contagens CJK de um olho.

  3. Verifique o modelo de orçamento

    Use as colunas de estimativa GPT / Claude para planejamento de contexto.

O que é um token

LLMs dividem o texto em tokens para faturamento e limites. Inglês é ~ 4 caracteres por token; CJK varia por tokenizer.

Quão preciso é isso

Fórmulas heurísticas; pode diferir ligeiramente dos tokens oficiais, mas é bom para orçamento e trimming.

Fluxo de trabalho típico

Ao elaborar solicitações LLM, cole seu texto aqui para monitorar o uso de token em tempo real. A ferramenta destaca avisos quando se aproximam dos limites do modelo (por exemplo, Contexto 8k do GPT - 4). Trim redundâncias ou dicas divididas nesta fase para garantir a entrega completa da mensagem.

Para textos longos, como traduções técnicas, use o modo parágrafo para revisão seção por seção. Priorize títulos e parágrafos-chave, deixando 20% de margem para respostas. Nota: Os caracteres chineses consomem ~ 1,5 tokens cada em textos de línguas mistas.

Exemplos

Curto prompt

Input

Summarize this article in 3 bullet points.

Uma linha curta em inglês é aproximadamente uma dúzia de tokens.

FAQ

Match ChatGPT conta?

Nem sempre idêntico, mas o mesmo campo de bola; bom para verificações pré - vôo.

E quanto ao código?

Heurística de caracteres; código pesado em símbolos pode desviar-se alto.

Por que a contagem de tokens varia drasticamente para textos com contagens de palavras semelhantes?

A tokenização difere de acordo com o idioma: o inglês usa palavras / subpalavras enquanto o chinês usa caracteres / palavras. Por exemplo, o ' aprendizado profundo ' pode se dividir em 2 - 4 tokens. A ferramenta usa a biblioteca tiktoken do OpenAI para faturamento consistente com API.