Token stimatore

Incolla istruzioni o articoli per stime di token live; rimanere entro i limiti del contesto del modello. Mista CJK e inglese supportato.

Privacy: elaborato localmente, mai caricato.

↓ Incolla nell 'area di input qui sotto per vedere i risultati istantaneamente

在此粘贴 Prompt 或文本

实时统计字符、词数与 Token 估算，适合控制 LLM 上下文长度。

Output

字符数

81

词数

10

行数

1

中日韩字符

17

GPT 估算 Token

31

Claude 估算 Token

30

Note

Token 估算说明

以下为启发式估算，与 OpenAI tiktoken 等官方计数器可能略有偏差，但足以做上下文预算与 Prompt 长度规划。 ~31 GPT tokens estimated.

Incolla istruzioni o articoli per stime di token live; rimanere entro i limiti del contesto del modello. Mista CJK e inglese supportato.

Avvio veloce

Colla il testo

Prompti multi-linee, blocchi di codice, linguaggi misti.
Vedi statistiche

Vedi caratteri, parole e CJK conteggi a colpo d'occhio.
Controllare il modello di budget

Utilizzare le colonne di stima GPT / Claude per la pianificazione di contesto.

Che cosa è un token

Gli LLM dividono il testo in token per la fatturazione e i limiti. L'inglese è di ~ 4 caratteri per token; CJK varia a seconda del token.

Quanto è accurata questa

Formule euristiche; possono differire leggermente dai tokens ufficiali, ma sono buoni per la pianificazione del budget e la potatura.

Tipico Workflow

Quando si creano richieste LLM, incolla il testo qui per monitorare l'uso dei token in tempo reale. Lo strumento evidenzia gli avvisi quando si avvicinano ai limiti del modello (ad esempio, Context 8k di GPT - 4). Ridurre le ridondanze o i richiesti di divisione in questa fase per garantire la consegna completa del messaggio.

Per i testi lunghi come le traduzioni tecniche, utilizzare la modalità paragrafo per la revisione sezione per sezione. Dare la priorità ai titoli e ai paragrafi chiave, lasciando il 20% di spazio per le risposte. Nota: i caratteri cinesi consumano ~ 1,5 token ciascuno nei testi in lingua mista.

Esempi

Breve prompt

Input

Summarize this article in 3 bullet points.

Una breve linea inglese è circa una dozzina di token.

FAQ

Match ChatGPT conta?

Non sempre identico, ma lo stesso campo da palla; buono per i controlli pre-volo.

E il codice?

Eruristiche dei caratteri; il codice pesante di simboli può essere altissimo.

Perché il conteggio token varia drasticamente per testi con conteggi di parole simili?

La tokenizzazione differisce in base alla lingua: l'inglese usa parole / sottoparole mentre il cinese usa caratteri / parole. Ad esempio, il 'apprendimento profondo' può essere diviso in 2 - 4 token. Lo strumento utilizza la libreria tiktoken di OpenAI per la fatturazione API-consistente.

Strumenti correlati

Controllo di finestra di contesto LLM Calcolo dei prezzi Template immediato Scanner PII