Avvio veloce
-
Seleziona il modello
Il limite di contesto viene dall 'elenco dei modelli.
-
Riempire quattro slot
Vedi totale, rimanente e percentuale utilizzata.
Stimare i token per sistema, strumenti, cronologia e slot utente rispetto a un limite di contesto del modello. Utile quando si progetta il layout della chat agente.
Privacy: elaborato localmente, mai caricato.
↓ Incolla nell 'area di input qui sotto per vedere i risultati istantaneamente
按 system / tools / history / user 四段估算 Token 占用与剩余窗口。
System
7
Tools
0
History
0
User
5
合计 Token
12
剩余
127988
占用率
0.0%
本工具按对话槽位拆分预算; 上下文检查器对整段文本按模型窗口对比。均为启发式估算。
Stimare i token per sistema, strumenti, cronologia e slot utente rispetto a un limite di contesto del modello. Utile quando si progetta il layout della chat agente.
Seleziona il modello
Il limite di contesto viene dall 'elenco dei modelli.
Riempire quattro slot
Vedi totale, rimanente e percentuale utilizzata.
System è il prompt del sistema; Tools è la funzione defs; History è i messaggi precedenti; User è il turno corrente.
Quando si progetta un agente di dialogo AI, selezionare prima il modello di destinazione (ad esempio GPT - 4) nello strumento. Il limite della finestra di contesto viene visualizzato automaticamente. Quindi inserire contenuti nei quattro slot (sistema, strumenti, cronologia, utente) rispettivamente per vedere l'utilizzo dei token in tempo reale per ciascuna sezione. Regola la lunghezza del prompt per rimanere al di sotto del limite, riservando allo stesso tempo lo spazio per i dialogo successivi.
Ad esempio, quando si crea un bot di assistenza clienti, è possibile assegnare 50 token per la definizione del ruolo nello slot di sistema, 200 token per le descrizioni API nello slot degli strumenti, 300 token per la cronologia delle conversazioni e riservare 500 token per l'ingresso dell 'utente. Le barre di progresso codificate a colori mostrano visivamente le proporzioni, attivando avvisi quando si avvicina il limite, indicando quando è necessario semplificare le descrizioni degli strumenti o accorciare la cronologia.
Input
gpt-4o-mini + 4 slots
Output
Per-slot tokens + remaining
Checker utilizza l'intero testo; questo viene suddiviso per slot per la pianificazione multi-turni.
La lunghezza dell 'input dell' utente è imprevedibile. Riservazione impedisce overflow - ad esempio, con il limite di 32.768 di GPT - 4 - 32k, se altre sezioni utilizzano 32.000 token, solo 768 token rimangono per gli utenti. Consigliamo di riservare il 15 - 20% per input dell 'utente + risposta AI, di più per scenari complessi