Context Budget Planner

Stimare i token per sistema, strumenti, cronologia e slot utente rispetto a un limite di contesto del modello. Utile quando si progetta il layout della chat agente.

Privacy: elaborato localmente, mai caricato.

↓ Incolla nell 'area di input qui sotto per vedere i risultati istantaneamente

按 system / tools / history / user 四段估算 Token 占用与剩余窗口。

模型

System

Tools

History

User

System

Tools

History

User

合计 Token

剩余

127988

占用率

0.0%

Note

与上下文检查的区别

本工具按对话槽位拆分预算; 上下文检查器对整段文本按模型窗口对比。均为启发式估算。

Stimare i token per sistema, strumenti, cronologia e slot utente rispetto a un limite di contesto del modello. Utile quando si progetta il layout della chat agente.

Avvio veloce

Seleziona il modello

Il limite di contesto viene dall 'elenco dei modelli.
Riempire quattro slot

Vedi totale, rimanente e percentuale utilizzata.

Significato Slot

System è il prompt del sistema; Tools è la funzione defs; History è i messaggi precedenti; User è il turno corrente.

Tipico Workflow

Quando si progetta un agente di dialogo AI, selezionare prima il modello di destinazione (ad esempio GPT - 4) nello strumento. Il limite della finestra di contesto viene visualizzato automaticamente. Quindi inserire contenuti nei quattro slot (sistema, strumenti, cronologia, utente) rispettivamente per vedere l'utilizzo dei token in tempo reale per ciascuna sezione. Regola la lunghezza del prompt per rimanere al di sotto del limite, riservando allo stesso tempo lo spazio per i dialogo successivi.

Ad esempio, quando si crea un bot di assistenza clienti, è possibile assegnare 50 token per la definizione del ruolo nello slot di sistema, 200 token per le descrizioni API nello slot degli strumenti, 300 token per la cronologia delle conversazioni e riservare 500 token per l'ingresso dell 'utente. Le barre di progresso codificate a colori mostrano visivamente le proporzioni, attivando avvisi quando si avvicina il limite, indicando quando è necessario semplificare le descrizioni degli strumenti o accorciare la cronologia.

Esempi

Esempio

Input

gpt-4o-mini + 4 slots

Output

Per-slot tokens + remaining

FAQ

Come il controllo di contesto?

Checker utilizza l'intero testo; questo viene suddiviso per slot per la pianificazione multi-turni.

Perché riservare token specificamente per lo slot utente?

La lunghezza dell 'input dell' utente è imprevedibile. Riservazione impedisce overflow - ad esempio, con il limite di 32.768 di GPT - 4 - 32k, se altre sezioni utilizzano 32.000 token, solo 768 token rimangono per gli utenti. Consigliamo di riservare il 15 - 20% per input dell 'utente + risposta AI, di più per scenari complessi

Strumenti correlati

Controllo di finestra di contesto Token stimatore LLM Calcolo dei prezzi