Bağlam Bütçe Planlayıcı

Sistem, araçlar, geçmiş ve kullanıcı yuvaları için belirteçleri bir model bağlam sınırı karşısında tahmini edin. Ajan sohbet mizanpajı tasarlanırken kullanışlı.

Gizlilik: yerel olarak işlenir, asla yüklenmez.

Anında sonuçları görmek için aşağıdaki giriş alanına yapıştırın

按 system / tools / history / user 四段估算 Token 占用与剩余窗口。

System
Tools
History
User

System

7

Tools

0

History

0

User

5

合计 Token

12

剩余

127988

占用率

0.0%

Notlar

与上下文检查的区别

本工具按对话槽位拆分预算; 上下文检查器对整段文本按模型窗口对比。均为启发式估算。

Sistem, araçlar, geçmiş ve kullanıcı yuvaları için belirteçleri bir model bağlam sınırı karşısında tahmini edin. Ajan sohbet mizanpajı tasarlanırken kullanışlı.

Hızlı başlangıç

  1. Model seçin

    Bağlam sınırı model listesinden gelir.

  2. Dört slot doldur

    Toplam, kalan ve kullanılan yüzde bakınız.

Slot Anlamları

Sistem sistem istemcisidir; Araçlar fonksiyon defsidir; Geçmiş geçmişi önceki mesajlardır; Kullanıcı geçerli sıradır.

Tipik iş akışı

Bir AI diyalog aracı tasarlanırken, ilk önce araçta hedef model (örneğin GPT-4) seçin.İçerik penceresi sınırı otomatik olarak görüntülenir. Ardından, her bölüm için gerçek zamanlı belirteç kullanımını görmek için sırasıyla dört yuva (sistem, araçlar, geçmiş, kullanıcı) içine içeriği girin. Sonraki diyaloglar için yer ayırırken sınırın altında kalmak için istek uzunluğunu ayarlayın. Adjust prompt length to stay under limit while reserving space for subsequent dialogue.

Örneğin, bir müşteri hizmetleri botunu oluştururken, sistem yuvasında rol tanımlaması için 50 token, araç yuvasında API açıklamaları için 200 token, konuşma geçmişi için 300 token ve kullanıcı girişleri için 500 token ayırtabilirsiniz. Renk kodlu ilerleme çubukları görsel olarak orantıları gösterir, sınırı yaklaştığında uyarıları tetikler - araç açıklamalarını basitleştirmek veya geçmişi kısaltmak ne zaman gösterir.

Örnekler

Örnek

Input

gpt-4o-mini + 4 slots

Output

Per-slot tokens + remaining

FAQ

context checker gibi mi?

Denetçi tüm metni kullanır; bu çok dönüş planlama için yuvalara göre bölünür.

Neden kullanıcı yuvası için tokenleri özel olarak rezerve ediyoruz?

Kullanıcı girişi uzunluğu tahmin edilemez. Rezervasyon, taşımayı önler - örneğin, GPT-4-32k'in 32.768 sınırı ile, diğer bölümler 32.000 token kullanırsa, kullanıcılar için sadece 768 token kalır. Kullanıcı girişleri + AI yanıtları için% 15-20 ayırmanızı, karmaşık senaryolar için daha fazla ayırmanızı öneririz.