Hızlı başlangıç
-
Model seçin
Bağlam sınırı model listesinden gelir.
-
Dört slot doldur
Toplam, kalan ve kullanılan yüzde bakınız.
Sistem, araçlar, geçmiş ve kullanıcı yuvaları için belirteçleri bir model bağlam sınırı karşısında tahmini edin. Ajan sohbet mizanpajı tasarlanırken kullanışlı.
Gizlilik: yerel olarak işlenir, asla yüklenmez.
Anında sonuçları görmek için aşağıdaki giriş alanına yapıştırın
按 system / tools / history / user 四段估算 Token 占用与剩余窗口。
System
7
Tools
0
History
0
User
5
合计 Token
12
剩余
127988
占用率
0.0%
本工具按对话槽位拆分预算; 上下文检查器对整段文本按模型窗口对比。均为启发式估算。
Sistem, araçlar, geçmiş ve kullanıcı yuvaları için belirteçleri bir model bağlam sınırı karşısında tahmini edin. Ajan sohbet mizanpajı tasarlanırken kullanışlı.
Model seçin
Bağlam sınırı model listesinden gelir.
Dört slot doldur
Toplam, kalan ve kullanılan yüzde bakınız.
Sistem sistem istemcisidir; Araçlar fonksiyon defsidir; Geçmiş geçmişi önceki mesajlardır; Kullanıcı geçerli sıradır.
Bir AI diyalog aracı tasarlanırken, ilk önce araçta hedef model (örneğin GPT-4) seçin.İçerik penceresi sınırı otomatik olarak görüntülenir. Ardından, her bölüm için gerçek zamanlı belirteç kullanımını görmek için sırasıyla dört yuva (sistem, araçlar, geçmiş, kullanıcı) içine içeriği girin. Sonraki diyaloglar için yer ayırırken sınırın altında kalmak için istek uzunluğunu ayarlayın. Adjust prompt length to stay under limit while reserving space for subsequent dialogue.
Örneğin, bir müşteri hizmetleri botunu oluştururken, sistem yuvasında rol tanımlaması için 50 token, araç yuvasında API açıklamaları için 200 token, konuşma geçmişi için 300 token ve kullanıcı girişleri için 500 token ayırtabilirsiniz. Renk kodlu ilerleme çubukları görsel olarak orantıları gösterir, sınırı yaklaştığında uyarıları tetikler - araç açıklamalarını basitleştirmek veya geçmişi kısaltmak ne zaman gösterir.
Input
gpt-4o-mini + 4 slots
Output
Per-slot tokens + remaining
Denetçi tüm metni kullanır; bu çok dönüş planlama için yuvalara göre bölünür.
Kullanıcı girişi uzunluğu tahmin edilemez. Rezervasyon, taşımayı önler - örneğin, GPT-4-32k'in 32.768 sınırı ile, diğer bölümler 32.000 token kullanırsa, kullanıcılar için sadece 768 token kalır. Kullanıcı girişleri + AI yanıtları için% 15-20 ayırmanızı, karmaşık senaryolar için daha fazla ayırmanızı öneririz.