Проверка окна контекста

Вставьте Prompt или документ, чтобы увидеть верхний предел контекста каждой основной модели и оценить занятость токена. Перед выходом на линию быстро определите, нужно ли изменять или изменять модель.

Конфиденциальность: обрабатывается локально, никогда не загружается.

↓ Вставьте в область ввода ниже, чтобы мгновенно увидеть результаты

待检查文本

粘贴 Prompt、文档或对话内容，查看各模型上下文占用。

模型	估算 Token	上下文上限	占用	状态
GPT-4o	22	128,000	0.0%	可容纳
GPT-4o mini	22	128,000	0.0%	可容纳
GPT-4.1	22	1,047,576	0.0%	可容纳
o3-mini	22	200,000	0.0%	可容纳
Claude Sonnet 4	22	200,000	0.0%	可容纳
Claude Haiku 3.5	22	200,000	0.0%	可容纳
Gemini 2.0 Flash	22	1,048,576	0.0%	可容纳

Примечания

如何解读

绿色「可容纳」表示估算 Token 未超过模型上下文窗口；红色「超出」需裁剪或换更大窗口模型。 Token 为启发式估算，与官方计数器可能略有偏差。

Вставьте Prompt или документ, чтобы увидеть верхний предел контекста каждой основной модели и оценить занятость токена. Перед выходом на линию быстро определите, нужно ли изменять или изменять модель.

Быстрый старт

Вставить текст

Поддержка длинных файлов и кодов; Обновление таблиц в режиме реального времени.
Вид столбца состояния

Зеленый может вместить; Красный больше, чем нужно удалить.

Оценитель & Token

Этот инструмент сравнивается с окном модели; Оценочник Token фокусируется на статистике символов и слов.

Особенности и случаи использования

Оцените количество токенов, занимаемых текстом, и сравните его с общим контекстным окном модели, указывая, можно ли его отрезать.

Оценка перед вопросами и ответами для длинных документов, выбор подходящей модели, результаты поиска RAG используются при планировании объема перед соединением.

Типичный рабочий процесс

При подготовке к отправке длинного текста в модель ИИ вставьте содержимое в этот инструмент. Система автоматически вычисляет количество токенов и отображает ограничения контекстного окна для основных моделей. Зеленая маркировка означает, что контент подходит, а красная указывает на необходимость обрезки или замены модели более высокой емкости.

Для файлов кода рекомендуется сначала удалить комментарии и пустые строки, а затем проверить их. В случае приближения к лимиту (например, GPT - 4 дисплей занимает 90%) можно нажать на « Рекомендации по оптимизации», чтобы получить целевые советы, такие как разделение сегментов или переход на потоковую обработку API.

Примеры

Длинный Prompt

Input

10k+ char document

Output

Per-model fit/overflow

FAQ

Согласны ли они с официальными цифрами?

Для эвристических оценок; Проверьте границы с помощью Tokenizer каждого производителя.

Почему у разных инструментов разные результаты подсчета токенов?

Разница в основном связана с версией кодера (например, старый и новый GPT - 3.5) или с вычислением специальных токенов (например, системных подсказок). Этот инструмент поддерживает переключение кодеров и четко указывает, включены ли в них метаинструкции, и результаты соответствуют официальным API.

Соответствующие инструменты

Оценка токенов Калькулятор LLM Заполнение шаблонов Prompt