Проверка окна контекста

Вставьте Prompt или документ, чтобы увидеть верхний предел контекста каждой основной модели и оценить занятость токена. Перед выходом на линию быстро определите, нужно ли изменять или изменять модель.

Конфиденциальность: обрабатывается локально, никогда не загружается.

↓ Вставьте в область ввода ниже, чтобы мгновенно увидеть результаты

待检查文本

粘贴 Prompt、文档或对话内容,查看各模型上下文占用。

模型估算 Token上下文上限占用状态
GPT-4o22128,0000.0%可容纳
GPT-4o mini22128,0000.0%可容纳
GPT-4.1221,047,5760.0%可容纳
o3-mini22200,0000.0%可容纳
Claude Sonnet 422200,0000.0%可容纳
Claude Haiku 3.522200,0000.0%可容纳
Gemini 2.0 Flash221,048,5760.0%可容纳

Примечания

如何解读

绿色「可容纳」表示估算 Token 未超过模型上下文窗口;红色「超出」需裁剪或换更大窗口模型。 Token 为启发式估算,与官方计数器可能略有偏差。

Вставьте Prompt или документ, чтобы увидеть верхний предел контекста каждой основной модели и оценить занятость токена. Перед выходом на линию быстро определите, нужно ли изменять или изменять модель.

Быстрый старт

  1. Вставить текст

    Поддержка длинных файлов и кодов; Обновление таблиц в режиме реального времени.

  2. Вид столбца состояния

    Зеленый может вместить; Красный больше, чем нужно удалить.

Оценитель & Token

Этот инструмент сравнивается с окном модели; Оценочник Token фокусируется на статистике символов и слов.

Особенности и случаи использования

Оцените количество токенов, занимаемых текстом, и сравните его с общим контекстным окном модели, указывая, можно ли его отрезать.

Оценка перед вопросами и ответами для длинных документов, выбор подходящей модели, результаты поиска RAG используются при планировании объема перед соединением.

Типичный рабочий процесс

При подготовке к отправке длинного текста в модель ИИ вставьте содержимое в этот инструмент. Система автоматически вычисляет количество токенов и отображает ограничения контекстного окна для основных моделей. Зеленая маркировка означает, что контент подходит, а красная указывает на необходимость обрезки или замены модели более высокой емкости.

Для файлов кода рекомендуется сначала удалить комментарии и пустые строки, а затем проверить их. В случае приближения к лимиту (например, GPT - 4 дисплей занимает 90%) можно нажать на « Рекомендации по оптимизации», чтобы получить целевые советы, такие как разделение сегментов или переход на потоковую обработку API.

Примеры

Длинный Prompt

Input

10k+ char document

Output

Per-model fit/overflow

FAQ

Согласны ли они с официальными цифрами?

Для эвристических оценок; Проверьте границы с помощью Tokenizer каждого производителя.

Почему у разных инструментов разные результаты подсчета токенов?

Разница в основном связана с версией кодера (например, старый и новый GPT - 3.5) или с вычислением специальных токенов (например, системных подсказок). Этот инструмент поддерживает переключение кодеров и четко указывает, включены ли в них метаинструкции, и результаты соответствуют официальным API.