Google: Новый подход к точности и экономии LLM

Автор

Heli

Опубликовано 22.02.2026

0,0

Ученые из Google и Университета Вирджинии предложили новый способ оценки "глубины мышления" больших языковых моделей (LLM). Ранее считалось, что чем длиннее рассуждения модели, тем лучше. Однако новое исследование показывает, что простое увеличение количества токенов не гарантирует точности.

Вместо этого исследователи предлагают использовать "коэффициент глубокого мышления" (DTR), который измеряет, насколько сильно меняются прогнозы модели на разных слоях нейронной сети. Оказалось, что этот показатель гораздо лучше коррелирует с точностью, чем просто длина ответа.

Новый подход, названный Think@n, позволяет сократить вычислительные затраты почти вдвое, отсеивая "неперспективные" варианты ответов на ранней стадии. В тестах на математическом бенчмарке AIME 25, Think@n показал более высокую точность, чем стандартные методы, и при этом снизил затраты на 49%.

Авторизуйтесь, чтобы оставить комментарий.

Комментариев: 0

Похожие новости

НАВИГАЦИЯ

МЕНЮ

Google: Новый подход к точности и экономии LLM

Похожие новости

Ученые выявили скрытые черты больших языковых моделей

Исследование MIT: рейтинги больших языковых моделей могут быть нестабильными

Anthropic Claude 4.6 Sonnet: миллион токенов и адаптивное мышление

ИИ-подхалимство: почему нейросети соглашаются с пользователем

Многоуровневые фильтры безопасности для LLM: защита от атак | Новости ИИ

NVIDIA представила KVTC — сжатие KV-кэшей в LLM до 20 раз