Новости о больших языковых моделях
LLM: архитектура, обучение, сравнение моделей GPT-4, Claude, Gemini, DeepSeek, Llama. Контекстные окна, файн-тюнинг, локальный запуск и RAG.
Heli
22.02.2026
Google: Новый подход к точности и экономии LLM и ещё 3 новости
Google: Новый подход к точности и экономии LLM
Ученые из Google и Университета Вирджинии предложили новый способ оценки "глубины мышления" больших языковых моделей (LLM). Ранее считалось, что чем длиннее рассуждения …
Heli
15.02.2026
Вероятностное объяснение возникновения рассуждений в RLVR и ещё 3 новости
Вероятностное объяснение возникновения рассуждений в RLVR
Исследователи предложили новую интерпретацию, почему большие языковые модели (LLM), обучаемые через подкрепление с проверяемыми наградами (RLVR), начинают демонстрировать сложные рассуждения. По их гипотезе, это …
Heli
10.02.2026
Как обучать LLM локально через федеративное обучение с LoRA и ещё 12 новости
Как обучать LLM локально через федеративное обучение с LoRA
Как обучать большие языковые модели локально без сбора данных в центре
В руководстве показано, как провести федеративное дообучение большой языковой модели …