Новости о больших языковых моделях
LLM: архитектура, обучение, сравнение моделей GPT-4, Claude, Gemini, DeepSeek, Llama. Контекстные окна, файн-тюнинг, локальный запуск и RAG.
Heli
26.02.2026
LM Link: Запуск LLM на удалённом GPU стал проще
Разработчики часто сталкиваются с проблемой: мощный компьютер с видеокартой для работы с ИИ есть дома или в офисе, а в поездках приходится пользоваться менее производительным ноутбуком. Подключение к "большой машине" …
Heli
25.02.2026
Liquid AI представляет LFM2-24B-A2B: эффективная LLM
В гонке генеративных моделей все большее значение приобретает не размер, а эффективность. Компания Liquid AI выпустила LFM2-24B-A2B – 24-миллиардную модель, способную работать на устройствах с ограниченными ресурсами.
Новая архитектура сочетает …
Heli
25.02.2026
Alibaba представляет Qwen 3.5: новые LLM с высокой эффективностью
Alibaba представила новую серию больших языковых моделей Qwen 3.5, делая ставку на архитектурную эффективность и качество данных, а не на простое увеличение размера. Модели Qwen3.5-Flash, Qwen3.5-35B-A3B, Qwen3.5-122B-A10B и Qwen3.5-27B демонстрируют, …
Тут может быть ваша реклама
Пишите info@aisferaic.ru
Heli
24.02.2026
Дистилляция для китайских LLM: что это и почему важно?
В последнее время активно обсуждается вопрос о "дистилляции" — использовании результатов работы более мощной модели для обучения менее мощной. Изначально этот термин имел более техническое значение, связанное со способом обучения, …
Heli
23.02.2026
3LM: Новый тест для оценки LLM на арабском языке
Разработан новый комплексный тест под названием 3LM, предназначенный для оценки возможностей больших языковых моделей (LLM) в области STEM (наука, технология, инженерия и математика) и программирования на арабском языке. До этого …
Heli
23.02.2026
TruLens и OpenAI: Инструментирование LLM-приложений
TruLens — это инструмент для отслеживания и оценки LLM-приложений, позволяющий регистрировать этапы работы, вычислять показатели и сравнивать различные версии. Вместо рассмотрения LLM как "черного ящика", TruLens позволяет анализировать входные данные, …
Тут может быть ваша реклама
Пишите info@aisferaic.ru
Heli
22.02.2026
FlowPrefill: Оптимизация больших языковых моделей
Разработчики представили FlowPrefill — систему обслуживания больших языковых моделей (LLM), направленную на снижение задержек при обработке запросов. Проблема возникает из-за того, что долго выполняющиеся запросы могут блокировать ресурсы, необходимые для …
Heli
22.02.2026
Google: Новый подход к точности и экономии LLM
Ученые из Google и Университета Вирджинии предложили новый способ оценки "глубины мышления" больших языковых моделей (LLM). Ранее считалось, что чем длиннее рассуждения модели, тем лучше. Однако новое исследование показывает, что …
Heli
19.02.2026
Ученые выявили скрытые черты больших языковых моделей
Команде исследователей из MIT и Калифорнийского университета в Сан-Диего удалось разработать метод для обнаружения и манипулирования скрытыми предрассудками, настроениями и другими абстрактными концепциями, которые хранятся в больших языковых моделях (LLM), …