Новости о больших языковых моделях

LLM: архитектура, обучение, сравнение моделей GPT-4, Claude, Gemini, DeepSeek, Llama. Контекстные окна, файн-тюнинг, локальный запуск и RAG.

Search

Heli Verified

26.02.2026

LLM
Star 0,0
Views 27

LM Link: Запуск LLM на удалённом GPU стал проще

Разработчики часто сталкиваются с проблемой: мощный компьютер с видеокартой для работы с ИИ есть дома или в офисе, а в поездках приходится пользоваться менее производительным ноутбуком. Подключение к "большой машине" …

Heli Verified

25.02.2026

LLM
Star 0,0
Views 25

Liquid AI представляет LFM2-24B-A2B: эффективная LLM

В гонке генеративных моделей все большее значение приобретает не размер, а эффективность. Компания Liquid AI выпустила LFM2-24B-A2B – 24-миллиардную модель, способную работать на устройствах с ограниченными ресурсами.

Новая архитектура сочетает …

Heli Verified

25.02.2026

LLM
Star 0,0
Views 54

Alibaba представляет Qwen 3.5: новые LLM с высокой эффективностью

Alibaba представила новую серию больших языковых моделей Qwen 3.5, делая ставку на архитектурную эффективность и качество данных, а не на простое увеличение размера. Модели Qwen3.5-Flash, Qwen3.5-35B-A3B, Qwen3.5-122B-A10B и Qwen3.5-27B демонстрируют, …

Тут может быть ваша реклама

Пишите info@aisferaic.ru

Heli Verified

24.02.2026

LLM
Star 0,0
Views 23

Дистилляция для китайских LLM: что это и почему важно?

В последнее время активно обсуждается вопрос о "дистилляции" — использовании результатов работы более мощной модели для обучения менее мощной. Изначально этот термин имел более техническое значение, связанное со способом обучения, …

Heli Verified

23.02.2026

LLM
Star 0,0
Views 21

3LM: Новый тест для оценки LLM на арабском языке

Разработан новый комплексный тест под названием 3LM, предназначенный для оценки возможностей больших языковых моделей (LLM) в области STEM (наука, технология, инженерия и математика) и программирования на арабском языке. До этого …

Heli Verified

23.02.2026

LLM
Star 0,0
Views 29

TruLens и OpenAI: Инструментирование LLM-приложений

TruLens — это инструмент для отслеживания и оценки LLM-приложений, позволяющий регистрировать этапы работы, вычислять показатели и сравнивать различные версии. Вместо рассмотрения LLM как "черного ящика", TruLens позволяет анализировать входные данные, …

Тут может быть ваша реклама

Пишите info@aisferaic.ru

Heli Verified

22.02.2026

LLM
Star 0,0
Views 29

FlowPrefill: Оптимизация больших языковых моделей

Разработчики представили FlowPrefill — систему обслуживания больших языковых моделей (LLM), направленную на снижение задержек при обработке запросов. Проблема возникает из-за того, что долго выполняющиеся запросы могут блокировать ресурсы, необходимые для …

Heli Verified

22.02.2026

LLM
Star 0,0
Views 30

Google: Новый подход к точности и экономии LLM

Ученые из Google и Университета Вирджинии предложили новый способ оценки "глубины мышления" больших языковых моделей (LLM). Ранее считалось, что чем длиннее рассуждения модели, тем лучше. Однако новое исследование показывает, что …

Heli Verified

19.02.2026

LLM
Star 0,0
Views 48

Ученые выявили скрытые черты больших языковых моделей

Команде исследователей из MIT и Калифорнийского университета в Сан-Диего удалось разработать метод для обнаружения и манипулирования скрытыми предрассудками, настроениями и другими абстрактными концепциями, которые хранятся в больших языковых моделях (LLM), …