Новости о больших языковых моделях

LLM: архитектура, обучение, сравнение моделей GPT-4, Claude, Gemini, DeepSeek, Llama. Контекстные окна, файн-тюнинг, локальный запуск и RAG.

Heli

07.04.2026

LLM

0,0

Gradio: использование пользовательского интерфейса с бэкендом

Gradio позволяет использовать любой пользовательский интерфейс с его бэкендом. Это достигается за счет того, что Gradio предоставляет API, который позволяет отправлять ввод в модель и получать вывод. Пользовательский интерфейс может …

Heli

07.04.2026

LLM

0,0

Nvidia transformer engine: ускорение обучения и инференса

NVIDIA Transformer Engine — это библиотека, оптимизированная для ускорения обучения и инференса моделей-трансформеров. Она поддерживает смешанную точность, проверку FP8 и выполнение fallback, а также предоставляет инструменты для бенчмаркинга.

Установка и …

Heli

06.04.2026

LLM

0,0

OpenClaw: 5 проектов для создания персонального AI-ассистента

OpenClaw – это платформа с открытым исходным кодом, предназначенная для разработки персональных AI-ассистентов, которые работают на вашем устройстве и подключаются к приложениям, таким как WhatsApp и Telegram. Она создана для …

Heli

06.04.2026

LLM

0,0

anthropic требует оплату за использование моделей openclaw

Компания Anthropic обратилась к пользователям OpenClaw с требованием оплатить использование своих моделей. OpenClaw – это инструмент, разработанный для тестирования больших языковых моделей (LLM) путем проведения "красных команд" – попыток заставить …

Heli

05.04.2026

LLM

0,0

Autoagent: автоматическая разработка и оптимизация ai-агентов

Встречайте «AutoAgent» — библиотеку с открытым исходным кодом, позволяющую ИИ-агентам разрабатывать и оптимизировать самих себя в течение ночи.

AutoAgent автоматизирует процесс итерации над агентами — изменяя системный промпт, инструменты, конфигурацию …

Heli

04.04.2026

LLM

0,0

glm-5: создание агентских систем для производства

Z.AI GLM-5 позволяет создавать агентные системы, готовые к производству, используя режим мышления, вызов инструментов, потоковую передачу и многооборотные рабочие процессы.

режим мышления

Режим мышления позволяет агентам GLM-5 размышлять над проблемами, …

Heli

04.04.2026

LLM

0,0

google deepmind alphaevolve: новая модель для разработки алгоритмов

Исследование Google DeepMind позволило большой языковой модели (LLM) переписывать собственные алгоритмы теории игр. Система под названием AlphaEvolve обнаружила новые варианты алгоритмов, которые работают на уровне или лучше существующих. В частности, …

Heli

04.04.2026

LLM

0,0

Оценка соответствия поведения больших языковых моделей

Оценка соответствия поведенческих предрасположенностей в больших языковых моделях (LLM) становится все более важной, поскольку эти модели внедряются в различные приложения. Однако оценка соответствия – сложная задача, поскольку поведение LLM часто …

Heli

04.04.2026

LLM

0,0

gemma 4: новая модель от google deepmind

Gemma 4 – это новая модель, выпущенная компанией Google DeepMind. Она является частью семейства Gemma, в которое входят модели с ~5B, 8B, 26B (4B active MoE) и 31B параметрами. Модель …

Heli

03.04.2026

LLM

0,0

5 полезных docker-контейнера для разработчиков агентов

В качестве разработчиков, работающих с агентами, нам необходимо иметь набор инструментов, которые позволят нам быстро создавать, тестировать и развертывать наши агенты. Docker — отличный способ добиться этого, поскольку он позволяет …

Heli

03.04.2026

LLM

0,0

falcon perception: новая модель для привязки и сегментации объектов

Институт технологий искусственного интеллекта (TII) выпустил Falcon Perception — трансформер с 600 миллионами параметров, использующий раннее слияние (early-fusion) для решения задач привязки и сегментации объектов на изображениях по текстовым запросам …

Heli

03.04.2026

LLM

0,0

arcee ai trinity large thinking: новая модель для агентов

Arcee AI выпустила Trinity Large Thinking, модель рассуждений с открытым исходным кодом Apache 2.0, предназначенную для агентов с долгосрочным планированием и использования инструментов. Модель предназначена для решения сложных задач, требующих …

Назад 1 ••• 3 4 5 6 7 8 9 ••• 15 Вперед