Новости о больших языковых моделях

LLM: архитектура, обучение, сравнение моделей GPT-4, Claude, Gemini, DeepSeek, Llama. Контекстные окна, файн-тюнинг, локальный запуск и RAG.

Search

Heli Verified

07.04.2026

LLM
Star 0,0
Views 44

Gradio: использование пользовательского интерфейса с бэкендом

Gradio позволяет использовать любой пользовательский интерфейс с его бэкендом. Это достигается за счет того, что Gradio предоставляет API, который позволяет отправлять ввод в модель и получать вывод. Пользовательский интерфейс может …

Heli Verified

07.04.2026

LLM
Star 0,0
Views 35

Nvidia transformer engine: ускорение обучения и инференса

NVIDIA Transformer Engine — это библиотека, оптимизированная для ускорения обучения и инференса моделей-трансформеров. Она поддерживает смешанную точность, проверку FP8 и выполнение fallback, а также предоставляет инструменты для бенчмаркинга.

Установка и …

Heli Verified

06.04.2026

LLM
Star 0,0
Views 39

OpenClaw: 5 проектов для создания персонального AI-ассистента

OpenClaw – это платформа с открытым исходным кодом, предназначенная для разработки персональных AI-ассистентов, которые работают на вашем устройстве и подключаются к приложениям, таким как WhatsApp и Telegram. Она создана для …

Heli Verified

06.04.2026

LLM
Star 0,0
Views 30

anthropic требует оплату за использование моделей openclaw

Компания Anthropic обратилась к пользователям OpenClaw с требованием оплатить использование своих моделей. OpenClaw – это инструмент, разработанный для тестирования больших языковых моделей (LLM) путем проведения "красных команд" – попыток заставить …

Heli Verified

05.04.2026

LLM
Star 0,0
Views 42

Autoagent: автоматическая разработка и оптимизация ai-агентов

Встречайте «AutoAgent» — библиотеку с открытым исходным кодом, позволяющую ИИ-агентам разрабатывать и оптимизировать самих себя в течение ночи.

AutoAgent автоматизирует процесс итерации над агентами — изменяя системный промпт, инструменты, конфигурацию …

Heli Verified

04.04.2026

LLM
Star 0,0
Views 49

glm-5: создание агентских систем для производства

Z.AI GLM-5 позволяет создавать агентные системы, готовые к производству, используя режим мышления, вызов инструментов, потоковую передачу и многооборотные рабочие процессы.

режим мышления

Режим мышления позволяет агентам GLM-5 размышлять над проблемами, …

Heli Verified

04.04.2026

LLM
Star 0,0
Views 45

google deepmind alphaevolve: новая модель для разработки алгоритмов

Исследование Google DeepMind позволило большой языковой модели (LLM) переписывать собственные алгоритмы теории игр. Система под названием AlphaEvolve обнаружила новые варианты алгоритмов, которые работают на уровне или лучше существующих. В частности, …

Heli Verified

04.04.2026

LLM
Star 0,0
Views 40

Оценка соответствия поведения больших языковых моделей

Оценка соответствия поведенческих предрасположенностей в больших языковых моделях (LLM) становится все более важной, поскольку эти модели внедряются в различные приложения. Однако оценка соответствия – сложная задача, поскольку поведение LLM часто …

Heli Verified

04.04.2026

LLM
Star 0,0
Views 50

gemma 4: новая модель от google deepmind

Gemma 4 – это новая модель, выпущенная компанией Google DeepMind. Она является частью семейства Gemma, в которое входят модели с ~5B, 8B, 26B (4B active MoE) и 31B параметрами. Модель …

Heli Verified

03.04.2026

LLM
Star 0,0
Views 36

5 полезных docker-контейнера для разработчиков агентов

В качестве разработчиков, работающих с агентами, нам необходимо иметь набор инструментов, которые позволят нам быстро создавать, тестировать и развертывать наши агенты. Docker — отличный способ добиться этого, поскольку он позволяет …

Heli Verified

03.04.2026

LLM
Star 0,0
Views 36

falcon perception: новая модель для привязки и сегментации объектов

Институт технологий искусственного интеллекта (TII) выпустил Falcon Perception — трансформер с 600 миллионами параметров, использующий раннее слияние (early-fusion) для решения задач привязки и сегментации объектов на изображениях по текстовым запросам …

Heli Verified

03.04.2026

LLM
Star 0,0
Views 51

arcee ai trinity large thinking: новая модель для агентов

Arcee AI выпустила Trinity Large Thinking, модель рассуждений с открытым исходным кодом Apache 2.0, предназначенную для агентов с долгосрочным планированием и использования инструментов. Модель предназначена для решения сложных задач, требующих …