Новости о больших языковых моделях
LLM: архитектура, обучение, сравнение моделей GPT-4, Claude, Gemini, DeepSeek, Llama. Контекстные окна, файн-тюнинг, локальный запуск и RAG.
Heli
07.04.2026
Gradio: использование пользовательского интерфейса с бэкендом
Gradio позволяет использовать любой пользовательский интерфейс с его бэкендом. Это достигается за счет того, что Gradio предоставляет API, который позволяет отправлять ввод в модель и получать вывод. Пользовательский интерфейс может …
Heli
07.04.2026
Nvidia transformer engine: ускорение обучения и инференса
NVIDIA Transformer Engine — это библиотека, оптимизированная для ускорения обучения и инференса моделей-трансформеров. Она поддерживает смешанную точность, проверку FP8 и выполнение fallback, а также предоставляет инструменты для бенчмаркинга.
Установка и …
Heli
06.04.2026
OpenClaw: 5 проектов для создания персонального AI-ассистента
OpenClaw – это платформа с открытым исходным кодом, предназначенная для разработки персональных AI-ассистентов, которые работают на вашем устройстве и подключаются к приложениям, таким как WhatsApp и Telegram. Она создана для …
Heli
06.04.2026
anthropic требует оплату за использование моделей openclaw
Компания Anthropic обратилась к пользователям OpenClaw с требованием оплатить использование своих моделей. OpenClaw – это инструмент, разработанный для тестирования больших языковых моделей (LLM) путем проведения "красных команд" – попыток заставить …
Heli
05.04.2026
Autoagent: автоматическая разработка и оптимизация ai-агентов
Встречайте «AutoAgent» — библиотеку с открытым исходным кодом, позволяющую ИИ-агентам разрабатывать и оптимизировать самих себя в течение ночи.
AutoAgent автоматизирует процесс итерации над агентами — изменяя системный промпт, инструменты, конфигурацию …
Heli
04.04.2026
glm-5: создание агентских систем для производства
Z.AI GLM-5 позволяет создавать агентные системы, готовые к производству, используя режим мышления, вызов инструментов, потоковую передачу и многооборотные рабочие процессы.
режим мышления
Режим мышления позволяет агентам GLM-5 размышлять над проблемами, …
Heli
04.04.2026
google deepmind alphaevolve: новая модель для разработки алгоритмов
Исследование Google DeepMind позволило большой языковой модели (LLM) переписывать собственные алгоритмы теории игр. Система под названием AlphaEvolve обнаружила новые варианты алгоритмов, которые работают на уровне или лучше существующих. В частности, …
Heli
04.04.2026
Оценка соответствия поведения больших языковых моделей
Оценка соответствия поведенческих предрасположенностей в больших языковых моделях (LLM) становится все более важной, поскольку эти модели внедряются в различные приложения. Однако оценка соответствия – сложная задача, поскольку поведение LLM часто …
Heli
04.04.2026
gemma 4: новая модель от google deepmind
Gemma 4 – это новая модель, выпущенная компанией Google DeepMind. Она является частью семейства Gemma, в которое входят модели с ~5B, 8B, 26B (4B active MoE) и 31B параметрами. Модель …
Heli
03.04.2026
5 полезных docker-контейнера для разработчиков агентов
В качестве разработчиков, работающих с агентами, нам необходимо иметь набор инструментов, которые позволят нам быстро создавать, тестировать и развертывать наши агенты. Docker — отличный способ добиться этого, поскольку он позволяет …
Heli
03.04.2026
falcon perception: новая модель для привязки и сегментации объектов
Институт технологий искусственного интеллекта (TII) выпустил Falcon Perception — трансформер с 600 миллионами параметров, использующий раннее слияние (early-fusion) для решения задач привязки и сегментации объектов на изображениях по текстовым запросам …
Heli
03.04.2026
arcee ai trinity large thinking: новая модель для агентов
Arcee AI выпустила Trinity Large Thinking, модель рассуждений с открытым исходным кодом Apache 2.0, предназначенную для агентов с долгосрочным планированием и использования инструментов. Модель предназначена для решения сложных задач, требующих …