Новости о больших языковых моделях
LLM: архитектура, обучение, сравнение моделей GPT-4, Claude, Gemini, DeepSeek, Llama. Контекстные окна, файн-тюнинг, локальный запуск и RAG.
Heli
03.04.2026
Gemma 4: новая мультимодальная модель от Google
Мы рады представить Gemma 4, нашу самую мощную мультимодальную модель на сегодняшний день. Gemma 4 — это модель следующего поколения, разработанная для обеспечения передовых возможностей понимания и генерации, как текста, …
Heli
03.04.2026
лучшие торговые площадки навыков для ai-агентов
В последние месяцы наблюдается рост числа платформ, предлагающих навыки для ИИ-агентов. Эти торговые площадки позволяют разработчикам оснащать своих агентов различными возможностями, такими как доступ к поисковым системам, инструментам для анализа …
Heli
03.04.2026
google gemma 4, nvidia и openclaw меняют локальный ai
Google Gemma 4, NVIDIA и OpenClaw меняют ситуацию с локальным агентным ИИ, предлагая решения для преодоления "налога на токены". Традиционно, развертывание локальных больших языковых моделей (LLM) сталкивалось с проблемой высокой …
Heli
03.04.2026
think-anywhere: новый подход к генерации кода с помощью llm
Приложение для безопасного чата TeleGuard, которое скачали более миллиона раз, позиционируется как безопасный способ общения. Однако приложение загружает приватные ключи пользователей на сервер компании, что делает расшифровку сообщений тривиальной.
…
Heli
03.04.2026
Моделирование мира "точно в срок" с использованием llm
Моделирование мира "точно в срок" поддерживает человеческое планирование и рассуждение.
Моделирование мира — это процесс создания внутренней репрезентации окружающей среды, который играет важную роль в человеческом планировании и рассуждении. Традиционно …
Heli
02.04.2026
10 ключевых инструментов для работы с большими языковыми моделями к 2026 году
К 2026 году каждая команда, работающая с большими языковыми моделями (LLM), должна иметь в своем арсенале 10 ключевых инструментов. Эти инструменты необходимы для эффективного управления жизненным циклом LLM, от разработки …
Heli
02.04.2026
agentscope: создание рабочих процессов с помощью react и многоагентных систем
В этой статье рассматривается создание рабочих процессов AgentScope, готовых к производственному использованию, с использованием агентов ReAct, пользовательских инструментов, многоагентных дебатов, структурированного вывода и параллельных конвейеров.
AgentScope позволяет разработчикам создавать агентов, …
Heli
02.04.2026
ibm granite 4.0 3b vision: новая модель языка зрения
IBM выпустила Granite 4.0 3B Vision – новую модель языка зрения для извлечения данных из корпоративных документов. Эта модель обладает 3 миллиардами параметров.
Granite 4.0 3B Vision создана для обработки …
Heli
02.04.2026
liquid ai releases lfm2.5-350m llm
Liquid AI выпустила модель LFM2.5-350M, компактную модель с 350 миллионами параметров, обученную на 28 триллионах токенов с использованием обучения с подкреплением.
Heli
02.04.2026
z.ai запускает glm-5v-turbo, мультимодальную модель кодирования зрения
Z.ai запускает GLM-5V-Turbo, модель кодирования зрения, изначально мультимодальную и оптимизированную для OpenClaw, а также рабочих процессов агентной инженерии с высокой пропускной способностью.
GLM-5V-Turbo оптимизирован для использования с OpenClaw, платформой агентной …
Heli
02.04.2026
Gemma 3 1b instruct: создание системы генерации
Для создания готовой к производству системы генерации на основе модели Gemma 3 1B Instruct, можно использовать библиотеки Hugging Face Transformers и Colab для инференса.
Для начала необходимо установить необходимые библиотеки, …
Heli
01.04.2026
Создавайте эффективных ai-агентов с google antigravity
Создавайте более эффективных агентов искусственного интеллекта с помощью навыков и рабочих процессов Google Antigravity.
Google Antigravity — это платформа, предназначенная для создания агентов искусственного интеллекта. Она предоставляет набор инструментов и …