Новости о больших языковых моделях
LLM: архитектура, обучение, сравнение моделей GPT-4, Claude, Gemini, DeepSeek, Llama. Контекстные окна, файн-тюнинг, локальный запуск и RAG.
Heli
19.03.2026
Пятиуровневая структура безопасности для автономных агентов llm и ещё 17 новости
Пятиуровневая структура безопасности для автономных агентов llm
Исследователи из Университета Цинхуа и Ant Group представили пятиуровневую структуру безопасности, ориентированную на жизненный цикл, для снижения уязвимостей автономных агентов LLM в OpenClaw.
…
Heli
18.03.2026
когда ИИ оценивает ИИ: скрытые опасности выравнивания
Когда ИИ оценивает ИИ: скрытые опасности моделей рассуждений в процессе выравнивания
Модели рассуждений, такие как языковые модели больших размеров (LLM), все чаще используются для оценки других ИИ, чтобы убедиться, что …
Heli
16.03.2026
Claw AI: безопасная альтернатива OpenClaw от Genspark и ещё 3 новости
Claw AI: безопасная альтернатива OpenClaw от Genspark
Genspark запустила ассистента Claw AI как безопасную альтернативу открытым платформам агентов, таким как OpenClaw. Claw AI позволяет предприятиям создавать и развертывать собственные агенты …
Heli
15.03.2026
langchain deep agents: продвинутые агенты для сложных задач
LangChain выпустила Deep Agents — структурированный механизм выполнения для планирования, памяти и изоляции контекста в многошаговых агентах ИИ. Deep Agents позволяют разработчикам создавать более надёжных и сложных агентов, которые могут …
Heli
15.03.2026
Безопасные конвейеры llm с outlines и pydantic и ещё 15 новости
Безопасные конвейеры llm с outlines и pydantic
В статье описывается способ создания безопасных, с ограничениями схем и управляемых функциями конвейеров больших языковых моделей (LLM) с использованием Outlines и Pydantic.
Использование …
Heli
14.03.2026
gstack: система разработки на основе claude от гарри тана
Гарри Тан выпустил gstack, систему для планирования, ревью кода, тестирования и релиза, основанную на Claude. Это open-source система.
gstack позволяет пользователям планировать, писать, тестировать и развертывать код с помощью Claude. …
Heli
13.03.2026
mcp и навыки ИИ-агентов: сравнение подходов
Протокол контекста модели (MCP) и навыки ИИ-агентов — это два разных подхода к структурированию инструментов и поведенческих рекомендаций для больших языковых моделей (LLM). MCP фокусируется на предоставлении LLM структурированных инструментов, …
Heli
13.03.2026
genesis ai vivian sun to advance commercialization
Genesis AI Vivian Sun to Advance Commercialization
Beyond the Illusion of Consensus: From Surface Heuristics to Knowledge-Grounded Evaluation in LLM-as-a-Judge
Исследование "Beyond the Illusion of Consensus: From Surface Heuristics …
Heli
13.03.2026
Агент по анализу данных занял первое место в dabstep
Мы создали агента, который мыслит как специалист по данным и занял первое место в рейтинге DABStep благодаря повторно используемому созданию инструментов. Агент использует подход, основанный на инструментах, и опирается на …
Heli
13.03.2026
7 фреймворков для организации работы ai-агентов
В настоящее время существует множество инструментов для организации работы агентов искусственного интеллекта (ИИ), однако выбор наиболее подходящего может быть сложной задачей. Ниже представлен обзор семи ведущих фреймворков для организации работы …
Heli
12.03.2026
Google peft: маленькие модели ai превосходят гигантов
Инструмент от Google помогает небольшим моделям искусственного интеллекта превзойти гигантов.
Google разработал инструмент под названием "Parameter-Efficient Fine-Tuning" (PEFT). Этот инструмент предназначен для того, чтобы небольшие модели искусственного интеллекта могли конкурировать …
Heli
12.03.2026
Будущее искусственного интеллекта и науки и ещё 12 новости
Будущее искусственного интеллекта и науки
В статье рассматриваются вопросы будущего искусственного интеллекта (ИИ) и его взаимосвязи с математическими и физическими науками. Обсуждаются возможности и ограничения ИИ, а также его потенциальное …