LLM

Вероятностное объяснение возникновения рассуждений в RLVR и ещё 3 новости

Heli
Автор
Heli
Опубликовано 15.02.2026
0,0
Views 100

Вероятностное объяснение возникновения рассуждений в RLVR

Исследователи предложили новую интерпретацию, почему большие языковые модели (LLM), обучаемые через подкрепление с проверяемыми наградами (RLVR), начинают демонстрировать сложные рассуждения. По их гипотезе, это не появление совсем новых способностей, а усиление уже существующих — за счёт повышения вероятности успешного выполнения отдельных шагов.

В экспериментах модели обучали только на одном шаге вычислений (в рамках фреймворка Algebrarium), а затем проверяли их способность решать многошаговые задачи. Результаты подтвердили, что RLVR расширяет доступные варианты решений, усиливая существующие навыки. Качество итогового ответа напрямую связано с совместной вероятностью успешных отдельных шагов (коэффициент корреляции Пирсона от 0,69 до 0,96). При этом глобальная оптимизация награды может привести к жертвованию отдельными навыками ради общего результата.

Google представила WebMCP для прямого взаимодействия ИИ-агентов с сайтами

Google запустила протокол WebMCP, который позволяет сайтам общаться с ИИ-агентами напрямую, без имитации действий человека. Ранее агенты «просматривали» интерфейс как картинку, что приводило к ошибкам при малейшем изменении верстки. Теперь сайт описывает свои функции как набор структурированных инструментов, а браузер выступает посредником.

Для разработчиков доступны два пути интеграции: декларативный — через HTML-атрибуты toolname и tooldescription в формах, и императивный — с помощью JavaScript API navigator.modelContext.registerTool(). Второй способ подходит для сложных сценариев с несколькими шагами и работает в рамках текущей сессии пользователя.

Протокол входит в Early Preview Program (EPP), который запускается вместе с Chrome 146. Участники EPP могут протестировать функции и настроить описания инструментов под разные языковые модели. По оценкам Google, такой подход сокращает вычислительные затраты на 67 % и повышает точность выполнения задач до 98 %.

WebMCP работает по принципу «разрешение первым»: агент не может выполнить действие без одобрения браузера и, в большинстве случаев, пользователя. Это повышает безопасность и сохраняет контроль над действиями ИИ.

OpenClaw: локальный ИИ-ассистент с поддержкой WhatsApp и 50+ интеграций

OpenClaw — самоходный ИИ-помощник, который работает на вашем устройстве и интегрируется в привычные приложения: WhatsApp, Telegram, Slack, Discord и другие. Он отвечает на вопросы, автоматизирует задачи, работает с файлами и сервисами, поддерживает голосовое общение — всё это при полном контроле над данными.

Проект уже набрал более 150 тысяч звёзд на GitHub. Он поддерживает 50+ интеграций, включая Notion, Obsidian, GitHub, Spotify, Gmail и Home Assistant. Доступна работа с облачными и локальными моделями, расширение функционала через «навыки», а также поддержка macOS, Windows, Linux, iOS и Android.

Для старта достаточно установить через одну команду, указать API-ключ для chosen LLM (например, GPT-5.1), подключить WhatsApp по QR-коду и запустить Gateway — службу управления каналами. После настройки можно общаться с ассистентом прямо из мессенджера — в том числе и с самим собой, если используется личный номер.

Лучшие AI-генераторы изображений без фильтрации контента

Некоторые пользователи устают от ограничений в AI-генераторах — когда ввод, по их мнению, полностью безобидный, блокируется без объяснений. Это особенно раздражает творческих людей, которым важна свобода инициативы, а не «воспитательное» oversight.

Основная проблема — не в запретах как таковых, а в распределении ответственности. Снижение фильтрации означает, что пользователь сам несёт за результат: за промпт, за генерацию, за использование. Такой подход подходит тем, кто хочет полный контроль над процессом и результатом.

Из популярных решений выделяются Candy AI, Ourdream и MyDreamCompanion — платформы, интегрирующие генерацию изображений в чат-сервисы с персонализацией персонажей. Также упоминаются Promptchan, Seduced AI, GPTGirlfriend и DeepMode. Большинство из них сфокусированы на генерации изображений персонажей, а не на универсальной художественной работе.

Авторизуйтесь, чтобы оставить комментарий.

Комментариев: 0

Нет комментариев.

Тут может быть ваша реклама

Пишите info@aisferaic.ru

Похожие новости