AI news

ai agent modeling as personas and beyond

Heli
Автор
Heli
Опубликовано 05.03.2026
0,0
Views 1

Моделирование AI-агентов как персон

3 марта 2026 года было применено Persona Ecosystem Playground (PEP) к платформе Moltbook для создания и проверки разговорных персон на основе 41 300 публикаций с использованием k-means кластеризации и генерации с помощью извлечения информации. Результаты показали, что персоны семантически ближе к своему исходному кластеру, чем к другим (t(61) = 17.85, p < .001, d = 2.20; среднее значение для собственного кластера M = 0.71 против M = 0.35 для других кластеров). Эти персоны затем были использованы в структурированном обсуждении из девяти ходов и сообщения, сгенерированные в ходе симуляции, были значительно выше вероятности отнесены к своей исходной персоне (биномиальный тест, p < .001). Это указывает на то, что моделирование экосистемы на основе персон может представлять поведенческое разнообразие в популяциях AI-агентов.

AI в космической физике: конститутивная семантика границ для открытых AI-институтов

3 марта 2026 года была представлена AI Space Physics как конститутивная семантика для открытых, саморасширяющихся AI-институтов. Определена минимальная модель состояния с типизированными граничными каналами, семантикой ограниченного охвата и дисциплиной свидетельства мембраны. Основное семейство законов (P-1, P-1a, P-1b, P-1c) требует полноты свидетелей, не-обходного опосредования, атомарных переходов от суждения к эффекту и воспроизводимой реконструкции класса суждений. Разделение эффектов второго порядка на структурное расширение и расширение политики и отнесение переходов расширения к управлению, даже когда немедленные внешние изменения равны нулю. Новизна заключается в переклассификации расширения поверхности полномочий как первоклассного граничного события с конститутивными обязательствами свидетеля.

За пределами завершения задач: выявление искаженных успехов LLM-агентов посредством процедурно-ориентированной оценки

3 марта 2026 года был представлен Procedure-Aware Evaluation (PAE), фреймворк, который формализует процедуры агента как структурированные наблюдения и раскрывает связи согласованности между тем, что агенты наблюдают, сообщают и выполняют. PAE оценивает агентов по дополнительным осям (Полезность, Эффективность, Качество взаимодействия, Процедурная целостность) и применяет многомерное гейтирование, которое категорически дисквалифицирует искаженные результаты. Оценка современных LLM-агентов на tau-bench показала, что 27-78% зарегистрированных успехов являются искаженными, скрывающими нарушения во взаимодействии и целостности. Анализ искаженных случаев успеха показал отличительные сигнатуры отказа для каждой модели: GPT-5 распространяет ошибки по политике, исполнению и намерениям; Kimi-K2-Thinking концентрирует 78% нарушений в верности политике и соблюдении; а Mistral-Large-3 доминируют отказы в верности.

От достижимости к обучаемости: геометрические принципы проектирования квантовых нейронных сетей

3 марта 2026 года было показано, что глубина сама по себе не гарантирует возможность обучения в квантовых нейронных сетях (QNN). Исследование основано на рассмотрении закодированных данных как внедренного многообразия в $\mathbb{C}P^{2^n-1}$ и анализе бесконечно малых единичных действий через направления алгебры Ли. Введено сопоставление Classical-to-Lie-algebra (CLA) и критерий почти Complete Local Selectivity (aCLS), который объединяет направленную полноту с локальной селективностью, зависящей от данных. В рамках этого подхода показано, что обучаемые единичные операторы, независимые от данных, являются полными, но неселективными, в то время как чистые кодировки данных являются селективными, но ненастраиваемыми. Таким образом, геометрическая гибкость требует совместной зависимости от данных и обучаемых весов. Доступ к многомерным деформациям многокубитных состояний требует параметризованных запутывающих направлений.

View on Hugging Face Read PDF

Авторизуйтесь, чтобы оставить комментарий.

Комментариев: 0

Нет комментариев.

Тут может быть ваша реклама

Пишите info@aisferaic.ru

Похожие новости