NPC AI: чат-бот с адаптивными ответами и свободной беседой и ещё 12 новости

NPC AI: чат-бот с адаптивными ответами и свободной беседой

NPC AI позиционирует свой чат-бот как решение для тех, кто ценит открытые и естественные диалоги без постоянных ограничений. Бот подходит тем, кто хочет вести более «острые» беседы и избегает шаблонных переадресаций или предсказуемых ответов.\r \r Интерфейс прост: пользователь выбирает персонажа из списка, открывается чат-окно с текстовым полем внизу. Никаких дополнительных настроек — после выбора собеседника можно сразу начинать общение. Ответы появляются в том же окне, диалог идет как с живым человеком.\r \r Услуга работает по гибкой модели оплаты: новичкам доступны пробные бесплатные сообщения, а за платную подписку — расширенные функции, включая длинные переписки и продвинутые настройки персонажей.

Исследование MIT: рейтинги больших языковых моделей могут быть нестабильными

Компании, выбирая LLM для обработки отчётов или обращений клиентов, зачастую ориентируются на рейтинги специализированных платформ. Однако учёные из MIT показали: такие рейтинги часто зависят от нескольких голосов — иногда даже от одного или двух. Удаление крайне малой доли данных (менее 0,01 %) способно перестроить топ моделей.\r \r В ходе работы исследователи разработали быстрый метод проверки устойчивости рейтингов. Он позволяет выявить и проанализировать те конкретные голоса, которые сильнее всего влияют на итоговую таблицу. По словам Тамары Бродерик, ведущего автора исследования, если позиция лидера зависит от нескольких случайных решений пользователей (ошибочный клик, невнимательность), её нельзя считать надёжным показателем качества.

Тестирование prompt-инженерии: версионирование и регрессионные проверки с MLflow

В новом тьюториале описан подход, при котором prompt-шаблоны рассматриваются как версионируемые артефакты, а поведение языковой модели проверяется методами регрессионного тестирования. Для этого используется MLflow — система отслеживания экспериментов, позволяющая фиксировать версии промптов, их различия, выходные данные модели и метрики качества.\r \r Авторы реализовали полный конвейер оценки: вычисляются BLEU, ROUGE-L и семантическое сходство (на основе эмбеддингов), а также автоматически формируются флаги регрессии при превышении заданных порогов снижения метрик. Все данные — промпты, диффы, метрики, выводы — логируются в MLflow, что делает эксперименты полностью воспроизводимыми и аудитируемыми.

OAT: новый токенизатор действий для робототехники на основе LLM

Исследователи из Гарварда и Стэнфорда представили Ordered Action Tokenization — токенизатор, который позволяет применять к робототехнике подходы из мира больших языковых моделей. Основная сложность состояла в том, что непрерывные сигналы управления роботом сложно превратить в дискретные токены без потери точности или эффективности.\r \r OAT решает эту проблему благодаря трём ключевым принципам: высокой степени сжатия (восемь токенов вместо 128–384), полной декодируемости (любая последовательность токенов даёт корректное движение) и строгой причинно-следственной упорядоченности (ранние токены задают общий вектор движения, поздние — уточняют детали). Это достигается за счёт встроенных регистров и специальной техники Nested Dropout при обучении.\r \r Система показала лучшие результаты на четырёх крупных бенчмарках, включая LIBERO, RoboMimic, MetaWorld и RoboCasa. Например, в LIBERO OAT достиг 56,3 % успешных выполнений против 36,6 % у Diffusion Policy. Особенно ценна гибкость «anytime inference»: робот может выполнить грубое действие всего по одному-двум токенам или, при необходимости, применить полный 8-токенный набор для высокой точности.

AI-компаньоны в 2025 году: от экспериментов к промышленности

В 2025 году рынок AI-компаньонов достиг масштаба в $37,12 млрд, что смещает его из нишевой категории в полноценную индустрию. Рост прогнозируется на уровне 31 % CAGR до 2035 года, а к тому времени объем рынка может достичь $552,49 млрд. Особенно активно развитие идет в Северной Америке ($12,61 млрд), США ($8,70 млрд) и Европе ($9,20 млрд), хотя Азиатско-Тихоокеанский регион ($8,84 млрд) демонстрирует сильные темпы, обусловленные мобильной ориентацией и культурой виртуальных идентичностей. Потребительский сегмент — 38 % рынка — подчеркивает, что люди платят за эмоциональную поддержку, развлечения и опыт идентичности, а не просто за технологию. Наиболее востребованы текстовые чатботы (44 %), но рост приносит и голосовые, и видеофункции. Показательно, что подростки — не редкость: 72 % американских подростков уже использовали AI-компаньоны, а 30 % — каждый день. Такие цифры указывают на закрепление этого поведения в повседневной жизни.

Ai в доме: цифры и тренды роста рынка умного дома

Рынок AI-автоматизации в доме уже стоит $20,5 млрд (2024 г.) и вырастет до $75,1 млрд к 2029 году — средний темп роста около 30% в год. Это примерно на 3–4 п.п. быстрее, чем весь рынок «умных домов» ($127,8 млрд в 2024 г., рост до $537,3 млрд к 2030 г.). AI-сегмент — основной драйвер будущего роста.

Средний дом в США уже содержит около 21 подключённого устройства, но лишь 8 из них — по-настоящему «умные». Голосовые помощники используют 48,7% интернет-пользователей США, а 51% применяют уже и более сложные, разговорные интерфейсы. В здравоохранении AI-решения для дома вырастут с $1,3 млрд (2023) до $36,1 млрд к 2031 году — темп роста 53,2% в год.

Opus 4.6 и Codex 5.3: новая эра разработки после бенчмарков

В начале февраля OpenAI и Anthropic представили обновлённые модели для программной разработки — Codex 5.3 и Opus 4.6. До этого Claude Code на базе Opus 4.5 уже выделился среди аналогов, подняв планку по удобству и качеству работы.

На практике Codex 5.3 стал ближе к стилю Claude: он быстрее реагирует, увереннее справляется с задачами — от работы с git до анализа данных. Однако при сложных, но рутинных инструкциях всё ещё может пропускать файлы или ошибаться в размещении кода. Opus 4.6 остаётся чуть сильнее в поиске и исправлении багов, но разница заметна лишь в сложных системах.

Сейчас бенчмарки почти не помогают оценить новые модели — ключевое измерение — реальное применение. Обе платформы улучшили скорость и возможности, но потеряли в надёжности при множественных командах. При этом Claude Code продолжает лидировать по удобству, особенно для новичков.

7 приёмов на Python для анализа данных и поиска проблем в наборах

При первичном исследовании данных важно не только понять структуру и распределение значений, но и выявить скрытые проблемы. Предложены семь практических приёмов на Python, помогающих быстро обнаружить и начать решать типичные ошибки в данных.

В список вошли проверки на пропуски, аномальные значения, дубликаты и неожиданные типы данных. Многие из них используют стандартные методы pandas — например, isna(), describe(), duplicated() — но в неочевидных комбинациях, чтобы ускорить анализ.

Отдельно подчёркиваются методы визуального анализа с помощью библиотек вроде seaborn, а также подходы к работе с временными рядами и категориальными признаками. Все приёмы проверены на реальных данных и легко адаптируются под новые проекты.

OpenAI тестирует рекламу в бесплатной версии ChatGPT

Компания OpenAI начала тестировать показ рекламы в бесплатной версии ChatGPT. Цель — поддерживать бесплатный доступ к сервису, не ухудшая качество опыта.

Реклама будет явно обозначена, не повлияет на ответы ИИ и подчиняется строгим правилам конфиденциальности. Пользователи смогут сами решать, видеть ли им рекламу — отключить её можно в настройках. Первый опыт запущен в США, и постепенно он расширится на другие регионы.

Transformers.js v4 в предварительной версии: уже на NPM

Разработчики представили четвёртую мажорную версию библиотеки Transformers.js — теперь можно протестировать предварительный релиз через NPM. Проект позволяет запускать модели машинного обучения прямо в браузере и в Node.js-среде без использования сервера.

В новой версии улучшена производительность, добавлена поддержка большего числа архитектур моделей и обновлён API для удобства разработчиков. Библиотека остаётся полностью open-source и распространяется под лицензией MIT.

Canzona: асинхронный фреймворк для распределённых оптимизаторов на матрицах

Крупные языковые модели всё чаще используют матричные оптимизаторы — такие как Shampoo, Muon и SOAP — благодаря их высокой скорости сходимости. Но их требование к целостным обновлениям плохо сочетается с фрагментацией тензоров в распределённых системах вроде Megatron. Существующие подходы неидеальны: синхронные методы создают избыточную нагрузку, а послоевая разбивка нарушает геометрические ограничения эффективной коммуникации.

Авторы предложили Canzona — единый, асинхронный и сбалансированный по нагрузке фреймворк. Он разделяет логическое назначение оптимизаторов и физическое распределение параметров. При данных параллелизме введена стратегия альфа-сбалансированной статической разбивки, сохраняющая атомарность и устраняющая дисбаланс. Для тензорного параллелизма реализован асинхронный вычислительный конвейер с микрогрупповым планированием, позволяющий объединять фрагментированные обновления и скрывать накладные расходы реконструкции.

Тесты на модели Qwen3 (до 32 млрд параметров) на 256 GPU показали ускорение полного цикла итерации в 1,57 раза и снижение времени шага оптимизатора в 5,8 раза по сравнению с базовым решением.

Запуск специальной версии ChatGPT для Пентагона

OpenAI для правительства объявил о запуске национальной платформы GenAI.mil. В её основе — настроенная версия ChatGPT, предназначенная исключительно для использования американскими оборонными подразделениями.

Система разработана с акцентом на безопасность и контролируемое использование: все данные обрабатываются в рамках закрытой среды, а модель упакована так, чтобы минимизировать риски утечек и неконтролируемого вывода.

Доступ к платформе получили сотрудники Минобороны и связанные с ними агентства. Использование регулируется строгими политиками защиты информации и этическими нормами.

Microsoft представила OrbitalBrain для обучения ИИ в космосе

Крупные спутниковые конstellации ежедневно собирают огромные объёмы снимков Земли, но из-за ограниченной пропускной способности наземных каналов передачи лишь небольшая их часть доходит до Земли вовремя для обучения моделей. Microsoft исследователи предложили новый подход — фреймворк OrbitalBrain, превращающий спутниковую группировку в самоуправляемую распределённую вычислительную систему.

Вместо простой передачи данных на Землю, OrbitalBrain позволяет спутникам обучать, агрегировать и обновлять модели прямо в орбите. Для этого используются встроенные процессоры, межспутниковые каналы связи и прогнозируемое распределение энергии и канала передачи. Система координирует локальное обучение, обмен параметрами моделей и даже перераспределение исходных снимков между спутниками для балансировки данных.

Эксперименты показали, что OrbitalBrain достигает на 5,5–49,5 % выше точности и в 1,5–12,4 раза быстрее доходит до целевой метрики качества по сравнению с традиционными методами. Это открывает путь к оперативному мониторингу лесных пожаров, наводнений и климатических изменений — без задержек на передачу данных на Землю.