Как ИИ и симуляции меняют научные исследования и ещё 11 новости

Как ИИ и симуляции меняют научные исследования

Десять лет назад Рафаэль Гомес-Бомбарелли, доцент Массачусетского технологического института, начал использовать искусственный интеллект для поиска новых материалов. Сегодня, получив статус профессора по материаловедению и инженерии, он видит в ИИ ключевой инструмент для кардинального ускорения научных открытий.

Гомес-Бомбарелли совмещает физико-химическое моделирование с машинным обучением и генеративным ИИ. Его исследования привели к созданию материалов для аккумуляторов, катализаторов, пластиков и OLED-элементов. Он сооснователь нескольких стартапов, включая Lila Sciences — платформу для «научного суперинтеллекта» в области биологических, химических и материаловедческих дисциплин.

Изначально экспериментатор, он переключился на симуляции ещё на этапе PhD, вдохновившись возможностями программирования. После постдока в Шотландии и работы в Гарварде он стал одним из первых, кто применил генеративный ИИ в химии (2016) и нейросети для анализа молекул (2015). Его группа в MIT работает исключительно на компьютерах, но тесно сотрудничает с экспериментальщиками, помогая отфильтровывать и реализовывать идеи ИИ.

xAI реорганизация, GLM-5 и Velma 2.0: новые шаги в ИИ и космосе

После ухода части основателей и слияния со SpaceX xAI провёл первую встречу всех сотрудников. На ней Элон Маск представил новую организационную структуру, roadmap и идею создания ИИ-центров на Луне.

Новый формат включает четыре направления: Grok (чат и голос), команда по разработке кода, Imagine (мультимодальные модели) и Macrohard (агенты-имитаторы корпораций). В перспективе — ИИ-спутники, производимые в космосе с использованием лунных ресурсов и солнечной энергии, а также электромагнитный ускоритель для запуска компонентов.

Китайский Z.ai выпустил открытую модель GLM-5 с 744 млрд параметров. По оценке Artificial Analysis, она находится на уровне Claude Opus 4.6 и GPT-5.2, превосходя Gemini 3 Pro и Grok 4.

Модель использует архитектуру Sparse Attention (активны 44 млрд параметров), работает на китайских чипах (включая Ascend), доступна под лицензией MIT на Hugging Face и через API — $1 за 1 млн токенов ввода.

Velma 2.0 — первый в мире голосовой ИИ-движок, не просто транскрибирующий, а интерпретирующий намерения, эмоции и аутентичность в многопользовательской и мультиязычной среде. Он работает на 100+ специализированных подмодулях, анализирует аудио быстрее и дешевле, чем LLM, и даёт интерпретируемые результаты.

Топ-5 моделей встраивания для RAG-конвейеров

В области обработки естественного языка всё большее внимание уделяют моделям встраивания, особенно в задачах поиска по базе знаний с помощью RAG. Эти модели превращают текст в векторы, что позволяет эффективно сравнивать запросы и фрагменты документов.

Среди популярных решений — all-MiniLM-L6-v2, лёгкая и быстрая модель от Salesforce, хорошо работающая даже на обычном CPU. bge-small-en-v1.5 от BAAI показывает высокую точность в семантическом поиске и доступна под открытой лицензией. e5-mistral-7b-instruct — более тяжёлая, но мощная модель от Microsoft, способная учитывать инструкции в запросах. Также выделяются gte-small от Alibaba и jina-embeddings-v2-base-en, хорошо адаптированная под английский и поддерживаемая Jina AI.

Все перечисленные модели свободно доступны в репозиториях вроде Hugging Face и могут быть использованы как в исследованиях, так и в коммерческих продуктах.

Пентагон хочет использовать ИИ в боевых операциях без ограничений

Министерство обороны США запросило у IT-компаний интеграцию их искусственного интеллекта в секретные боевые системы без наложенных ограничений. Обычно вендоры не разрешают применять свои модели в системах с особым режимом доступа, поэтому запрос вызвал серьёзные дискуссии внутри самих компаний.

Пентагон уже запустил платформу GenAI.mil для открытых сетей — там работают упрощённые версии ИИ от OpenAI и других. Теперь же планы расширяются: ИИ планируют подключить к самым защищённым сетям, что требует снятия этических, технических и юридических барьеров.

Некоторые эксперты предупреждают: ненадёжные модели, способные выдавать вымышленные факты, могут привести к катастрофическим ошибкам. Компании вроде Anthropic уже заявили, что не будут участвовать в разработке ИИ для слежки или обстрела собственных сил.

OpenEnv: проверка ai-агентов с инструментами в реальных условиях

Исследователи представили OpenEnv — тестовую платформу для оценки способностей AI-агентов, умеющих пользоваться инструментами. В отличие от симуляций, среда работает в реальном мире: агенты взаимодействуют с физическими устройствами и средой через API.

Тестирование проводится с помощью реальных инструментов — например, клиента Telegram или веб-браузера. Платформа проверяет, насколько хорошо агент может использовать интерфейсы, интерпретировать возвращаемые данные и принимать решения в динамичной обстановке. Все это — без доступа к внутреннему коду систем.

OpenEnv доступен как открытый проект под лицензией MIT. Код и инструкции по запуску уже размещены на GitHub. Тесты показали, что даже современные модели часто ошибаются при интерпретации интерфейсов — особенно в сложных или нестандартных сценариях.

Генераторы ai-видео без водяных знаков — свободы хватает

Пользователи всё чаще требуют от AI-видеогенераторов не просто функциональности, а настоящей свободы: без водяных знаков, без ограничений по качеству и без принудительных «апгрейдов». В ответ появляются сервисы, позволяющие создавать, редактировать и экспортировать видео в полном качестве — для личного, коммерческого и творческого использования.

Среди популярных решений — Candy AI, Mydreamcompanion, Ourdream и Seduced AI. Они ориентированы на создание персонализированных персонажей, взаимодействие с ними и анимацию сцен. Это больше похоже на интерактивные анимационные «игрушки» с возможностью экспорта, чем на профессиональный видеоредактор.

Как превратить исследовательский ноутбук в рабочий ML-проект

Многие начинают с анализа в Jupyter-ноутбуке, но для реального использования модель нужно превратить в воспроизводимый и деплоируемый проект. В новом гайде пошагово описано, как это сделать на примере личного проекта.

Автор описывает процесс от упаковки кода и данных до настройки CI/CD, тестирования и автоматического развертывания. Особое внимание уделено воспроизводимости: фиксация зависимостей, управление версиями данных и конфигураций. Рассматриваются инструменты вроде Docker, GitHub Actions и MLflow.

Гайд ориентирован на практику и не требует сложной инфраструктуры. Подойдет тем, кто хочет выстроить рабочий процесс от идеи до демо и добавить проект в портфолио.

GPT-5.3-Codex-Spark: первый прорыв в генерации кода от OpenAI

OpenAI представила новую модель — GPT-5.3-Codex-Spark. Это первая система в линейке, оптимизированная под генерацию кода в реальном времени. В тестах показала ускорение в 15 раз по сравнению с предыдущими версиями и поддержку контекста длиной до 128 тысяч токенов.

На данный момент доступна в статусе исследовательского превью — только для пользователей ChatGPT Pro. Точного срока официального выхода пока нет.

Отзыв об Abacus AI Deep Agent: первые шаги к AGI?

Abacus AI Deep Agent — это экспериментальная система, которая демонстрирует признаки агентного поведения на основе больших языковых моделей. По словам автора, проект напоминает ранние этапы развития искусственного обобщённого интеллекта, хотя пока не достигает его уровня.

Система способна выполнять последовательные задачи, запоминать контекст и адаптироваться в процессе работы. Разработчики заявляют о поддержке множества плагинов и инструментов, включая браузер, калькулятор и доступ к внешним API. Также упоминается OpenRouter как один из платформ для запуска.

Проект доступен в открытых тестах, но финальная лицензия пока не оглашена. Тестирование открыто для всех желающих, однако требует технической подготовки для настройки и запуска.

Как ИИ-агент Luca ускоряет принятие решений в Cemex

Компания Cemex, входящая в топ-лист крупнейших производителей строительных материалов, внедрила ИИ-агента по имени Luca, чтобы переработать рабочие процессы топ-менеджмента. Система уже помогает руководителям анализировать данные, выявлять риски и принимать решения быстрее — без необходимости глубокой технической подготовки.

Luca работает как интерактивный помощник: вводишь запрос на естественном языке, получаешь структурированный вывод с рекомендациями. Агент интегрирован с внутренними системами компании — ERP, CRM и отчётом по операционной эффективности. В эксперименте участвовали сотрудники из Мексики, Бразилии и Колумбии.

Тестирование показало сокращение времени на анализ операционных метрик с нескольких дней до нескольких минут. Команда подчеркивает: система не заменяет людей, а берёт на себя рутину, освобождая время для стратегического мышления.

Как правильно увеличивать модели: гиперпараметры и теплый старт

Исследователи изучают метод масштабирования нейросетей — запуск обучения больших моделей «на старте» из уже обученных меньших. Это позволяет передать знания и ускорить сходимость. Однако при увеличении модели возникает проблема: гиперпараметры, подобранные для малой версии, не всегда работают хорошо для большой. Классический подход — экстраполяция гиперпараметров по эмпирическим закономерностям — до сих пор не проверялся в таких сценариях.

Учёные предложили обоснованный способ масштабирования, основанный на идее $μ$P и применимый к широкому классу архитектур и оптимизаторов. Метод теоретически гарантирует эквивалентность масштабированной и «расширенной» модели, а также позволяет корректно анализировать предельный случай бесконечной ширины. Дополнительно они расширили теорию $μ$Transfer — теперь она позволяет передавать гиперпараметры между моделями разного размера при использовании их подхода.

Эксперименты подтвердили эффективность метода на реальных датасетах и архитектурах. Его можно применять без дополнительных затрат на полный перебор гиперпараметров для больших моделей.

Gemini 3 Deep Think: прорыв в научных рассуждениях и программировании

Google представил обновлённую версию модели Gemini 3 Deep Think — систему, специально настроенную на ускорение научных исследований, инженерных разработок и программирования. Ключевая особенность — режим «глубокого размышления», при котором модель тратит больше времени на проверку собственных рассуждений перед ответом, минимизируя ошибки и галлюцинации.

По результатам теста ARC-AGI-2, оценивающего способность к абстрактному мышлению и переносу знаний на новые задачи, модель набрала 84,6 % — это значительно выше среднего показателя человека (около 60 %). Также Gemini 3 Deep Think достигла 48,4 % на экзамене Humanity’s Last Exam, состоящем из сложных междисциплинарных задач, и заняла «Легендарный грандмастер» уровень (3455 Elo) в соревновательном программировании на Codeforces.

Модель продемонстрировала результаты, сопоставимые с золотыми медалями, на письменных этапах Международных олимпиад по физике, химии и математике. Помимо этого, она способна преобразовывать 2D-эскизы в готовые 3D-модели для печати, а также помогает в решении инженерных задач — от проектирования тонких пленок до оптимизации сложных процессов.