nvidia выпустила nemotron-cascade 2 – moe модель и ещё 9 новости — Новости ИИ

nvidia выпустила nemotron-cascade 2 – moe модель

NVIDIA выпустила Nemotron-Cascade 2 – открытую модель Mixture of Experts (MoE) с 30 миллиардами параметров, при этом активных параметров – 3 миллиарда. Разработчики утверждают, что эта модель демонстрирует улучшенное рассуждение и сильные возможности в качестве агента.

Модель доступна для использования в различных областях применения, таких как чат-боты и виртуальные ассистенты. Nemotron-Cascade 2 – это развитие предыдущей версии, Nemotron-Cascade, и направлена на повышение производительности и эффективности модели.

NVIDIA также сообщает об улучшении возможностей модели в понимании и генерации естественного языка. Это позволяет Nemotron-Cascade 2 более эффективно выполнять сложные задачи, требующие рассуждений и логического мышления.

holotron-12b: агент для использования компьютера

Holotron-12B — это агент для использования компьютера с высокой пропускной способностью. Он был обучен на наборе данных, большом наборе демонстраций использования компьютера, генерируемых людьми.\r \r Holotron-12B обучен следовать инструкциям, используя архитектуру трансформатора. Он способен выполнять широкий спектр задач, включая навигацию по интерфейсам пользователя, ввод текста и выполнение действий.\r \r Модель может быть использована для автоматизации задач, которые обычно выполняются людьми, таких как заполнение форм, написание электронных писем и поиск информации. Holotron-12B также может быть использован для разработки новых интерфейсов пользователя, которые более интуитивно понятны и просты в использовании.\r \r Набор данных, использованный для обучения Holotron-12B, доступен как PDF. Модель и код доступны на Hugging Face.

Trustpilot использует искусственный интеллект для улучшения поиска отзывов

Trustpilot сотрудничает с компаниями, занимающимися разработкой искусственного интеллекта, поскольку традиционный поиск теряет свою популярность. Компания планирует использовать искусственный интеллект для улучшения поиска и обобщения обзоров, чтобы помочь потребителям принимать обоснованные решения.

Trustpilot работает с такими компаниями, как Cohere, чтобы предоставить потребителям более релевантные результаты поиска. Они также сотрудничают с компаниями, занимающимися большими языковыми моделями, чтобы обобщить обзоры и выделить ключевую информацию для потребителей.

По мнению Trustpilot, традиционный поиск неэффективен для обнаружения отзывов о продуктах и услугах. Потребителям часто приходится просматривать большое количество результатов, чтобы найти нужную им информацию. Искусственный интеллект может помочь упростить этот процесс, предоставляя потребителям более релевантные и краткие результаты поиска.

Компания утверждает, что ее платформа уже имеет более 280 миллионов отзывов, которые можно использовать для обучения моделей искусственного интеллекта. Trustpilot планирует продолжать инвестировать в искусственный интеллект и машинное обучение, чтобы улучшить свою платформу и предоставлять потребителям лучший опыт.

Goldman Sachs: инвестиции в ИИ переходят в центры обработки данных

Goldman Sachs отмечает сдвиг в инвестициях в искусственный интеллект (ИИ) в сторону центров обработки данных (ЦОД). Ранее инвестиции в ИИ были сосредоточены на разработке программного обеспечения и чипов, однако теперь фокус перемещается на инфраструктуру, необходимую для работы этих технологий.

По мнению аналитиков Goldman Sachs, спрос на вычислительную мощность, необходимую для обучения и развертывания моделей ИИ, резко возрастает. Это приводит к увеличению инвестиций в ЦОД, включая строительство новых и модернизацию существующих.

Аналитики прогнозируют, что инвестиции в ЦОД, необходимые для ИИ, могут достичь 150 миллиардов долларов к 2027 году. Это значительно выше предыдущих оценок. Они также отмечают, что компании, занимающиеся облачными вычислениями, такие как Amazon, Microsoft и Google, являются основными бенефициарами этого сдвига.

Кроме того, Goldman Sachs указывает на растущую потребность в специализированных ЦОД, предназначенных для рабочих нагрузок ИИ. Эти центры обработки данных требуют больше энергии и охлаждения, чем традиционные ЦОД, что создает новые возможности для компаний, занимающихся энергетической инфраструктурой и системами охлаждения.

Nvidia представила платформу blackbird и новые инструменты для ИИ

Компания Nvidia провела мероприятие, посвященное искусственному интеллекту, на конференции GTC.

Одной из ключевых новостей стало представление платформы Blackbird, которая, по утверждению Nvidia, позволяет разработчикам создавать собственные генеративные ИИ-модели, используя данные компаний. Платформа Blackbird включает в себя инструменты для настройки, обучения и развертывания моделей.

Nvidia также представила новые инструменты для ускорения обучения больших языковых моделей, включая новые возможности в своей библиотеке NeMo. Кроме того, компания объявила о расширении своей платформы для обучения ИИ, NIM, включив в нее поддержку большего количества моделей и фреймворков.

Новые возможности для разработчиков включают инструменты для создания чат-ботов и виртуальных помощников, а также для генерации изображений и видео. Nvidia подчеркивает важность "ответственного ИИ" и предлагает инструменты для мониторинга и контроля моделей.

Компания представила новые версии своих графических процессоров, предназначенных для ускорения задач, связанных с ИИ, включая H200, который, по словам Nvidia, обеспечивает значительное повышение производительности по сравнению с предыдущим поколением.

Nvidia также представила новые инструменты для работы с робототехникой, включая платформу Isaac Sim, которая позволяет моделировать и обучать роботов в виртуальной среде.

gpt-5.4 mini и nano, openai japan и jacobs ai

Представлены GPT-5.4 mini и nano – более компактные и быстрые версии GPT-5.4, оптимизированные для программирования, использования инструментов, мультимодального рассуждения и обработки большого объема запросов к API и подсистем.

openai japan и безопасность подростков

OpenAI Japan представила Japan Teen Safety Blueprint, направленную на усиление защиты, родительского контроля и поддержку благополучия подростков, использующих генеративный искусственный интеллект.

jacobs и цифровые двойники

Компания Jacobs выпустила решение для создания цифровых двойников центров обработки данных, использующих искусственный интеллект.

google ai представляет waxal — набор данных для африканских языков

Компания Google AI выпустила WAXAL — многоязычный набор данных африканских речей, предназначенный для обучения автоматических систем распознавания речи и преобразования текста в речь.

WAXAL содержит данные на 10 африканских языках: акан, асам, игбо, кисуахили, луганда, маа, ньяня, сомали, суахили, и йоруба. Набор данных включает в себя более 14 000 записей речи длительностью более 21 часа. Он собран из различных источников, включая публичные базы данных и записи, собранные командой Google AI.

WAXAL призван помочь исследователям и разработчикам создавать более точные и эффективные системы распознавания речи и преобразования текста в речь для африканских языков. Набор данных доступен для некоммерческого использования.

Nvidia warp kernels: ускорение gpu симуляций и дифференцируемой физики

NVIDIA Warp Kernels позволяют создавать высокопроизводительные, ускоренные GPU симуляции и дифференцируемые физические рабочие процессы. Они обеспечивают прямой контроль над тем, как потоки в варпе выполняются, позволяя разработчикам оптимизировать производительность для конкретных задач.

Особенностью Warp Kernels является возможность писать код, который выполняет операции над всеми потоками в варпе как единой единицей. Это позволяет использовать возможности SIMT (Single Instruction, Multiple Threads) архитектуры NVIDIA GPU более эффективно. Warp Kernels позволяют разработчикам управлять тем, какие потоки выполняются, какие нет, и в каком порядке.

Warp Kernels особенно полезны в задачах, требующих сложной координации между потоками, таких как физические симуляции, где состояние каждого объекта влияет на состояние других. Они также подходят для дифференцируемого моделирования, где необходимо вычислять градиенты сложных функций.

Применение Warp Kernels позволяет значительно повысить производительность по сравнению с традиционным CUDA кодом, особенно в задачах, которые не поддаются эффективной векторизации. Разработчики могут добиться прироста производительности до 10 раз, оптимизируя код для архитектуры варпа.

Warp Kernels доступны для графических процессоров NVIDIA, поддерживающих архитектуру Ampere и более поздние. Они интегрированы в CUDA Toolkit, что упрощает их использование в существующих проектах.

Ученые сузили поиск жизни на 45 экзопланетах

Ученые сузили поиск внеземной жизни до 45 скалистых планет, где наличие жидкой воды может сделать жизнь возможной. В качестве иллюстрации представлено концептуальное изображение экзопланеты.

Американцы отправляют около 3 миллионов ежедневных сообщений в ChatGPT, чтобы узнать о компенсации и доходах, помогая сократить информационный разрыв в сфере оплаты труда.

Mistral small 4: новая llm от mistral ai

Компания Mistral AI выпустила модель Mistral Small 4, состоящую из 119 миллиардов параметров и использующую архитектуру Mixture of Experts (MoE). Модель объединяет возможности выполнения инструкций, рассуждений и обработки мультимодальных данных.

Mistral Small 4 способна работать с различными типами данных, включая текст, изображения и аудио. Модель демонстрирует высокую производительность в задачах, требующих понимания и генерации контента, а также в решении сложных логических задач.

nvidia выпустила nemotron-cascade 2 – moe модель и ещё 9 новости