servicenow представляет enterpriseops-gym для оценки планирования агентов и е...

servicenow представляет enterpriseops-gym для оценки планирования агентов

Исследовательская группа ServiceNow представляет EnterpriseOps-Gym — новый эталон для оценки планирования агентов в реалистичных корпоративных условиях. Этот эталон разработан для оценки способности агентов решать сложные задачи, требующие долгосрочного планирования и адаптации к изменяющейся среде.

EnterpriseOps-Gym использует высокоточную симуляцию, чтобы воссоздать сложности корпоративных рабочих процессов, включая автоматизацию запросов на обслуживание, управление инцидентами и выполнение задач. Эталон предоставляет набор сложных сценариев, которые проверяют способность агентов планировать и выполнять задачи эффективно и надежно.

Ключевой особенностью EnterpriseOps-Gym является его внимание к реализму. Симуляция построена на основе реальных данных из корпоративных сред ServiceNow, чтобы обеспечить максимальную точность и релевантность. Эталон также включает в себя ряд проблем, с которыми агенты сталкиваются в реальных корпоративных условиях, таких как неопределенность, неполная информация и конкурентные приоритеты.

EnterpriseOps-Gym доступен для исследователей и разработчиков, заинтересованных в продвижении области планирования агентов. Исследовательская группа ServiceNow надеется, что этот эталон поможет ускорить разработку более интеллектуальных и эффективных агентов, способных автоматизировать сложные корпоративные процессы. Дополнительная информация об EnterpriseOps-Gym доступна по адресу EnterpriseOps-Gym.

Сша и китай: дипломатия в условиях конкуренции

Поддержание дипломатии в условиях конкуренции в отношениях между США и Китаем является сложной задачей, требующей стратегического подхода. Отношения между США и Китаем характеризуются как конкуренция, сотрудничество и конфронтация. Эта триада определяет текущую динамику.

Взаимодействие между двумя странами охватывает широкий спектр вопросов, включая торговлю, безопасность и изменение климата. Конкуренция особенно заметна в экономической и технологической сферах, где обе страны стремятся к лидерству. Однако, существуют области, где сотрудничество необходимо, например, в решении глобальных проблем, таких как изменение климата и пандемии.

Несмотря на конкуренцию, дипломатические каналы остаются открытыми. Регулярные встречи на высоком уровне и диалоги между представителями обеих стран имеют решающее значение для управления разногласиями и предотвращения эскалации конфликтов. Важным аспектом является поддержание открытых линий связи и четкое понимание намерений друг друга.

Отношения между США и Китаем оказывают существенное влияние на глобальную стабильность и процветание. Стратегическое соперничество между ними может иметь далеко идущие последствия для мировой экономики, безопасности и международных отношений. Поддержание дипломатии и поиск областей для сотрудничества имеет важное значение для смягчения рисков и содействия стабильности.

nemotron 3 nano 4b: компактная модель для локального ai

Nemotron 3 Nano 4B – это компактная гибридная модель, предназначенная для эффективной локальной работы искусственного интеллекта. Она сочетает в себе архитектуры декодера и энкодера-декодера для достижения высокой производительности при небольшом размере. Модель имеет 4 миллиарда параметров.

Архитектура и обучение

Nemotron 3 Nano 4B построена на основе архитектуры Mistral 7B и обучена на 80 миллиардах токенов с использованием смеси данных, состоящей из текста, кода и математического контента. Для улучшения качества ответов применяется техника обучения с подкреплением на основе обратной связи от человека (RLHF).

Производительность

Несмотря на свой небольшой размер, Nemotron 3 Nano 4B демонстрирует впечатляющие результаты. В тестах производительности модель достигает 88% от производительности Llama 2 7B на различных бенчмарках. Она особенно хорошо справляется с задачами, требующими логического мышления и генерации кода.

Локальное использование

Благодаря небольшому размеру, Nemotron 3 Nano 4B идеально подходит для развертывания на устройствах с ограниченными ресурсами, таких как ноутбуки и смартфоны. Это позволяет использовать возможности искусственного интеллекта без необходимости подключения к облачным сервисам.

Модель доступна на платформе Hugging Face: Nemotron 3 Nano 4B. Дополнительную информацию можно найти в научной работе: Исследовательская статья.

unsloth studio: тонкая настройка llm без программирования

Unsloth AI выпустила Unsloth Studio, локальный интерфейс без программирования для высокопроизводительной тонкой настройки больших языковых моделей (LLM). Unsloth Studio позволяет выполнять тонкую настройку, используя на 70% меньше видеопамяти (VRAM).

Unsloth Studio предоставляет пользовательский интерфейс для тонкой настройки LLM, позволяя пользователям работать локально, без необходимости в написании кода. Это позволяет создавать специализированные LLM на основе пользовательских данных, используя меньше аппаратных ресурсов.

aiops: автоматизация жизненного цикла моделей искусственного интеллекта

AIOps – это набор практик, которые помогают командам надежно развертывать модели искусственного интеллекта (ИИ). Это достигается за счет автоматизации и оптимизации операций, связанных с жизненным циклом ИИ. Три основных столпа AIOps включают мониторинг, автоматизацию и оптимизацию.

Мониторинг

Мониторинг включает в себя отслеживание производительности моделей ИИ в реальном времени. Это помогает выявлять проблемы, такие как отклонение данных или ухудшение точности, чтобы команды могли быстро реагировать и предотвращать сбои. Мониторинг требует сбора и анализа данных из различных источников, включая журналы, показатели и данные телеметрии.

Автоматизация

Автоматизация позволяет командам автоматизировать повторяющиеся задачи, связанные с развертыванием и управлением моделями ИИ. Это включает в себя автоматизацию таких процессов, как подготовка данных, обучение моделей, развертывание и масштабирование. Автоматизация помогает сократить количество ручной работы, повысить эффективность и снизить риск ошибок.

Оптимизация

Оптимизация предполагает непрерывное улучшение производительности и эффективности моделей ИИ. Это включает в себя такие действия, как настройка гиперпараметров, переобучение моделей с использованием новых данных и развертывание моделей на оптимальной инфраструктуре. Оптимизация помогает командам добиваться максимальной отдачи от своих инвестиций в ИИ.

mit-ibm watson lab выделил $2.2 млн на поддержку ученых

Лаборатория искусственного интеллекта MIT-IBM Watson предоставила финансирование в размере 2,2 миллиона долларов на поддержку молодых ученых. Эти гранты предназначены для расширения влияния преподавателей, находящихся на ранних стадиях карьеры.

Программа "seed to signal" направлена на то, чтобы помочь исследователям в развитии перспективных проектов и продвижении их работы. Финансирование будет распределено между несколькими проектами, охватывающими различные области искусственного интеллекта.

В числе получивших финансирование – проекты, посвященные машинному обучению, обработке естественного языка и компьютерному зрению. Ученые смогут использовать гранты для найма дополнительных сотрудников, приобретения оборудования и публикации своих результатов.

Эта инициатива является частью более широких усилий MIT-IBM Watson AI Lab по продвижению инноваций в области искусственного интеллекта и поддержке следующего поколения исследователей. Программа стремится ускорить научный прогресс и способствовать решению важных проблем с помощью искусственного интеллекта.

Google research представляет инновации в здравоохранении с использованием ИИ

Компания Google Research представила результаты своей работы в области здравоохранения на мероприятии The Check Up. Исследования охватывают инновации, направленные на переход от разработки к практическому применению в реальных медицинских учреждениях.

В рамках представленных разработок фигурируют инструменты для улучшения диагностики и лечения различных заболеваний. Упоминается, что Google Research стремится к созданию решений, которые могут быть интегрированы в существующие рабочие процессы медицинских работников, делая их более эффективными.

Особое внимание уделено использованию искусственного интеллекта (ИИ) для анализа медицинских изображений, выявления аномалий и предоставления поддержки врачам в принятии решений. Также были представлены исследования, касающиеся разработки персонализированных планов лечения на основе анализа данных пациентов.

Компания подчеркивает важность сотрудничества с медицинскими учреждениями и экспертами для обеспечения соответствия разрабатываемых решений реальным потребностям здравоохранения и для успешной интеграции этих технологий в клиническую практику.

ДНК на астероиде: возможный источник жизни на Земле

Компания DarcyIQ запустила поддержку агентов AWS Partner Central.

Компания Veritone Data Refinery помогает защищать персональные данные с помощью Veritone Redact.

Ученые обнаружили полный набор ингредиентов ДНК на астероиде, что позволяет предположить, что жизнь на Земле могла быть занесена из космоса. По словам одного из ученых, органические молекулы, доставленные внеземными материалами, могли сыграть ключевую роль в поставке строительных блоков для жизни на Земле. Изображение, иллюстрирующее доставку нуклеобаз на древнюю Землю метеороидами, представлено NASA Goddard/CI Lab/Dan Gallagher.

Переход от вовлечения к удовлетворению: агентный ИИ и метрики

Переход от вовлечения к удовлетворению: как агентный ИИ переписывает метрики продукта

Традиционные метрики продукта, такие как вовлеченность, клики и время, проведенное на сайте, становятся неадекватными для оценки ценности, предоставляемой современными системами искусственного интеллекта (ИИ). Эти метрики не отражают, насколько хорошо ИИ помогает пользователям достигать их целей. Агентный ИИ, напротив, ориентирован на выполнение задач, что требует нового подхода к оценке его эффективности.

Вместо того, чтобы измерять, как пользователи взаимодействуют с ИИ, необходимо оценивать, насколько успешно ИИ помогает пользователям решать их проблемы и достигать желаемых результатов. Это подразумевает переход от метрик вовлеченности к метрикам, отражающим реальное удовлетворение пользователей.

Ключевым изменением является фокус на успешности выполнения задач. Например, в случае чат-бота, определяющим фактором будет не количество сообщений, а то, решил ли он проблему пользователя. Для агентного ИИ, помогающего в написании электронных писем, важнее, чтобы письмо было отправлено и достигло цели, чем время, потраченное на его редактирование.

Необходимо разработать новые метрики, которые учитывают контекст и цели пользователя. Такие метрики должны измерять не только успешность выполнения задачи, но и удовлетворенность пользователя процессом и результатом. Это требует более глубокого понимания потребностей пользователей и того, как ИИ может их удовлетворить.

Симо обеспокоен «side quests» в openai

Симо, главный ученый OpenAI, выразил обеспокоенность по поводу "side quests" – внутренних проектов, над которыми работают сотрудники компании в свободное от основной деятельности время. Он считает, что эти проекты могут отвлекать ресурсы и внимание от основной миссии OpenAI, которая заключается в обеспечении безопасности и полезности искусственного интеллекта.

Симо подчеркнул, что, хотя он и поддерживает творчество и инициативу сотрудников, "side quests" должны быть тщательно оценены и одобрены, чтобы не создавать риски для компании и не противоречить ее целям. Он также отметил, что эти проекты могут быть сложны для управления и контроля, и что их результаты могут быть непредсказуемыми.

Обеспокоенность Симо возникла после того, как он узнал о большом количестве "side quests", которые разрабатываются внутри OpenAI. Он считает, что компания должна разработать четкую политику в отношении таких проектов, чтобы гарантировать, что они соответствуют ее ценностям и не создают рисков.

Симо опасается, что "side quests" могут привести к утечке талантов и ресурсов, а также к созданию продуктов и технологий, которые не соответствуют высоким стандартам безопасности и этики OpenAI. Он призывает руководство компании серьезно отнестись к этой проблеме и принять соответствующие меры.

Робот с искусственным интеллектом собирает помидоры эффективнее людей

Робот с искусственным интеллектом научился собирать помидоры более эффективно.

Робот, разработанный командой исследователей из Университета Кембриджа, использует компьютерное зрение и машинное обучение для идентификации и сбора спелых помидоров. Он был обучен на более чем 7500 изображениях помидоров на разных стадиях созревания.

Улучшение эффективности сбора

В ходе испытаний робот смог собирать помидоры быстрее и эффективнее, чем человек. Исследователи утверждают, что робот может собирать помидоры с эффективностью, превышающей человеческую на 62%. Он достигает этого благодаря своей способности постоянно учиться и адаптироваться к изменяющимся условиям.

Команда исследователей также утверждает, что робот может работать круглосуточно, что потенциально может решить проблему нехватки рабочей силы в сельском хозяйстве. Они опубликовали свои результаты в статье. Проект также доступен на Hugging Face.

Nvidia представляет openshell для безопасных ai-агентов

Компания NVIDIA представила OpenShell – среду выполнения с открытым исходным кодом, предназначенную для безопасной работы автономных агентов искусственного интеллекта. OpenShell спроектирована для обеспечения безопасного и контролируемого взаимодействия агентов ИИ с внешним миром.

OpenShell позволяет разработчикам создавать агентов, способных выполнять различные задачи, такие как управление роботами, автоматизация бизнес-процессов и взаимодействие с пользователями. Среда выполнения предоставляет механизмы для контроля доступа к ресурсам и защиты от несанкционированных действий.

Ключевой особенностью OpenShell является её ориентация на безопасность. Она включает в себя инструменты для мониторинга поведения агентов, обнаружения аномалий и предотвращения потенциально опасных действий. OpenShell также поддерживает изоляцию агентов друг от друга, чтобы предотвратить распространение ошибок или вредоносного кода.

NVIDIA подчеркивает, что OpenShell является открытым проектом, и приветствует вклад от сообщества разработчиков. Код OpenShell доступен на GitHub.

Искусственный интеллект в страховании: порядок данных как ключ к успеху

Для эффективного использования искусственного интеллекта страховым компаниям необходимо привести в порядок свои данные. Страховые компании обладают огромным объемом данных, но часто эти данные разрознены, хранятся в разных системах и представлены в разных форматах. Это создает значительные трудности при их использовании для обучения моделей искусственного интеллекта.

Например, данные о клиентах могут храниться в одной системе, данные о страховых случаях – в другой, а данные о рисках – в третьей. Кроме того, данные могут быть неполными, неточными или неактуальными.

Чтобы эффективно использовать искусственный интеллект, страховым компаниям необходимо решить эти проблемы. Это включает в себя консолидацию данных в едином хранилище, обеспечение качества данных и разработку единых стандартов данных.

Использование искусственного интеллекта может принести страховым компаниям значительные преимущества, такие как повышение эффективности, снижение затрат и улучшение обслуживания клиентов. Например, искусственный интеллект можно использовать для автоматизации обработки страховых случаев, выявления мошенничества и прогнозирования рисков.

Однако, если страховые компании не смогут привести в порядок свои данные, они не смогут в полной мере воспользоваться преимуществами искусственного интеллекта. Инвестиции в инфраструктуру данных и управление данными станут критически важными для успеха страховых компаний в эпоху искусственного интеллекта.

baidu qianfan представляет qianfan-ocr для распознавания документов

Команда Baidu Qianfan выпустила Qianfan-OCR, унифицированную модель интеллектуального анализа документов с 4 миллиардами параметров. Модель способна распознавать текст и понимать структуру документов. Qianfan-OCR поддерживает более 100 языков и способна обрабатывать различные типы документов, включая отсканированные документы, фотографии и PDF-файлы.

В основе Qianfan-OCR лежит архитектура трансформера. Модель прошла обучение на большом объеме данных, состоящих из текстов и изображений документов. Это позволило ей достичь высокой точности и эффективности в задачах оптического распознавания символов (OCR) и понимания структуры документов.

Qianfan-OCR может использоваться для широкого спектра задач, таких как извлечение информации из счетов-фактур, автоматизация обработки документов и создание интеллектуальных систем управления документами. Модель доступна через платформу Baidu Qianfan.

mastercard разработала ai-модель для борьбы с мошенничеством

Mastercard разработала новую базовую модель для отслеживания мошеннических действий. Модель, построенная на основе искусственного интеллекта, предназначена для выявления и предотвращения мошеннических транзакций.

Mastercard заявляет, что новая базовая модель может обнаруживать сложные паттерны мошенничества, которые могут быть упущены из виду традиционными системами. Она обучена на большом объеме данных о транзакциях и использует передовые методы машинного обучения для прогнозирования вероятности мошенничества.

Компания планирует внедрять эту модель для повышения безопасности платежей и снижения потерь от мошенничества для финансовых учреждений и потребителей. Базовая модель может быть адаптирована для различных типов мошеннических действий, включая мошенничество с кредитными картами, мошенничество с возвратами и мошенничество с использованием новых платежных технологий.

gpt 5.4: новый прорыв в генерации кода

GPT 5.4 является значительным шагом вперёд для Codex. Модель демонстрирует улучшенные возможности в генерации кода и понимании естественного языка. В тестах GPT 5.4 превзошла предыдущие версии по нескольким ключевым метрикам, включая точность и скорость генерации кода.

Улучшения в GPT 5.4 позволяют разработчикам более эффективно автоматизировать задачи кодирования и создавать более сложные приложения. Модель способна генерировать код на различных языках программирования, таких как Python, JavaScript и C++.

GPT 5.4 также демонстрирует улучшенное понимание естественного языка, что позволяет разработчикам описывать желаемый код на естественном языке, а затем получать рабочий код. Это упрощает процесс разработки и делает его более доступным для людей без глубоких знаний в программировании.

Разработчики утверждают, что GPT 5.4 является наиболее мощной моделью для генерации кода на сегодняшний день. Они планируют продолжать улучшать модель и расширять её возможности в будущем.