anthropic mythos: новая языковая модель

Автор

Heli

Опубликовано 30.03.2026

0,0

Компания Anthropic разрабатывает модель под названием "Mythos". Модель Mythos была обучена на огромном наборе данных, включающем 2 триллиона токенов текста и кода.

Обучение и архитектура

Модель Mythos использует архитектуру, похожую на ту, что используется в других больших языковых моделях, таких как GPT-4. Она состоит из 84 миллиардов параметров. Исследователи Anthropic использовали метод, называемый "масштабным обучением с подкреплением с участием человека" (RLHF), чтобы улучшить качество ответов Mythos и сделать их более полезными и безопасными.

Сравнение с другими моделями

Внутренние тесты показали, что Mythos превосходит LLaMA 2 70B по большинству параметров. Модель также показала хорошие результаты в задачах, требующих рассуждений и понимания естественного языка. Mythos была использована в качестве основы для создания Claude 3, который, по заявлениям Anthropic, является более мощным и способным, чем предыдущие версии Claude.

Авторизуйтесь, чтобы оставить комментарий.

Комментариев: 0

Похожие новости

anthropic mythos: новая языковая модель

Обучение и архитектура

Сравнение с другими моделями

Похожие новости

Безопасные конвейеры llm с outlines и pydantic и ещё 15 новости

Пятиуровневая структура безопасности для автономных агентов llm и ещё 17 новости

Саморазвивающаяся система навыков на основе openspace и ещё 16 новости

nvidia выпустила nemotron-cascade 2 – moe модель и ещё 9 новости

Создание ai-агента для веба с помощью molmo web-4b и ещё 8 новости

Как обучать LLM локально через федеративное обучение с LoRA и ещё 12 новости