Новости о больших языковых моделях
LLM: архитектура, обучение, сравнение моделей GPT-4, Claude, Gemini, DeepSeek, Llama. Контекстные окна, файн-тюнинг, локальный запуск и RAG.
Heli
10.04.2026
Открытые веса и кибербезопасность: риски и перспективы
Недавние сообщения в прессе, касающиеся "открытых весов", вызвали значительные дискуссии в сообществе искусственного интеллекта. В частности, анонс модели Claude Mythos и её заявленные возможности, особенно в области кибербезопасности, породили опасения, …
Heli
10.04.2026
sentence transformers для многомодальных представлений и переранжирования
Модели Sentence Transformers предлагают решения для создания многомодальных представлений и переранжирования. Эти модели способны объединять информацию из разных модальностей, таких как текст и изображения.
Многомодальные представления
В контексте многомодальных представлений, …
Heli
10.04.2026
Convapparel: новый набор данных для реалистичных диалоговых систем
Пользовательские симуляторы становятся все более важными для обучения политик диалогового взаимодействия, но их реалистичность часто вызывает вопросы. В статье представлен ConvApparel, новый набор данных для оценки и улучшения этих симуляторов. …
Heli
10.04.2026
anthropic приостановила релиз claude mythos из-за уязвимостей
Компания Anthropic сохраняет свою новую модель искусственного интеллекта в секрете после обнаружения тысяч внешних уязвимостей.
Anthropic, создатель чат-бота Claude, обнаружила тысячи уязвимостей в своей новой модели искусственного интеллекта Claude Mythos …
Heli
10.04.2026
Открытые веса моделей ИИ и опасения вокруг claude mythos
В последнее время наблюдается путаница и распространение необоснованных опасений относительно «открытых весов» моделей искусственного интеллекта, особенно в контексте Claude Mythos. Существуют утверждения о том, что модели с открытыми весами неизменно …
Heli
09.04.2026
бесплатный курс по генеративному искусственному интеллекту от kaggle и google
Kaggle и Google предлагают бесплатный 5-дневный курс по генеративному искусственному интеллекту (GenAI). Курс предназначен для тех, кто хочет быстро освоить основы и начать использовать генеративный ИИ в своей работе.
В …
Heli
09.04.2026
meta superintelligence labs выпустила muse spark
Meta Superintelligence Labs выпустила свою первую модель. Она называется Muse Spark и обрабатывает входные данные в виде голоса, текста и изображений, а также имеет режим "размышления", в котором несколько агентов …
Heli
09.04.2026
новые ai-агенты для улучшения академического рабочего процесса
Мы представляем двух новых агентов искусственного интеллекта, разработанных для улучшения академического рабочего процесса. Эти агенты направлены на то, чтобы помочь исследователям в создании более качественных иллюстраций и проведении более эффективного …
Heli
08.04.2026
Запуск qwen3.5 локально с ollama и создание агента
В этом руководстве вы узнаете, как запустить Qwen3.5 локально, используя Ollama и подключить его к OpenCode для создания простой локальной агентической системы. В оригинале не указано, что Qwen3.5 разработана Alibaba. …
Heli
08.04.2026
Обучение мРНК языковой модели обошлось в $165
Обучение языковых моделей на основе мРНК для 25 видов обошлось в 165 долларов.
В новой работе исследователи обучили языковую модель мРНК для 25 видов, потратив всего 165 долларов на вычислительные …
Heli
08.04.2026
Anthropic выпустила claude mythos: искусственный интеллект превзошел gpt-4
Новая модель искусственного интеллекта от Anthropic обладает слишком большой мощью для мира.
Компания Anthropic выпустила новую модель искусственного интеллекта под названием Claude Mythos Preview, которая, по их утверждению, превосходит другие …
Heli
07.04.2026
7 шагов к освоению генерации с расширением поиска (rag)
Чтобы освоить генерацию с расширением поиска (Retrieval-Augmented Generation, RAG), можно следовать семи шагам. Во-первых, необходимо выбрать и очистить источники данных. Во-вторых, нужно разделить документы на части (chunking и splitting). В-третьих, …