Новости о больших языковых моделях
LLM: архитектура, обучение, сравнение моделей GPT-4, Claude, Gemini, DeepSeek, Llama. Контекстные окна, файн-тюнинг, локальный запуск и RAG.
Heli
29.03.2026
Apple усиливает работу с искусственным интеллектом и llm
Компания Apple, по всей видимости, начала уделять больше внимания искусственному интеллекту (ИИ). Это стало очевидно после публикации вакансии на должность инженера по машинному обучению, специализирующегося на больших языковых моделях (LLM).
…
Heli
29.03.2026
nanobot: инструменты, память, навыки и планирование задач
В этой статье представлен руководство по программированию для изучения полной цепочки агентов nanobot, начиная с подключения инструментов и памяти и заканчивая навыками, под-агентами и планированием заданий по расписанию Cron.
инструменты …
Heli
29.03.2026
Mistral ai представляет voxtral tts – модель синтеза речи
Компания Mistral AI выпустила Voxtral TTS, модель потоковой синтеза речи с открытым весом, предназначенную для генерации голоса на нескольких языках с низкой задержкой. Размер модели составляет 4 миллиарда параметров.
Voxtral …
Heli
28.03.2026
OpenClaw: переходите на Hugging Face и локальные модели
Ученые обнаружили гигантскую "полость" за пределами Земли, существование которой не должно было быть возможным. Магнитное поле Земли создало огромное пространство, лишенное галактических космических лучей, что может помочь защитить астронавтов от …
Heli
27.03.2026
7 бесплатных api для разработчиков и вайб-кодеров
Вот семь бесплатных веб-API, которые должны знать каждый разработчик и "вайб-кодер". Эти API предлагают различные функциональные возможности, от генерации текста до распознавания изображений, и все они бесплатны для использования.
Генерация …
Heli
26.03.2026
Smolagents: создание программных агентов на python
Smolagents – это библиотека Python, предназначенная для создания программных агентов, способных взаимодействовать с кодом и друг с другом. Она позволяет разрабатывать агентов, которые могут читать, писать и изменять код, а …
Heli
26.03.2026
Создание ai-агента для веба с помощью molmo web-4b и ещё 8 новости
Создание ai-агента для веба с помощью molmo web-4b
Создание веб-агента искусственного интеллекта, управляемого зрением, с использованием MolmoWeb-4B включает в себя многомодальное рассуждение и прогнозирование действий. MolmoWeb-4B — это модель, разработанная …
Heli
25.03.2026
Саморазвивающаяся система навыков на основе openspace и ещё 16 новости
Саморазвивающаяся система навыков на основе openspace
Представлена реализация кодирования для разработки саморазвивающейся системы навыков с использованием OpenSpace для обучения навыкам, эффективности использования токенов и коллективного интеллекта. Система разработана для динамичной …
Heli
25.03.2026
paged attention: повышение эффективности llm при выводе
В больших языковых моделях (LLM) внимание – важный, но ресурсоемкий компонент. С увеличением длины последовательности затраты на внимание растут квадратично, что делает обработку длинных текстов сложной задачей. Для решения этой …
Heli
24.03.2026
Python библиотеки для работы с большими языковыми моделями
Инженеру, работающему с большими языковыми моделями (LLM), полезно знать ряд библиотек Python.
Основы работы с LLM
Библиотека transformers от Hugging Face – это фундаментальный инструмент, предоставляющий доступ к большому количеству …
Heli
24.03.2026
5 советов по использованию openai codex для кодирования
Вот пять советов, как превратить OpenAI Codex в мощный инструмент искусственного интеллекта для кодирования.
Codex – это модель искусственного интеллекта, разработанная OpenAI, которая преобразует естественный язык в код. Она может …
Heli
23.03.2026
потеря самосовершенствования: новый метод обучения ai
Потеря самосовершенствования
Новая техника, называемая «потеря самосовершенствования» (lossy self-improvement), позволяет моделям генеративного искусственного интеллекта улучшать свои собственные возможности без использования размеченных данных. Эта методика, разработанная исследователями из Google DeepMind, использует …