Генерация изображений с Diffusers от Hugging Face и ещё 2 новости

Генерация изображений с Diffusers от Hugging Face

Создание изображений высокого качества с помощью Diffusers от Hugging Face

В этой статье представлен практический подход к генерации изображений с использованием библиотеки Diffusers. Авторы начинают со стабилизации окружения, а затем генерируют изображения высокого качества по текстовым запросам с использованием Stable Diffusion и оптимизированного планировщика.

Для ускорения работы применяется LoRA-подход к генерации, композиция корректируется с помощью ControlNet, а локальные изменения выполняются через inpainting. Особое внимание уделяется методам, обеспечивающим баланс между качеством изображения, скоростью и управляемостью.

В рамках гайда демонстрируется ускорение процесса за счет использования и объединения LoRA-адаптера, а также применение ControlNet для управления композицией сцены. Для внесения точечных изменений используется маскирование и inpainting. В завершении все промежуточные и финальные результаты сохраняются для дальнейшего изучения и повторного использования.

Бессерверная архитектура MLOps для предсказания кодов ТН ВЭД

Исследователи представили бессерверную платформу MLOps, автоматизирующую полный цикл машинного обучения — от сбора данных и обучения до развертывания, мониторинга и повторного обучения. Платформа построена на основе событийных пайплайнов и управляемых сервисов, не привязана к конкретной модели и поддерживает различные способы инференса через стандартизированные интерфейсы.

В качестве примера применения выступила система предсказания кодов Гармонизированной системы (HS) — стандартизированных кодов для таможенного оформления товаров. Система решает задачу классификации коротких и неструктурированных описаний товаров, что особенно сложно из-за частых обновлений и неоднозначности формулировок. Использование Text-CNN позволило добиться 98% точности.

Ключевой особенностью платформы является автоматическое A/B-тестирование, которое позволяет динамически выбирать и внедрять лучшие модели, а также автоматическое масштабирование для обеспечения SLA при переменной нагрузке. При этом, приоритет отдается предсказуемости, надежности и объяснимости классификации, хотя архитектура может быть расширена для работы с трансформерами и LLM.

Решение обеспечивает воспроизводимость, аудит и оптимизацию затрат. Авторы утверждают, что предложенная архитектура может быть использована в других проектах для масштабирования машинного обучения с одновременной оптимизацией производительности и экономики.

OpenPlanter: AI для анализа данных и мониторинга властей

Новый проект с открытым исходным кодом OpenPlanter позволяет обычным пользователям анализировать большие объемы данных и отслеживать деятельность правительства. Созданный разработчиком под ником Shin Megami Boson, этот агент на базе больших языковых моделей (LLM) призван помочь разобраться в сложных взаимосвязях и выявить аномалии.

OpenPlanter умеет работать с разнородными данными – от CSV и JSON до PDF-файлов, сопоставляя информацию и выявляя скрытые связи. Его уникальная рекурсивная архитектура разбивает сложные задачи на более мелкие, используя до четырех уровней под-агентов для параллельной обработки и построения цепочек доказательств.

В основе OpenPlanter лежат современные модели, такие как OpenAI gpt-5.2, Anthropic claude-opus-4-6 и Cerebras qwen-3-235b-a22b-instruct-2507, а также инструменты для поиска в интернете и выполнения команд в системе. Для установки и запуска проекта рекомендуется использовать Docker.