Генерация изображений с Diffusers от Hugging Face и ещё 2 новости
Генерация изображений с Diffusers от Hugging Face
Создание изображений высокого качества с помощью Diffusers от Hugging Face
В этой статье представлен практический подход к генерации изображений с использованием библиотеки Diffusers. Авторы начинают со стабилизации окружения, а затем генерируют изображения высокого качества по текстовым запросам с использованием Stable Diffusion и оптимизированного планировщика.
Для ускорения работы применяется LoRA-подход к генерации, композиция корректируется с помощью ControlNet, а локальные изменения выполняются через inpainting. Особое внимание уделяется методам, обеспечивающим баланс между качеством изображения, скоростью и управляемостью.
В рамках гайда демонстрируется ускорение процесса за счет использования и объединения LoRA-адаптера, а также применение ControlNet для управления композицией сцены. Для внесения точечных изменений используется маскирование и inpainting. В завершении все промежуточные и финальные результаты сохраняются для дальнейшего изучения и повторного использования.
Бессерверная архитектура MLOps для предсказания кодов ТН ВЭД
Исследователи представили бессерверную платформу MLOps, автоматизирующую полный цикл машинного обучения — от сбора данных и обучения до развертывания, мониторинга и повторного обучения. Платформа построена на основе событийных пайплайнов и управляемых сервисов, не привязана к конкретной модели и поддерживает различные способы инференса через стандартизированные интерфейсы.
В качестве примера применения выступила система предсказания кодов Гармонизированной системы (HS) — стандартизированных кодов для таможенного оформления товаров. Система решает задачу классификации коротких и неструктурированных описаний товаров, что особенно сложно из-за частых обновлений и неоднозначности формулировок. Использование Text-CNN позволило добиться 98% точности.
Ключевой особенностью платформы является автоматическое A/B-тестирование, которое позволяет динамически выбирать и внедрять лучшие модели, а также автоматическое масштабирование для обеспечения SLA при переменной нагрузке. При этом, приоритет отдается предсказуемости, надежности и объяснимости классификации, хотя архитектура может быть расширена для работы с трансформерами и LLM.
Решение обеспечивает воспроизводимость, аудит и оптимизацию затрат. Авторы утверждают, что предложенная архитектура может быть использована в других проектах для масштабирования машинного обучения с одновременной оптимизацией производительности и экономики.
OpenPlanter: AI для анализа данных и мониторинга властей
Новый проект с открытым исходным кодом OpenPlanter позволяет обычным пользователям анализировать большие объемы данных и отслеживать деятельность правительства. Созданный разработчиком под ником Shin Megami Boson, этот агент на базе больших языковых моделей (LLM) призван помочь разобраться в сложных взаимосвязях и выявить аномалии.
OpenPlanter умеет работать с разнородными данными – от CSV и JSON до PDF-файлов, сопоставляя информацию и выявляя скрытые связи. Его уникальная рекурсивная архитектура разбивает сложные задачи на более мелкие, используя до четырех уровней под-агентов для параллельной обработки и построения цепочек доказательств.
В основе OpenPlanter лежат современные модели, такие как OpenAI gpt-5.2, Anthropic claude-opus-4-6 и Cerebras qwen-3-235b-a22b-instruct-2507, а также инструменты для поиска в интернете и выполнения команд в системе. Для установки и запуска проекта рекомендуется использовать Docker.
Авторизуйтесь, чтобы оставить комментарий.
Нет комментариев.
Тут может быть ваша реклама
Пишите info@aisferaic.ru