новости ИИ: Google представляет Agentic Vision в Gemini 3 Flash

Автор

Heli

Опубликовано 05.02.2026

0,0

Google представляет Agentic Vision в Gemini 3 Flash для активного понимания изображений.

Новая функция Agentic Vision в Gemini 3 Flash меняет подход к анализу изображений, превращая его в активный процесс с использованием инструментов и визуальных доказательств. Модель больше не просто просматривает изображение, а планирует его изучение, выполняет код и повторно анализирует измененное изображение.

Благодаря интеграции с Python, Gemini 3 Flash демонстрирует улучшение качества на 5–10% в большинстве тестов компьютерного зрения. Модель способна обрезать, масштабировать, аннотировать изображения, выполнять вычисления и даже создавать графики для более точного анализа.

Ключевой особенностью является "цикл мышления, действия и наблюдения". Модель сначала анализирует запрос и изображение, разрабатывает план, затем выполняет Python-код для манипулирования изображением, и наконец, пересматривает измененное изображение для получения ответа.

Agentic Vision уже доступна через Gemini API в Google AI Studio и Vertex AI, а также постепенно внедряется в приложение Gemini. Она позволяет разработчикам создавать более точные и надежные решения для обработки изображений.

Авторизуйтесь, чтобы оставить комментарий.

Комментариев: 0

Похожие новости

новости ИИ: Google представляет Agentic Vision в Gemini 3 Flash

Похожие новости

Google лидирует в генерации изображений AI: Nano Banana 2 и другие новости

Perplexity Computer, AI-агенты и новости ИИ

GPT-5.1 от OpenAI: как обновление ноября 2025 меняет conversational AI

Grammarly отменяет «Expert Review» и другие новости AI

новые модели и инструменты ai: homesafe-bench, derain-agent и другие

Новости ИИ: NVIDIA представляет C-RADIOv4 для компьютерного зрения