
Компания Google анонсировала запуск обновленной версии ИИ-агента Gemini Deep Research, который обещает стать более мощным инструментом для глубоких исследований. Этот агент способен выполнять долгосрочные задачи и предоставлять результаты в виде детализированных отчетов. В настоящее время он доступен для разработчиков и скоро будет интегрирован в потребительские приложения Google, такие как Gemini, Google Search и NotebookLM.
Ключевые особенности и возможности
Одной из главных характеристик нового Gemini Deep Research является его интеграция с интерфейсом Interactions API, который предоставляет единый доступ к моделям, таким как Gemini 3 Pro, и агентам. Google заявляет, что новый API поддерживает возможности "мышления" и использования продвинутых инструментов, выходящих за рамки генерации текста.
По словам компании, агент оптимизирован для выполнения длительных задач по сбору и синтезу контекста. Благодаря возможностям Gemini 3 Pro, система специально обучена для уменьшения иллюзорности и повышения качества отчетов при решении сложных задач. Агент формулирует запросы, читает результаты, выявляет пробелы в знаниях и проводит повторные поиски.
Визуальное мышление и обработка данных
Особо стоит отметить возможности визуального мышления Gemini 3 Pro. Модель способна выполнять задачи, такие как планирование траекторий движения роботов на складах и извлечение информации из рукописного текста, диаграмм и математических обозначений. Эти функции позволяют автоматизировать задачи поиска данных, например, сканировать документы для нахождения нужной информации.
Обновленный агент Gemini Deep Research превзошел Gemini 3 Pro в ряде тестов. Он показал 46,4% против 43,2% у Gemini 3 Pro на наборе HLE (логика и знания), 66,1% против 56,6% на DeepSearchQA (комплексное веб-исследование) и 59,2% против 49,4% на BrowseComp (поиск труднодоступных фактов).
Перспективы и заключение
Запуск Gemini Deep Research открывает новые возможности для глубоких исследований и автоматизации задач, связанных с обработкой данных. Google планирует расширить функциональность встроенных агентов, предоставив пользователям возможность создавать и использовать собственные агенты через единый API. Это может существенно изменить подход к решению исследовательских задач, сделав его более эффективным и целенаправленным.



