Google анонсировала Project Mariner — инновационного ИИ-агента, способного выполнять различные задачи в браузере Chrome, сообщает TechCrunch. Этот агент управляет курсором, кликает на элементы интерфейса и заполняет формы. Основой разработки послужила модель Gemini, и пока доступ к ней имеют лишь ограниченное количество тестировщиков. Основная цель проекта — улучшить пользовательский опыт в сети.
После установки Project Mariner открывается специальное окно чата в браузере. Пользователи могут давать агенту команды. Например, он может отправиться в онлайн-магазин, найти нужные товары и добавить их в корзину покупок. Тем не менее, выполнение операций занимает время: между отдельными действиями может пройти до пяти секунд. Иногда агент прерывает выполнение, чтобы прояснить детали, например, по количеству или весу товара.
Однако Project Mariner не способен оформлять заказы или вводить данные платежных карт, а также принимать соглашения от имени человека. Google сознательно ограничила эти возможности, чтобы пользователи сохраняли полный контроль над действиями агента. Дополнительно, агент осуществляет создание скриншотов браузера, которые затем обрабатываются в облачном сервисе Gemini и возвращают инструкции для работы с сайтом.
Данный ИИ может функционировать лишь в активной вкладке браузера, что подразумевает необходимость наблюдения со стороны пользователя. Технический директор DeepMind Корай Кавукчуоглу указал на важность прозрачности этих процессов. Он акцентировал, что Mariner должен стать дополнением к человеческому взаимодействию с интернетом, а не его заменой.