Google представила свою новую модель искусственного интеллекта — Gemini 2.5 Computer Use. Об этом сообщило интернет-издание webtekno.com.
Google представила новую модель искусственного интеллекта под названием “Gemini 2.5 Computer Use”. Эта модель может перемещаться по интернет-браузеру, как человек, заполнять формы и выполнять определённые задачи в интернете.
Новая модель является усовершенствованной версией автономных агентов, которые тестировались в проектах Google AI Mode и Project Mariner. Этот шаг компании последовал сразу после анонса ChatGPT Agent от OpenAI. В Google утверждают, что их искусственный интеллект показывает более высокие результаты, чем конкуренты, в тестах производительности как в интернете, так и на мобильных устройствах.
Что умеет Gemini 2.5 Computer Use?
На данный момент Gemini 2.5 может выполнять действия только в браузере, то есть он ещё не обладает полным контролем на уровне рабочего стола. Однако он поддерживает 13 различных действий, включая написание текста, операции перетаскивания (drag-and-drop) и открытие браузера. Google заявила, что разработчики могут получить доступ к модели через AI Studio и Vertex AI, а также посмотреть живые демонстрации через платформу Browserbase.



