Пользователь стал ненужен — новая модель ИИ Anthropic самостоятельно управляет ПК.

Сегодня 22 октября 2024

Пользователь больше не нужен — новая ИИ-модель Anthropic сама управляет ПК. Прошлой весной Anthropic анонсировала создание «алгоритма нового поколения для самообучения ИИ», который способен выполнять большинство офисных задач, что позволит автоматизировать значительную часть экономики. Сегодня компания представила версию 3.5 своей модели Claude Sonnet, которая может взаимодействовать с любым десктопным приложением через API Computer Use, имитируя нажатия клавиш, клики и жесты мыши, полностью эмулируя человеческие действия.

my image

«Мы обучили Claude видеть, что происходит на экране, а затем использовать доступные программные инструменты для выполнения задач, — сообщает Anthropic. — Когда разработчик поручает Claude использовать часть компьютерного программного обеспечения и даёт ему необходимый доступ, Claude смотрит на скриншоты того, что видит пользователь, затем подсчитывает, на сколько пикселей по вертикали или горизонтали ему нужно переместить курсор, чтобы щёлкнуть в нужном месте».

Инструмент, известный как «агент ИИ», который может автоматизировать задачи на ПК, не является новой концепцией. Хотя термин остаётся нечетко определённым, он подразумевает ИИ, способный автоматизировать работу с программным обеспечением на ПК. Многие компании предлагают подобные инструменты, включая Microsoft, Salesforce и OpenAI, а также новые стартапы, такие как Relay и Induced AI.

Некоторые аналитики уверены, что агенты ИИ смогут помочь компаниям более эффективно использовать инвестиции в технологии. Согласно недавнему опросу Capgemini, 10 % организаций уже используют агентов ИИ, а 82 % планируют интегрировать их в течение следующих трёх лет.

my image

Anthropic называет свою концепцию агента ИИ «слоем действия-исполнения», который позволяет ему выполнять команды на уровне рабочего стола. Claude 3.5 Sonnet может взаимодействовать с любым сайтом или приложением, благодаря своей способности просматривать веб-страницы. «Люди контролируют процесс с помощью подсказок, направляющих действия Claude, например, “использовать данные с моего компьютера и из сети, чтобы заполнить эту форму”, — поясняет представитель Anthropic. — Люди разрешают доступ и ограничивают его по мере необходимости. Claude разбивает подсказки пользователя на компьютерные команды для выполнения задач».

my image

В чем отличие Claude 3.5 Sonnet от других агентов ИИ? Anthropic утверждает, что это более мощная и надежная модель, которая справляется с задачами кодирования лучше, чем даже флагманская модель OpenAI, согласно бенчмарку SWE-bench Verified. Claude самостоятельно корректирует и повторяет задачи при возникновении препятствий и может работать над целями, требующими десятков или сотен шагов.

Однако Anthropic признает, что обновлённая модель испытывает трудности с базовыми действиями, такими как прокрутка и масштабирование, и может пропускать кратковременные события из-за того, как она обрабатывает снимки экрана. В тестах по бронированию авиабилетов Claude 3.5 Sonnet успешно справилась менее чем с половиной задач.

my image

Что касается безопасности, недавние исследования показали, что даже модели, не имеющие доступа к настольным приложениям, могут быть задействованы в вредоносных действиях. Изучая методы взлома, исследователи достигли высокого процента успешного выполнения вредоносных задач даже для защищённых моделей.

Модель с доступом к ПК может представлять ещё большую угрозу, используя уязвимости приложений для компрометации личной информации. Anthropic не отрицает, что использование Claude 3.5 Sonnet может подвергать пользователей дополнительным рискам, но считает, что лучше предоставить доступ к компьютерам менее безопасным моделям и постепенно наращивать использование компьютеров, одновременно принимая меры для снижения рисков.

Anthropic объявила, что предприняла меры для предотвращения ненадлежащего использования, такие как отсутствие обучения на снимках экрана пользователей и отсутствие доступа в интернет во время обучения. Компания разработала классификаторы для предотвращения высокорисковых действий, таких как публикация в социальных сетях или взаимодействие с правительственными ресурсами.

Anthropic сообщила, что имеет возможность ограничивать доступ к дополнительным функциям при необходимости. В качестве меры предосторожности все снимки экрана, сделанные Computer Use, хранятся не менее 30 дней, что может создать дополнительные риски безопасности. Компания не уточнила, при каких условиях она может передать снимки экрана третьим лицам.

«Надёжные методы отсутствуют, и мы будем постоянно оценивать и совершенствовать меры безопасности, чтобы сбалансировать возможности Claude с ответственным использованием», — утверждает Anthropic. Пользователям рекомендуется принимать меры предосторожности, чтобы минимизировать риски, включая изоляцию Claude от конфиденциальных данных на компьютере.

Одновременно с выпуском модели Claude 3.5 Sonnet, Anthropic анонсировала обновленную версию Claude 3.5 Haiku. _«Благодаря высокой скорости и улучшенному следованию инструкциям, Claude 3.5 Haiku подходит для специализированных задач и создания персонализированного опыта», — говорится в блоге Anthropic. Haiku будет доступна как текстовая модель, а затем как часть мультимодального пакета, способного анализировать текст и изображения.

Что касается выпуска обновлённой модели Claude 3.5 Opus, представитель Anthropic заявил: «Все модели в семействе Claude имеют свое индивидуальное применение для клиентов. Claude 3.5 Opus есть в нашей дорожной карте, и мы поделимся подробностями позже».

Разработчики уже могут протестировать Computer Use через API Anthropic, Amazon Bedrock и платформу Vertex AI от Google Cloud.

Вернуться на главную