Na última quinta-feira, a OpenAI anunciou o lançamento do "Operator", uma ferramenta de automação web que utiliza um novo modelo de IA chamado Computer-Using Agent (CUA). O sistema permite que usuários realizem tarefas na web de forma autônoma, interagindo com elementos na tela como um humano faria. O Operator já está disponível para assinantes do plano ChatGPT Pro no Brasil e em outros países.
Principais Pontos
- O Operator é uma ferramenta de automação que utiliza IA para controlar navegadores web.
- Disponível inicialmente para assinantes do plano ChatGPT Pro, com um custo de US$ 200 por mês.
- A IA é capaz de realizar tarefas complexas, como preencher formulários e acessar links, de forma autônoma.
- A OpenAI planeja expandir o acesso ao Operator para outros planos e desenvolvedores no futuro.
O Que É o Operator?
O Operator é uma inovação da OpenAI que se destaca por sua capacidade de operar um navegador web através de uma interface visual. Utilizando o modelo de linguagem GPT-4o, o Operator é projetado para executar tarefas de forma semelhante a um assistente pessoal inteligente. Isso inclui:
- Interação com Interfaces Gráficas: O Operator pode clicar em botões, preencher campos de texto e navegar por páginas da web.
- Análise de Conteúdo: A IA processa imagens da tela pixel por pixel para entender o que está acontecendo e decidir quais ações tomar.
- Execução de Tarefas: O sistema realiza entradas virtuais, como cliques e digitação, para completar tarefas solicitadas pelo usuário.
Como Funciona?
O funcionamento do Operator é baseado em um ciclo iterativo que permite à IA monitorar e interagir com o conteúdo da tela. O processo inclui:
- Captura de Screenshots: O Operator tira capturas de tela para acompanhar seu progresso.
- Análise de Imagens: Utiliza capacidades de visão do GPT-4o para processar dados visuais e entender a interface.
- Decisão e Ação: Com base na análise, a IA decide quais ações tomar e as executa.
Essa abordagem permite que o Operator se recupere de erros e gerencie tarefas complexas em diferentes aplicações.
Disponibilidade e Preço
O Operator foi lançado em várias regiões, incluindo Brasil, Austrália, Canadá, Índia, Japão, Cingapura, Coreia do Sul e Reino Unido. No entanto, o acesso é restrito a assinantes do plano ChatGPT Pro, que custa US$ 200 por mês (aproximadamente R$ 1.140). Além do Operator, a assinatura oferece acesso a outras funcionalidades, como a geração de vídeos do Sora e o modo investigação do o1 pro.
O Futuro do Operator
A OpenAI planeja integrar as capacidades do Operator diretamente no ChatGPT e disponibilizar o CUA através de sua API para desenvolvedores. Com o crescimento do interesse em sistemas de IA autônomos, a OpenAI se junta a outras empresas de tecnologia que estão explorando esse campo, como o Google e a Anthropic.
O lançamento do Operator marca um passo significativo na evolução da inteligência artificial, prometendo transformar a forma como interagimos com a tecnologia no dia a dia.