De acordo com informações de fontes próximas ao projeto, Jarvis opera capturando capturas de tela frequentes do que está sendo exibido no computador. Ele interpreta essas imagens e, a partir daí, executa ações como clicar em botões ou preencher campos de texto. Essa abordagem inovadora visa facilitar atividades comuns, como pesquisas, compras e reservas de voos, tudo isso especialmente no navegador Chrome.
Essa iniciativa surge em um momento em que o Google está ampliando as capacidades de sua inteligência artificial Gemini. Espera-se que a próxima geração desse modelo seja revelada em dezembro, e já nesta semana, o Gemini Live, o chatbot da empresa, ganhou suporte para várias novas línguas. Além disso, a integração do Gemini já está presente em aplicativos como Google Meet e Google Photos, mostrando o compromisso da empresa em tornar suas ferramentas mais acessíveis e funcionais.
A notícia sobre Jarvis chega logo após a Anthropic ter apresentado uma funcionalidade semelhante para sua IA Claude, que também foi equipada com habilidades para operar uma variedade de ferramentas e programas de software. Essa opção já está disponível em versão beta pública, o que indica uma corrida entre as empresas para oferecer soluções cada vez mais inteligentes e úteis.
Com essas inovações, o futuro da interação com a tecnologia parece promissor. A ideia de ter um assistente que compreende nossas necessidades e nos ajuda a navegar pelo vasto mundo digital pode ser um divisor de águas na forma como realizamos tarefas cotidianas. Fique atento, pois dezembro promete ser um mês repleto de novidades no universo da inteligência artificial.
Redação Confraria Tech.
Referências:
Google is reportedly developing ‘Jarvis’ AI that could take over your web browser