O que ele descobriu pode parecer simples à primeira vista, mas traz implicações profundas para o futuro dos assistentes de IA. Em breve, poderemos ver esses assistentes interagindo com o que fazemos em nossas telas de computador.
Willison compartilhou sua experiência em um post detalhado em seu blog. Ele gravou um vídeo de 35 segundos enquanto rolava pelos e-mails relevantes, e em seguida, utilizou a ferramenta Google AI Studio, que permite que os usuários experimentem diferentes versões dos modelos de IA Gemini 1.5 Pro e Gemini 1.5 Flash.
Esse tipo de abordagem pode revolucionar a maneira como lidamos com informações digitais, tornando a extração de dados muito mais eficiente e intuitiva. Imagine a possibilidade de um assistente de IA que não apenas compreende o que você diz, mas também consegue “ver” e interagir com as informações em sua tela. Isso abre um leque de possibilidades para automatizar tarefas que antes eram vistas como triviais, mas que consomem tempo valioso.
Com essa inovação, o futuro parece promissor para a interação entre humanos e inteligência artificial. A ideia de que um assistente possa compreender o contexto visual das informações pode transformar radicalmente a forma como trabalhamos e organizamos nossos dados no dia a dia.
A tecnologia avança rapidamente, e cada vez mais, estamos nos aproximando de um mundo onde a inteligência artificial não apenas responde a comandos, mas também se torna uma parceira ativa em nossas atividades cotidianas. É um momento emocionante para a tecnologia e para todos nós que a utilizamos.
Redação Confraria Tech.
Referências:
Cheap AI “video scraping” can now extract data from any screen recording