Com a introdução do Veo, o Google se destaca como o primeiro grande provedor de nuvem a oferecer um modelo de imagem para vídeo. Enquanto isso, o modelo Sora da OpenAI ainda está restrito a um grupo seleto de artistas e pesquisadores, embora a empresa tenha anunciado que começará uma série de demonstrações de produtos em breve, o que pode mudar o cenário rapidamente.
O Veo é capaz de gerar vídeos em qualidade 1080p que se mantêm consistentes e coerentes, com duração superior a um minuto. Ele pode trabalhar tanto com prompts de texto quanto com imagens, permitindo que os usuários comecem a criar vídeos a partir de fotos geradas por inteligência artificial ou imagens feitas por humanos. No entanto, como qualquer modelo de IA, o Veo enfrenta desafios, especialmente em relação à causa e efeito. Um exemplo disso pode ser visto em um vídeo de marshmallows sendo assados, onde os doces não parecem dourar e queimar como esperado quando expostos ao calor da chama da fogueira.
Quanto ao Imagen 3, o Google afirma que este modelo é capaz de criar imagens de altíssima qualidade e realismo a partir de simples descrições. Comparado às versões anteriores, o Imagen 3 traz melhorias significativas em detalhes, iluminação e redução de artefatos. No entanto, ao analisar alguns exemplos, é possível notar que ainda há espaço para aprimoramentos. Em uma das imagens de amigos sentados na mala de um carro, a descrição menciona “fotografia com flash”, mas os sujeitos aparecem claramente contra a luz, o que pode indicar que a ideia original não foi totalmente capturada.
Apesar dessas limitações, o Google está ansioso para que mais empresas adotem a inteligência artificial generativa. De acordo com pesquisas da própria empresa, 86% das companhias que utilizam IA generativa em suas operações reportam aumento na receita. Contudo, um estudo recente da Appen revelou que o retorno sobre investimento em projetos de IA caiu 4,6 pontos percentuais entre 2023 e 2024, sinalizando que, apesar do potencial, o caminho para a plena implementação ainda apresenta desafios.
Essas inovações prometem transformar a maneira como interagimos com a tecnologia, abrindo novas possibilidades para a criação de conteúdo e a expressão artística no mundo digital. A evolução da inteligência artificial generativa é um campo empolgante que nos convida a explorar e experimentar.
Redação Confraria Tech.
Referências:
Google’s generative AI video model is available in private preview
0 Comments