A OpenAI afirma que o o1-preview supera seu antecessor, o GPT-4o, em vários benchmarks, incluindo programação competitiva, matemática e “raciocínio científico”. No entanto, pessoas que utilizaram o modelo afirmam que ele ainda não supera o GPT-4o em todos os aspectos. Outros usuários têm criticado a demora na obtenção de uma resposta do modelo, devido ao processamento em várias etapas que ocorre nos bastidores antes de responder a uma consulta.
Em uma rara demonstração pública de moderação de expectativas, a gerente de produtos da OpenAI, Joanne Jang, tuitou: “Há muita empolgação em torno do o1 no meu feed, então estou preocupada que isso possa criar expectativas erradas. O que o o1 é: o primeiro modelo de raciocínio que se destaca em tarefas realmente difíceis, e ele só vai melhorar. (Estou pessoalmente animada com o potencial e a trajetória do modelo!) O que o o1 não é (ainda!): um modelo milagroso que faz tudo melhor do que os modelos anteriores. Você pode se decepcionar se essa for sua expectativa para o lançamento de hoje – mas estamos trabalhando para chegar lá!”
Redação Confraria Tech
Referências:
OpenAI’s new “reasoning” AI models are here: o1-preview and o1-mini