O o1 foi treinado para “passar mais tempo pensando nos problemas antes de responder, assim como uma pessoa faria”, afirmou a OpenAI em seu site. “Através do treinamento, [os modelos] aprendem a aprimorar seu processo de pensamento, tentar diferentes estratégias e reconhecer seus erros.” A OpenAI prevê que o novo modelo seja utilizado por pesquisadores da área da saúde para anotar dados de sequenciamento celular, por físicos para gerar fórmulas matemáticas e por desenvolvedores de software.
Os sistemas de IA atuais são essencialmente versões mais sofisticadas de preenchimento automático, gerando respostas por meio de estatísticas em vez de realmente “pensar” em uma questão, o que significa que são menos “inteligentes” do que aparentam ser. Quando a Engadget tentou fazer com que o ChatGPT e outros chatbots de IA resolvessem o New York Times Spelling Bee, por exemplo, eles falharam e produziram resultados sem sentido.
Com o o1, a empresa afirma estar “reiniciando o contador de volta para 1” com um novo tipo de modelo de IA projetado para se envolver efetivamente na resolução de problemas complexos e no pensamento lógico. Em uma postagem de blog detalhando o novo modelo, a OpenAI afirmou que ele se sai de forma semelhante a estudantes de doutorado em tarefas desafiadoras de referência em física, química e biologia, e se destaca em matemática e programação. Por exemplo, seu modelo principal atual, o GPT-4o, resolveu corretamente apenas 13% dos problemas em um exame de qualificação para a Olimpíada Internacional de Matemática, em comparação com o o1, que resolveu 83%.
No entanto, o novo modelo não inclui capacidades como navegação na web ou a capacidade de enviar arquivos e imagens. E, de acordo com The Verge, ele é significativamente mais lento no processamento de prompts em comparação com o GPT-4o. Apesar de ter mais tempo para considerar suas saídas, o1 não resolveu o problema das “alucinações” — um termo para modelos de IA inventando informações. “Não podemos dizer que resolvemos as alucinações”, disse o diretor de pesquisa da empresa, Bob McGrew, ao The Verge.
O o1 ainda está em estágio inicial. A OpenAI o chama de “prévia” e está disponibilizando-o apenas para clientes pagantes do ChatGPT a partir de hoje, com restrições sobre quantas perguntas eles podem fazer por semana. Além disso, a OpenAI também está lançando o1-mini, uma versão simplificada que a empresa diz ser particularmente eficaz para programação.
Redação Confraria Tech
Referências:
OpenAI’s new o1 model is slower, on purpose