
O estudo de prova de conceito da ASIC, realizado em janeiro e fevereiro, redigido em março e publicado em resposta a uma investigação do Senado em maio, apresenta várias limitações que dificultam generalizar sobre as capacidades de resumir dos modernos LLMs. Ainda assim, o estudo do governo mostra muitos dos possíveis problemas que grandes organizações devem considerar antes de simplesmente inserir as saídas do LLM em fluxos de trabalho existentes.
Para o estudo, a ASIC se uniu à Amazon Web Services para avaliar a capacidade dos LLMs de resumir “uma amostra de contribuições públicas feitas a uma investigação externa do Comitê Parlamentar Conjunto, analisando empresas de auditoria e consultoria”. Para os propósitos da ASIC, um bom resumo de uma dessas contribuições destacaria qualquer menção à ASIC, quaisquer recomendações para evitar conflitos de interesse e quaisquer pedidos de mais regulamentação, tudo com referências a números de página e “breve contexto” para explicação.
Redação Confraria Tech.
Referências:
Australian government trial finds AI is much worse than humans at summarizing