News

Meta lança modelo de IA que pode verificar como outros modelos funcionam


Nova Iorque:

A proprietária do Facebook, Meta, disse na sexta-feira que estava lançando um lote de novos modelos de IA de sua divisão de pesquisa, incluindo um “avaliador autodidata” que pode oferecer um caminho para menos envolvimento humano no processo de desenvolvimento de IA.

O lançamento segue a introdução da ferramenta pela Meta em um artigo de agosto, que detalhou como ela se baseia na mesma técnica de “cadeia de pensamento” usada pelos modelos o1 lançados recentemente pela OpenAI para fazer julgamentos confiáveis ​​sobre as respostas dos modelos.

Essa técnica envolve dividir problemas complexos em etapas lógicas menores e parece melhorar a precisão das respostas em problemas desafiadores em disciplinas como ciências, codificação e matemática.

Os pesquisadores da Meta usaram dados inteiramente gerados por IA para treinar o modelo do avaliador, eliminando também a contribuição humana nessa fase.

A capacidade de usar IA para avaliar a IA de forma confiável oferece um vislumbre de um possível caminho para a construção de agentes de IA autônomos que possam aprender com seus próprios erros, disseram à Reuters dois dos pesquisadores da Meta por trás do projeto.

Muitos no campo da IA ​​consideram esses agentes como assistentes digitais inteligentes o suficiente para realizar uma vasta gama de tarefas sem intervenção humana.

Modelos de autoaperfeiçoamento poderiam eliminar a necessidade de um processo muitas vezes caro e ineficiente usado hoje, chamado Aprendizado por Reforço a partir de Feedback Humano, que requer informações de anotadores humanos que devem ter conhecimento especializado para rotular os dados com precisão e verificar se as respostas a consultas complexas de matemática e escrita estão corretos.

“Esperamos que, à medida que a IA se torna cada vez mais sobre-humana, ela se torne cada vez melhor na verificação do seu trabalho, para que seja realmente melhor do que o ser humano médio”, disse Jason Weston, um dos investigadores.

“A ideia de ser autodidata e capaz de se autoavaliar é basicamente crucial para chegar a esse tipo de nível sobre-humano de IA”, disse ele.

Outras empresas, incluindo Google e Anthropic, também publicaram pesquisas sobre o conceito de RLAIF, ou Reinforcement Learning from AI Feedback. Ao contrário da Meta, porém, essas empresas tendem a não divulgar seus modelos para uso público.

Outras ferramentas de IA lançadas pela Meta na sexta-feira incluíram uma atualização do modelo Segment Anything de identificação de imagem da empresa, uma ferramenta que acelera os tempos de geração de resposta LLM e conjuntos de dados que podem ser usados ​​para auxiliar na descoberta de novos materiais inorgânicos.

(Exceto a manchete, esta história não foi editada pela equipe da NDTV e é publicada a partir de um feed distribuído.)


Source

Related Articles

Back to top button