OpenAI apresenta o Model Spec para comportamento dos modelos de Inteligência Artificial (IA)

A empresa convida o público em geral a compartilhar feedback sobre os objetivos, regras e padrões no Model Spec.

Richard 08/05/2024

Compartilhe essa notícia!

[Foto: Ilustrativa / LensGo]

A OpenAI recentemente compartilhou um primeiro rascunho do Model Spec, um novo documento que especifica como desejam que seus modelos se comportem na API da OpenAI e no ChatGPT. Essa iniciativa visa proporcionar às pessoas uma compreensão e discussão sobre as escolhas práticas envolvidas na definição do comportamento do modelo. O Model Spec reflete a documentação existente utilizada na OpenAI, sua pesquisa e experiência em projetar o comportamento do modelo, e trabalhos em andamento para informar o desenvolvimento de futuros modelos. Esta é uma continuação do compromisso contínuo da OpenAI em melhorar o comportamento do modelo utilizando a entrada humana, e complementa o trabalho de alinhamento coletivo e abordagem sistemática mais ampla para a segurança do modelo.

Moldando o Comportamento Desejado do Modelo

O comportamento do modelo, ou seja, a forma como os modelos respondem à entrada dos usuários – incluindo tom, personalidade, extensão da resposta e mais – é fundamental para a interação humana com as capacidades de IA. Moldar esse comportamento é uma ciência ainda incipiente, uma vez que os modelos não são programados explicitamente, mas sim aprendem a partir de uma ampla gama de dados.

Moldar o comportamento do modelo também deve levar em consideração uma ampla gama de questões, considerações e nuances, muitas vezes pesando diferenças de opiniões. Mesmo que um modelo tenha a intenção de ser amplamente benéfico e útil para os usuários, essas intenções podem entrar em conflito na prática. Por exemplo, uma empresa de segurança pode desejar gerar e-mails de phishing como dados sintéticos para treinar e desenvolver classificadores que protegerão seus clientes, mas essa mesma funcionalidade é prejudicial se usada por golpistas.

Apresentando o Model Spec

A OpenAI está compartilhando um primeiro rascunho do Model Spec, um novo documento que especifica sua abordagem para moldar o comportamento desejado do modelo e como avaliam os trade-offs quando surgem conflitos. Ele reúne a documentação usada na OpenAI hoje, sua experiência e pesquisa contínua em projetar o comportamento do modelo, e trabalhos mais recentes, incluindo contribuições de especialistas em domínios, que orientam o desenvolvimento de futuros modelos. Não é exaustivo, e espera-se que mude ao longo do tempo. A abordagem inclui:

Objetivos: Princípios amplos e gerais que fornecem uma noção direcional do comportamento desejado.
Regras: Instruções que abordam complexidade e ajudam a garantir segurança e legalidade.
Comportamentos Padrão: Diretrizes consistentes com objetivos e regras, fornecendo um modelo para lidar com conflitos e demonstrando como priorizar e equilibrar objetivos.

Como o Model Spec será Utilizado

Como continuação do trabalho em alinhamento coletivo e segurança do modelo, a OpenAI pretende usar o Model Spec como diretrizes para pesquisadores e treinadores de IA que trabalham em aprendizado por reforço a partir do feedback humano. Também explorarão em que medida seus modelos podem aprender diretamente a partir do Model Spec.

O Que Vem a Seguir

A OpenAI vê este trabalho como parte de uma conversa pública contínua sobre como os modelos devem se comportar, como o comportamento desejado do modelo é determinado, e como envolver melhor o público em geral nessas discussões. À medida que essa conversa continua, buscarão oportunidades de envolver partes interessadas globalmente representativas – incluindo legisladores, instituições confiáveis e especialistas em domínios – para aprender:

Como eles entendem a abordagem e os objetivos, regras e padrões individuais.
Se eles apoiam a abordagem e os objetivos, regras e padrões individuais.
Se há objetivos, regras e padrões adicionais que devem considerar.

A OpenAI aguarda feedback dessas partes interessadas à medida do decorrer do trabalho. Pelas próximas duas semanas, também convida o público em geral a compartilhar feedback sobre os objetivos, regras e padrões no Model Spec. Espera-se que isso lhes forneça insights iniciais à medida que desenvolvem um processo robusto para reunir e incorporar feedback para garantir que estão construindo de forma responsável em direção à sua missão.

Com informações da OpenAI.