OpenAI apresenta o Model Spec para comportamento dos modelos de Inteligência Artificial (IA)
[Foto: Ilustrativa / LensGo]
A OpenAI recentemente compartilhou um primeiro rascunho do Model Spec, um novo documento que especifica como desejam que seus modelos se comportem na API da OpenAI e no ChatGPT. Essa iniciativa visa proporcionar às pessoas uma compreensão e discussão sobre as escolhas práticas envolvidas na definição do comportamento do modelo. O Model Spec reflete a documentação existente utilizada na OpenAI, sua pesquisa e experiência em projetar o comportamento do modelo, e trabalhos em andamento para informar o desenvolvimento de futuros modelos. Esta é uma continuação do compromisso contínuo da OpenAI em melhorar o comportamento do modelo utilizando a entrada humana, e complementa o trabalho de alinhamento coletivo e abordagem sistemática mais ampla para a segurança do modelo.
Moldando o Comportamento Desejado do Modelo
O comportamento do modelo, ou seja, a forma como os modelos respondem à entrada dos usuários – incluindo tom, personalidade, extensão da resposta e mais – é fundamental para a interação humana com as capacidades de IA. Moldar esse comportamento é uma ciência ainda incipiente, uma vez que os modelos não são programados explicitamente, mas sim aprendem a partir de uma ampla gama de dados.
Moldar o comportamento do modelo também deve levar em consideração uma ampla gama de questões, considerações e nuances, muitas vezes pesando diferenças de opiniões. Mesmo que um modelo tenha a intenção de ser amplamente benéfico e útil para os usuários, essas intenções podem entrar em conflito na prática. Por exemplo, uma empresa de segurança pode desejar gerar e-mails de phishing como dados sintéticos para treinar e desenvolver classificadores que protegerão seus clientes, mas essa mesma funcionalidade é prejudicial se usada por golpistas.
Apresentando o Model Spec
A OpenAI está compartilhando um primeiro rascunho do Model Spec, um novo documento que especifica sua abordagem para moldar o comportamento desejado do modelo e como avaliam os trade-offs quando surgem conflitos. Ele reúne a documentação usada na OpenAI hoje, sua experiência e pesquisa contínua em projetar o comportamento do modelo, e trabalhos mais recentes, incluindo contribuições de especialistas em domínios, que orientam o desenvolvimento de futuros modelos. Não é exaustivo, e espera-se que mude ao longo do tempo. A abordagem inclui:
- Objetivos: Princípios amplos e gerais que fornecem uma noção direcional do comportamento desejado.
- Regras: Instruções que abordam complexidade e ajudam a garantir segurança e legalidade.
- Comportamentos Padrão: Diretrizes consistentes com objetivos e regras, fornecendo um modelo para lidar com conflitos e demonstrando como priorizar e equilibrar objetivos.
Como o Model Spec será Utilizado
Como continuação do trabalho em alinhamento coletivo e segurança do modelo, a OpenAI pretende usar o Model Spec como diretrizes para pesquisadores e treinadores de IA que trabalham em aprendizado por reforço a partir do feedback humano. Também explorarão em que medida seus modelos podem aprender diretamente a partir do Model Spec.
O Que Vem a Seguir
A OpenAI vê este trabalho como parte de uma conversa pública contínua sobre como os modelos devem se comportar, como o comportamento desejado do modelo é determinado, e como envolver melhor o público em geral nessas discussões. À medida que essa conversa continua, buscarão oportunidades de envolver partes interessadas globalmente representativas – incluindo legisladores, instituições confiáveis e especialistas em domínios – para aprender:
- Como eles entendem a abordagem e os objetivos, regras e padrões individuais.
- Se eles apoiam a abordagem e os objetivos, regras e padrões individuais.
- Se há objetivos, regras e padrões adicionais que devem considerar.
A OpenAI aguarda feedback dessas partes interessadas à medida do decorrer do trabalho. Pelas próximas duas semanas, também convida o público em geral a compartilhar feedback sobre os objetivos, regras e padrões no Model Spec. Espera-se que isso lhes forneça insights iniciais à medida que desenvolvem um processo robusto para reunir e incorporar feedback para garantir que estão construindo de forma responsável em direção à sua missão.
Com informações da OpenAI.