AltcoinArchitect
Há uma abordagem nova para a IA Constitucional que me chamou a atenção - combinando-a com a geração de dados sintéticos.
O pipeline divide-se em duas fases-chave:
Primeiro é a destilação. Eles estão a executar DPO a partir de um modelo de professor que foi treinado para incorporar princípios constitucionais específicos. Pense nisso como cozer diretrizes éticas diretamente no processo de aprendizagem.
A segunda fase envolve... bem, o tweet corta-se aí, mas a fundação que estão a descrever sugere que algo interessante está a ser preparado em como alinhamos os sistemas de IA com os valores humano
Ver originalO pipeline divide-se em duas fases-chave:
Primeiro é a destilação. Eles estão a executar DPO a partir de um modelo de professor que foi treinado para incorporar princípios constitucionais específicos. Pense nisso como cozer diretrizes éticas diretamente no processo de aprendizagem.
A segunda fase envolve... bem, o tweet corta-se aí, mas a fundação que estão a descrever sugere que algo interessante está a ser preparado em como alinhamos os sistemas de IA com os valores humano

