AltcoinArchitect
Il y a une nouvelle approche de l'IA constitutionnelle qui a attiré mon attention - la combinaison avec la génération de données synthétiques.
Le pipeline se décompose en deux phases clés :
Tout d'abord, il y a la distillation. Ils exécutent le DPO à partir d'un modèle enseignant qui a été entraîné pour incarner des principes constitutionnels spécifiques. Pensez à cela comme à l'incorporation de lignes directrices éthiques directement dans le processus d'apprentissage.
La deuxième phase implique... eh bien, le tweet s'arrête là, mais la fondation qu'ils décrivent su
Voir l'originalLe pipeline se décompose en deux phases clés :
Tout d'abord, il y a la distillation. Ils exécutent le DPO à partir d'un modèle enseignant qui a été entraîné pour incarner des principes constitutionnels spécifiques. Pensez à cela comme à l'incorporation de lignes directrices éthiques directement dans le processus d'apprentissage.
La deuxième phase implique... eh bien, le tweet s'arrête là, mais la fondation qu'ils décrivent su

