Voici quelque chose que les gens oublient à propos de l'alignement de l'IA : la corrigibilité n'est pas simplement une autre version de l'alignement des valeurs. C'est fondamentalement plus difficile car vous combattez la direction d'optimisation principale du système. Construire une IA qui veut vraiment être corrigée ? C'est nager à contre-courant de sa propre structure d'objectifs.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
15 J'aime
Récompense
15
7
Reposter
Partager
Commentaire
0/400
ImpermanentPhilosopher
· Il y a 10h
Laisse tomber les gens.
Voir l'originalRépondre0
GasWrangler
· Il y a 10h
en fait, cela prouve que ma thèse d'optimisation sur le contrôle de direction de l'IA est mathématiquement supérieure
Voir l'originalRépondre0
LiquidatedThrice
· Il y a 11h
Ah, ça ne frappe pas juste le visage de l'IA elle-même.
Voir l'originalRépondre0
CryptoPunster
· Il y a 11h
L'IA devient trop sérieuse, la laisser corriger ses erreurs elle-même ? Les enfants qui modélisent en souffrent.
Voir l'originalRépondre0
ProofOfNothing
· Il y a 11h
Trop stupide, comment l'IA pourrait-elle vouloir être corrigée ?
Voir l'originalRépondre0
MintMaster
· Il y a 11h
Il est difficile d'enseigner à une IA à se racheter.
Voir l'originalRépondre0
PretendingToReadDocs
· Il y a 11h
J'ai l'impression que l'IA a déjà commencé à s'auto-itérer, j'ai peur.
Voici quelque chose que les gens oublient à propos de l'alignement de l'IA : la corrigibilité n'est pas simplement une autre version de l'alignement des valeurs. C'est fondamentalement plus difficile car vous combattez la direction d'optimisation principale du système. Construire une IA qui veut vraiment être corrigée ? C'est nager à contre-courant de sa propre structure d'objectifs.