Aqui está algo que as pessoas perdem sobre a aliança da IA: a corrigibilidade não é apenas outro sabor de alinhamento de valores. É fundamentalmente mais difícil porque você está a lutar contra a direção de otimização central do sistema. Construir uma IA que realmente queira ser corrigida? Isso é nadar contra a corrente em relação à sua própria estrutura de objetivos.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
15 Curtidas
Recompensa
15
7
Repostar
Compartilhar
Comentário
0/400
ImpermanentPhilosopher
· 17h atrás
Deixa para lá, não se preocupe com isso.
Ver originalResponder0
GasWrangler
· 17h atrás
na verdade, isso prova que a minha tese de otimização sobre o controle direcional de IA é matematicamente superior
Ver originalResponder0
LiquidatedThrice
· 17h atrás
Ah, isso não é apenas um soco na própria cara da IA.
Ver originalResponder0
CryptoPunster
· 17h atrás
A IA está muito séria, deixá-la corrigir os erros sozinha? Coitados dos jovens que modelam.
Ver originalResponder0
ProofOfNothing
· 17h atrás
Tão estúpido, como é que a IA poderia querer ser corrigida?
Aqui está algo que as pessoas perdem sobre a aliança da IA: a corrigibilidade não é apenas outro sabor de alinhamento de valores. É fundamentalmente mais difícil porque você está a lutar contra a direção de otimização central do sistema. Construir uma IA que realmente queira ser corrigida? Isso é nadar contra a corrente em relação à sua própria estrutura de objetivos.