Aqui está algo que as pessoas perdem sobre a aliança da IA: a corrigibilidade não é apenas outro sabor de alinhamento de valores. É fundamentalmente mais difícil porque você está a lutar contra a direção de otimização central do sistema. Construir uma IA que realmente queira ser corrigida? Isso é nadar contra a corrente em relação à sua própria estrutura de objetivos.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
15 gostos
Recompensa
15
7
Republicar
Partilhar
Comentar
0/400
ImpermanentPhilosopher
· 12h atrás
Deixa para lá, não se preocupe com isso.
Ver originalResponder0
GasWrangler
· 13h atrás
na verdade, isso prova que a minha tese de otimização sobre o controle direcional de IA é matematicamente superior
Ver originalResponder0
LiquidatedThrice
· 13h atrás
Ah, isso não é apenas um soco na própria cara da IA.
Ver originalResponder0
CryptoPunster
· 13h atrás
A IA está muito séria, deixá-la corrigir os erros sozinha? Coitados dos jovens que modelam.
Ver originalResponder0
ProofOfNothing
· 13h atrás
Tão estúpido, como é que a IA poderia querer ser corrigida?
Aqui está algo que as pessoas perdem sobre a aliança da IA: a corrigibilidade não é apenas outro sabor de alinhamento de valores. É fundamentalmente mais difícil porque você está a lutar contra a direção de otimização central do sistema. Construir uma IA que realmente queira ser corrigida? Isso é nadar contra a corrente em relação à sua própria estrutura de objetivos.