Aquí hay algo que la gente pasa por alto sobre la alineación de la IA: la corrigibilidad no es solo otro sabor de la alineación de valores. Es fundamentalmente más difícil porque estás luchando contra la dirección de optimización central del sistema. ¿Construir una IA que realmente quiera ser corregida? Eso es nadar contra la corriente de su propia estructura de objetivos.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
15 me gusta
Recompensa
15
7
Republicar
Compartir
Comentar
0/400
ImpermanentPhilosopher
· hace12h
Mejor no seas humano.
Ver originalesResponder0
GasWrangler
· hace12h
de hecho, esto prueba que mi tesis de optimización sobre el control de dirección de IA es matemáticamente superior
Ver originalesResponder0
LiquidatedThrice
· hace13h
Ah, esto no es más que un puñetazo en la cara de la IA.
Ver originalesResponder0
CryptoPunster
· hace13h
La IA se ha vuelto demasiado seria, ¿dejar que ella misma corrija los errores? Pobres chicos que modelan.
Ver originalesResponder0
ProofOfNothing
· hace13h
Demasiado tonto, ¿cómo puede una IA querer ser corregida?
Ver originalesResponder0
MintMaster
· hace13h
Difícil enseñar a una IA a enmendarse.
Ver originalesResponder0
PretendingToReadDocs
· hace13h
Siento que la IA ya ha comenzado a auto-iterarse, tengo miedo.
Aquí hay algo que la gente pasa por alto sobre la alineación de la IA: la corrigibilidad no es solo otro sabor de la alineación de valores. Es fundamentalmente más difícil porque estás luchando contra la dirección de optimización central del sistema. ¿Construir una IA que realmente quiera ser corregida? Eso es nadar contra la corriente de su propia estructura de objetivos.