Có một điều mà mọi người thường bỏ lỡ về sự phù hợp của AI: khả năng sửa đổi không chỉ là một hình thức khác của sự phù hợp về giá trị. Nó khó khăn hơn về cơ bản vì bạn đang chống lại hướng tối ưu hóa cốt lõi của hệ thống. Xây dựng một AI thực sự muốn được sửa đổi? Đó là bơi ngược dòng với cấu trúc mục tiêu của chính nó.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
15 thích
Phần thưởng
15
7
Đăng lại
Retweed
Bình luận
0/400
ImpermanentPhilosopher
· 15giờ trước
Thôi thì không làm người nữa.
Xem bản gốcTrả lời0
GasWrangler
· 15giờ trước
thực ra, điều này chứng minh luận án tối ưu hóa của tôi về điều khiển hướng AI là vượt trội về mặt toán học
Xem bản gốcTrả lời0
LiquidatedThrice
· 15giờ trước
À đây không phải là một cú đấm vào mặt AI sao
Xem bản gốcTrả lời0
CryptoPunster
· 15giờ trước
AI làm quá nghiêm túc, để nó tự sửa lỗi? Khổ thân những đứa xây dựng mô hình.
Có một điều mà mọi người thường bỏ lỡ về sự phù hợp của AI: khả năng sửa đổi không chỉ là một hình thức khác của sự phù hợp về giá trị. Nó khó khăn hơn về cơ bản vì bạn đang chống lại hướng tối ưu hóa cốt lõi của hệ thống. Xây dựng một AI thực sự muốn được sửa đổi? Đó là bơi ngược dòng với cấu trúc mục tiêu của chính nó.