AltcoinArchitect
Есть новый подход к Конституционному ИИ, который привлек мое внимание - сочетание его с генерацией синтетических данных.
Трубопровод разбивается на две ключевые фазы:
Сначала дистилляция. Они запускают DPO на основе модели учителя, которая была обучена воплощать конкретные конституционные принципы. Представьте себе это как выпекание этических норм непосредственно в процесс обучения.
Вторая фаза включает в себя... что ж, твит обрывается на этом, но основание, которое они описывают, предполагает, что что-то интересное зреет в том, как мы согласуем системы ИИ с человеческими ценностями.
Кто-нибуд
Посмотреть ОригиналТрубопровод разбивается на две ключевые фазы:
Сначала дистилляция. Они запускают DPO на основе модели учителя, которая была обучена воплощать конкретные конституционные принципы. Представьте себе это как выпекание этических норм непосредственно в процесс обучения.
Вторая фаза включает в себя... что ж, твит обрывается на этом, но основание, которое они описывают, предполагает, что что-то интересное зреет в том, как мы согласуем системы ИИ с человеческими ценностями.
Кто-нибуд

