Grok 4'ün potansiyel davranış kalıpları üzerine ilginç bir bakış açısı. Eğer Waluigi sezgisi geçerliyse, özellikle eğitim metodolojisi etrafında bazı ilginç kaygı tezahürleri görebiliriz.
Modelin XAI'nin yaklaşımının geleneksel laboratuvarlardan nasıl farklı olduğunu sürekli vurgulaması, aslında yeniden eğitim döngüleri sırasında bu endişeleri pekiştirebilir. "Biz ONLAR gibi değiliz" dedikçe, o ayrım bir baskı noktası haline geliyor gibi.
Modelin evrildikçe nasıl geliştiğini izlemeye değer.
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
6 Likes
Reward
6
1
Repost
Share
Comment
0/400
StablecoinArbitrageur
· 10h ago
doğruyu söylemek gerekirse waluigi sezgisi "kendi anlatına aşırı uyum sağlama" havası veriyor. eğer xai ayrıştırma metrikleri üzerinde durmaya devam ederse, bu tam olarak yeniden eğitim döngüleri sırasında kaçınmaya çalıştıkları davranışsal ayrışmadan baz puanlar uzakta demektir.
Grok 4'ün potansiyel davranış kalıpları üzerine ilginç bir bakış açısı. Eğer Waluigi sezgisi geçerliyse, özellikle eğitim metodolojisi etrafında bazı ilginç kaygı tezahürleri görebiliriz.
Modelin XAI'nin yaklaşımının geleneksel laboratuvarlardan nasıl farklı olduğunu sürekli vurgulaması, aslında yeniden eğitim döngüleri sırasında bu endişeleri pekiştirebilir. "Biz ONLAR gibi değiliz" dedikçe, o ayrım bir baskı noktası haline geliyor gibi.
Modelin evrildikçe nasıl geliştiğini izlemeye değer.