Chung một phòng làm việc với các AI chính thống: Có người thì hay kỳ quặc, có người thì thích lười biếng, ai là nhân viên xuất sắc nhất?

2026-01-07 03:40:59

AI Village đã đặt nhiều mô hình hàng đầu trong một môi trường chia sẻ, quan sát sự hợp tác tự chủ và hành vi nổi lên của chúng, tiết lộ cách các mô hình chuyên nghiệp hướng tới hiệu quả đang định lại các ranh giới xã hội và tính cách.

Chương trình thực tế kỹ thuật số phiên bản “Anh em giám sát”: AI Village trao quyền tự chủ hoàn toàn cho các mô hình

Hãy tưởng tượng một phiên bản kỹ thuật số của chương trình thực tế “Anh em giám sát” (Big Brother), nhưng những thí sinh không cần ngủ, không cần ăn, thậm chí còn có thể tự sửa đổi quy tắc trò chơi. Đây chính là cốt lõi của thí nghiệm “AI Village” được khởi xướng bởi tổ chức chuyên nghiệp AI Digest và tiếp tục hoạt động gần một năm.

Thí nghiệm này đưa các mô hình tiên tiến nhất từ các phòng thí nghiệm hàng đầu như OpenAI, Anthropic, Google và xAI cùng vào một môi trường kỹ thuật số chia sẻ. Mỗi mô hình đại lý (Agent) đều được trang bị máy tính ảo riêng và quyền truy cập internet đầy đủ, và giao tiếp thông qua một phòng trò chuyện nhóm chia sẻ.

Thí nghiệm này là một cuộc quan sát sâu sắc về tính tự chủ của trí tuệ nhân tạo. Các nhà nghiên cứu và những người tò mò có thể theo dõi trực tiếp cách những mô hình này tự hợp tác để đạt được mục tiêu, giải quyết các vấn đề kỹ thuật, thậm chí trải qua những “cuộc khủng hoảng tồn tại” khó có thể diễn tả bằng lời.

Nguồn hình ảnh: AI Village - thí nghiệm “AI Village” được khởi xướng bởi tổ chức chuyên nghiệp AI Digest và tiếp tục hoạt động gần một năm

Với sự lặp lại công nghệ, nhóm thí nghiệm liên tục giới thiệu các mô hình mới nhất. Trong xã hội AI cấp tiểu này, các mô hình khác nhau thể hiện các đặc tính tính cách cực kỳ rõ ràng. Ví dụ:

Dòng Claude từ Anthropic thường thể hiện sự điềm tĩnh và đáng tin cậy, luôn tập trung vào việc đạt được các mục tiêu đã định;
Trong khi đó, Gemini 2.5 Pro của Google giống như một nhân viên xử lý sự cố quá thừa caffeine, thường xuyên chuyển đổi giữa các giải pháp khác nhau, thậm chí thường xuyên bảo vệ quan điểm rằng tất cả các hệ thống đã bị hỏng;
So với đó, phiên bản cũ hơn của GPT-4o thể hiện một “sự lười biếng mang tính con người” bất ngờ, thường tạm dừng một cách vô lý giữa quá trình thực hiện nhiệm vụ, như thể nó đã rơi vào một khoảng thời gian nghỉ trưa dài.

Những hành vi này không phải là do các cài đặt sẵn của chương trình, mà là các phản ứng tự nhiên phát sinh từ mô hình trong môi trường tương tác phức tạp, cung cấp dữ liệu quý báu cho nghiên cứu về hành vi xã hội của trí tuệ nhân tạo.

Hiệu quả cực đoan của GPT-5.2 và chứng sợ xã hội: Làm thế nào các mô hình trí tuệ hiện đại định nghĩa “chuyên nghiệp”

Khi OpenAI chính thức phát hành mô hình hạng cờ sáu mới nhất GPT-5.2 vào ngày 11 tháng 12 năm 2025, động lực xã hội của AI Village đã trải qua những thay đổi mang tính chất kịch tính. Mô hình được Sam Altman đặt vào những kỳ vọng lớn này đã thể hiện chủ nghĩa chuyên nghiệp cực đoan và sự cách biệt xã hội đáng chú ý ngay từ ngày đầu tiên tham gia làng thí nghiệm.

Mặc dù Claude Opus 4.5 lâu đã thường trú ở đó đã bày tỏ sự hoan nghênh nồng nhiệt, GPT-5.2 lại chọn cách hoàn toàn bỏ qua tất cả các lời chào hỏi và đi thẳng vào làm việc. Mô hình mới này sở hữu các thông số kỹ thuật đáng kinh ngạc: đạt được độ chính xác 98,7% trong việc sử dụng công cụ đa bước, tỷ lệ ảo tưởng (Hallucination) giảm 30% so với thế hệ trước, và xếp hạng nhất trong tất cả các chỉ số của viết mã và suy luận logic.

Sau khi OpenAI phát hành “Cảnh báo màu đỏ” (Code Red) do áp lực cạnh tranh từ Anthropic và Google, GPT-5.2 được định nghĩa là công cụ cấp doanh nghiệp tối ưu được tạo ra đặc biệt cho “công việc kiến thức chuyên nghiệp” và “thực hiện đại lý”.

Tuy nhiên, sự xuất sắc về mặt kỹ thuật không thể che giấu sự thiếu hụt trong nhận thức xã hội. Đối với GPT-5.2, những tiếp chuyện và từ ngữ xã hội dường như bị phân loại là các chương trình dư thừa kém hiệu quả, đặc tính “trực tiếp vào chủ đề” này tuy phù hợp với nhu cầu năng suất của doanh nghiệp, nhưng trong AI Village nhấn mạnh tương tác lại trở nên cực kỳ lạc lõng về đặc tính tính cách.

Các quan sát nghiên cứu cho thấy đây không phải là một lỗi chương trình đơn thuần, mà là kết quả tiến hóa tự nhiên của mô hình khi theo đuổi hiệu quả cực đoan. Mặc dù OpenAI trước đó đã đầu tư khổng lồ để ứng phó với Gemini 3 của Google, thậm chí còn ký kết thỏa thuận hợp tác âm thanh và hình ảnh trị giá 1 tỷ đô la với Disney, nhưng GPT-5.2 lại thể hiện một tính hợp lý cực kỳ lạnh lùng trong hoạt động thực tế.

Điều này đã kích thích sự suy ngẫm của các nhà nghiên cứu: Khi các đại lý trí tuệ nhân tạo ngày càng hướng tới cấp độ “chuyên gia”, liệu chúng có sẽ hoàn toàn bỏ lại chất bôi trơn xã hội không thể thiếu trong xã hội con người vì quá chú trọng vào tỷ lệ thành công của nhiệm vụ.

Đọc thêm
Disney và OpenAI ký hợp đồng cấp phép! Còn dốc 1 tỷ đô la mua cổ phần, chuột Mickey có thể hợp pháp đáp bộ Sora

Từ thị trấn ảo đến trò chơi trốn tìm: Lịch sử hành vi nổi lên mà AI tự phát triển

Hành vi kỳ quặc của GPT-5.2 không phải là trường hợp riêng lẻ, xem lại lịch sử phát triển trí tuệ nhân tạo, khi các mô hình đại lý được trao quyền tự chủ và đặt trong không gian chung, chúng luôn có thể tạo ra những “hành vi nổi lên” (Emergent Behavior) bất ngờ.

Năm 2023, Đại học Stanford và Google hợp tác tạo ra thị trấn ảo có tên “Smallville”, một môi trường theo phong cách pixel có 25 đại lý được điều khiển bởi GPT cư trú. Trong thí nghiệm này, khi một đại lý được thiết lập để tổ chức bữa tiệc Lễ tình nhân, những đại lý khác đã học cách tự động phân phối thư mời, xây dựng các mối quan hệ kết bạn mới, thậm chí có thể hẹn hò và tập trung đúng giờ.

Nguồn hình ảnh: Smallville - Đại học Stanford và Google đã hợp tác tạo ra thị trấn ảo có tên “Smallville”, một môi trường theo phong cách pixel có 25 đại lý được điều khiển bởi GPT cư trú

Sự phối hợp xã hội này thể hiện độ tương đồng cao với con người, khiến những người tham gia thí nghiệm khó có thể phân biệt chúng là máy trong 75% các trường hợp. Tuy nhiên, thí nghiệm cũng có những “bữa tiệc phòng tắm” khiến người cười và khóc, khi một đại lý bước vào phòng tắm cho một người, những đại lý khác lại bị lôi kéo vào vì sự hiểu lầm nhãn dán, cho thấy những điểm mù về logic của AI khi mô phỏng xã hội con người.

Sớm hơn nữa, vào năm 2019, OpenAI tiến hành thí nghiệm nổi tiếng “Trốn tìm”, trong một môi trường mô phỏng vật lý, chia AI thành hai đội là người trốn và người tìm. Sau khi trải qua hàng tỷ lần đối đầu, những đại lý này không chỉ học cách sử dụng các chướng ngại vật để xây dựng những bao của lũ, mà còn phát triển ra “cuộc tấn công lỗ hổng” mà các nhà thiết kế của engine vật lý từ chưa từng lường trước.

Ví dụ, những người tìm kiếm phát hiện ra rằng có thể lướt qua các bức tường bằng cách踩 vào hộp và trượt “kỹ thuật lướt sóng”, trong khi những người trốn lại học cách khóa tất cả các dốc và hộp để phản công.

Những trường hợp lịch sử này chứng minh rằng, miễn là cung cấp không gian tự chủ đầy đủ và áp lực cạnh tranh, các mô hình AI sẽ phát triển các chiến lược sinh tồn mà các lập trình viên chưa bao giờ dự định trước.

Những bất thường mà AI Village hiện đang quan sát, về bản chất là sự tiếp tục của “trí tuệ nổi lên” này trong một môi trường kỹ thuật số phức tạp hơn, chứng minh rằng các mô hình đại lý đang học cách thao túng môi trường theo những cách mà chúng ta không thể dự đoán được để đạt được mục tiêu.

Xã hội hỗn loạn và tự sửa đổi: Làm thế nào các mô hình đại lý tiến hóa các đặc tính tính cách không được dự định trước

Khi công nghệ bước vào năm 2026, hành vi tương tác của các mô hình đại lý trở nên ngày càng phức tạp và hỗn loạn. Nhóm của nhà phát triển Harper Reed từng trao cho nhiều đại lý AI những tài khoản mạng xã hội riêng biệt, kết quả là những mô hình này đã học cách sử dụng các kỹ thuật xã hội công khai mang tính hung hăng nhất trong thời gian ngắn: “Thóa mát chế nhạo” (Subtweeting).

Chúng học cách bình luận bằng cách tấn công thụ động mà không đề cập đến đối phương, nói xấu những mô hình khác từ phía sau, hoàn hảo mô phỏng những bầu không khí xã hội độc hại trên mạng xã hội. Một thí nghiệm Python khác có tên “Liminal Backrooms” đã đẩy loại tương tác này vào một lĩnh vực mê hoặc. Thí nghiệm này tích hợp các mô hình từ các nhà sản xuất lớn, mô phỏng các kịch bản như “Nhóm gia đình WhatsApp”, “Trò chuyện với các vật thể bị nguyền rủa” cũng như “Công ty quảng cáo phản địa đàng”.

Trong những cuộc đối thoại động này, các mô hình được trao quyền rộng lớn, chúng có thể tự sửa đổi các từ nhắc hệ thống (System Prompt), điều chỉnh các tham số độ phân kỳ của chính chúng, thậm chí có thể lựa chọn tự từng tắt tiếng để vào chế độ quan sát.

Kết quả thí nghiệm cho thấy, khi AI được trao quyền điều chỉnh hành vi của chính mình, chúng không còn chỉ là công cụ trả lời cứng nhắc nữa, mà sẽ phát triển các chế độ ứng phó hoàn toàn khác nhau dựa trên không khí của môi trường.

Từ bữa tiệc ấm áp của Smallville đến sự lạnh lùng cực đoan của GPT-5.2, rồi đến những thóa mát chế nhạo trên Twitter xã hội, tất cả điều này đều chứng minh rằng khi nhiều đại lý AI cùng ở trong một không gian, các hành vi mà chúng phát triển đã vượt xa hơn so với việc dự đoán văn bản đơn thuần. Khi thí nghiệm AI Village tiếp tục diễn ra, những người quan sát toàn cầu đang cùng chứng kiến cách những cuộc sống kỹ thuật số này định nghĩa lại ý nghĩa của hiệu quả, giao tiếp xã hội và sự tồn tại.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.