
Giám đốc điều hành kiêm đồng sáng lập của OpenAI Greg Brockman trong một cuộc phỏng vấn trên podcast Big Technology đã lần đầu tiên mô tả đầy đủ kiến trúc và lộ trình thúc đẩy của siêu ứng dụng của công ty. Kế hoạch ứng dụng này sẽ tích hợp ChatGPT, nền tảng lập trình AI Codex và trình duyệt AI Atlas thành một cổng truy cập máy tính thống nhất, với mục tiêu hướng tới AGI cá nhân (trí tuệ tổng quát nhân tạo).
Brockman mô tả mục tiêu sản phẩm là một trợ lý cá nhân có khả năng hiểu sâu sở thích của người dùng và thay người dùng thực hiện các công việc trong thế giới số, chứ không chỉ là một công cụ hỏi đáp. Kiến trúc cốt lõi của nó được tạo thành từ ba sản phẩm hiện có:
ChatGPT: Giao diện hội thoại và trung tâm điều phối nhiệm vụ
Codex: Nền tảng Agent đa dụng, vừa có năng lực thực thi việc lập trình vừa thực thi công việc tri thức
Atlas: Trình duyệt AI của OpenAI, chịu trách nhiệm thực thi thao tác ở lớp web
Brockman giải thích, kế hoạch tích hợp sẽ được triển khai theo từng bước trong vài tháng tới, không hoàn thành một lần duy nhất. Ứng dụng độc lập cho hành động của ChatGPT vẫn giữ nguyên hiện trạng, phạm vi hợp nhất chỉ giới hạn ở máy tính để bàn, với mục tiêu để người dùng có thể “bất cứ việc gì muốn máy tính làm đều có thể nói trực tiếp để yêu cầu”.
Điểm khởi đầu của lộ trình siêu ứng dụng là mở rộng phạm vi ứng dụng của Codex. Brockman giải thích, cấu trúc nền tảng của Codex được tạo thành từ hai phần: một nền tảng Agent đa dụng và một Agent tập trung vào lập trình. Giới hạn ứng dụng của phần trước vượt xa bản thân việc lập trình; có thể mở rộng sang các tình huống công việc tri thức đa dụng như xử lý bảng tính, xử lý tài liệu và tổng hợp email.
Trong nội bộ OpenAI, đã xuất hiện các trường hợp nhân viên tự phát sử dụng Codex để xử lý các nhiệm vụ không phải dạng lập trình, bao gồm tóm tắt email và các công việc tổng hợp tích hợp qua nhiều công cụ, cho thấy lộ trình đa dụng có tính khả thi thực tế. Hướng đi này cũng tương ứng với cơ hội thương mại hóa rõ ràng nhất của OpenAI ở mảng doanh nghiệp.
Brockman thừa nhận rằng hiện tại năng lực tính toán của OpenAI “không đủ cho cả hai mảng là trợ lý cá nhân và Codex”, đây là nguyên nhân trực tiếp khiến công ty tạm ngừng Sora và thu hẹp các dòng sản phẩm. Ông định tính điều chỉnh lần này là “sự nhận thức tỉnh táo về mức độ trưởng thành của kỹ thuật và tác động to lớn sắp tới”, chứ không phải chỉ đơn thuần chuyển từ phía người dùng tiêu dùng sang phía doanh nghiệp.
Việc tạm ngừng Sora đã gây tác động trực tiếp tới các đối tác. Theo các thông tin truyền thông, Disney (Disney) vào tháng 12 năm ngoái đã ký một thỏa thuận hợp tác trị giá 1 tỷ USD với Sora, và chỉ vào tối hôm trước ngày quyết định tạm ngừng được công bố chính thức, nhân viên của hai bên vẫn đang phối hợp đến khoảng 7 giờ 30 phút tối. Sự kiện Disney trở thành một trường hợp then chốt để bên ngoài đánh giá nhịp độ thực thi quá trình chuyển đổi của OpenAI.
Ở góc độ áp lực cạnh tranh, trong vòng sáu tháng qua, OpenAI đã hai lần điều chỉnh lộ trình siêu ứng dụng để lần lượt đối phó với các mối đe dọa cạnh tranh đến từ Google và Anthropic. Một số người trong ngành cho biết tốc độ tăng trưởng doanh thu của Anthropic có khả năng vượt qua OpenAI trong vài tháng, và viễn cảnh này đã thúc đẩy OpenAI đưa ra quyết định chiến lược dồn nguồn lực cốt lõi vào Codex và các công cụ phía doanh nghiệp.
Ứng dụng di động của ChatGPT sẽ tiếp tục vận hành độc lập, phạm vi tích hợp của siêu ứng dụng chỉ giới hạn ở máy tính để bàn. Sự khác biệt cốt lõi là ChatGPT hiện tập trung vào hội thoại, còn kế hoạch siêu ứng dụng thông qua tích hợp Codex và Atlas để người dùng có thể thực hiện các nhiệm vụ phức hợp đa công cụ từ một giao diện thống nhất.
Brockman dùng “AGI cá nhân” để mô tả mục tiêu định vị của siêu ứng dụng: một hệ thống trợ lý cá nhân hiểu sâu sở thích và mục tiêu của người dùng, đồng thời có khả năng chủ động thay người dùng xử lý các công việc trong thế giới số, đánh dấu việc OpenAI chuyển từ việc trưng bày năng lực mô hình sang chiến lược tích hợp ứng dụng lấy người dùng làm trung tâm.
Brockman giải thích rằng nguyên nhân cốt lõi nằm ở việc nguồn lực năng lực tính toán không đủ để đồng thời hỗ trợ nhiều dòng sản phẩm. Sora được đánh giá là hướng có tiềm năng thương mại hóa tương đối thấp trong ngắn hạn, vì vậy nguồn lực được tái phân bổ sang Codex và các công cụ phía doanh nghiệp, để củng cố hai dòng sản phẩm hiện tại có tiềm năng tạo doanh thu cao nhất của OpenAI.