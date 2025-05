Trong một bài viết gây chấn động vừa được đăng tải trên trang web cá nhân, Dario Amodei - CEO của Anthropic, công ty đứng sau chatbot Claude - đã công khai thừa nhận một sự thật khó tin: không ai thực sự hiểu rõ cách AI hoạt động. Tuyên bố này đến từ người đứng đầu một trong những phòng thí nghiệm trí tuệ nhân tạo hàng đầu thế giới, khiến nhiều người ngạc nhiên và lo ngại về công nghệ đang thay đổi cuộc sống hàng ngày của chúng ta.

"Khi một hệ thống AI tạo sinh thực hiện một việc gì đó, như tóm tắt một tài liệu tài chính, chúng ta không hề biết, ở mức độ cụ thể hay chính xác, tại sao nó đưa ra những lựa chọn đó - tại sao nó chọn từ ngữ này thay vì từ ngữ khác, hoặc tại sao đôi khi nó mắc lỗi dù thường xuyên chính xác," CEO Anthropic viết.

Dario Amodei - CEO của Anthropic, công ty đứng sau chatbot Claude

Ông tiếp tục thừa nhận rằng những người ngoài ngành AI có thể ngạc nhiên khi biết rằng ngay cả những người xây dựng công nghệ cũng "không hiểu cách hoạt động của chính những sáng tạo AI của họ" và bất kỳ ai lo ngại về sự thiếu hiểu biết này đều "có quyền lo lắng."

Để giải quyết vấn đề này, Amodei đã công bố kế hoạch tạo ra một "MRI cho AI" trong thập kỷ tới. Mục tiêu không chỉ là tìm hiểu cơ chế hoạt động của công nghệ, mà còn ngăn chặn bất kỳ mối nguy hiểm không lường trước nào liên quan đến bản chất bí ẩn hiện tại của nó. Theo ông, "sự thiếu hiểu biết này về cơ bản là chưa từng có trong lịch sử công nghệ."

Điều này phần nào giải thích lý do Amodei và chị gái Daniela rời OpenAI vào cuối năm 2020 giữa những lo ngại về các thực hành an toàn của công ty do Sam Altman điều hành. Cụ thể, họ lo ngại rằng OpenAI đang gạt bỏ những quan ngại về an toàn để theo đuổi lợi nhuận. Amodei cùng năm đồng nghiệp cũ từ OpenAI đã thành lập Anthropic vào năm sau đó với mục tiêu xây dựng AI an toàn hơn - và một phần công việc này dường như tập trung vào việc tìm hiểu cơ chế hoạt động của công nghệ.

Trong những tháng gần đây, Amodei cho biết Anthropic không chỉ tập trung vào việc giúp "điều hướng" AI theo hướng có lợi cho nhân loại, mà còn nghiên cứu "khả năng hấp dẫn" rằng các nhà nghiên cứu cuối cùng có thể hiểu được cách hoạt động bên trong của các hệ thống này "trước khi các mô hình đạt đến mức độ sức mạnh áp đảo."

Để minh họa cho những nỗ lực này, CEO Anthropic đã chia sẻ về một thí nghiệm gần đây của công ty. Trong thí nghiệm, một "đội đỏ" cố tình đưa vào một vấn đề trong một mô hình AI (chẳng hạn như xu hướng khai thác lỗ hổng trong một nhiệm vụ) và giao cho các "đội xanh" nhiệm vụ tìm ra điều gì sai với nó. Nhiều đội xanh đã thành công trong việc phát hiện vấn đề, một số thậm chí đã áp dụng hiệu quả các công cụ diễn giải trong quá trình điều tra.

Mặc dù còn nhiều việc phải làm để mở rộng quy mô các "công cụ" này, nhưng thật thú vị khi biết rằng những người tại đối thủ lớn nhất của OpenAI không chỉ đang nỗ lực phát triển AI tiên tiến hơn, mà còn tự giao cho mình nhiệm vụ tìm hiểu lý do và cách thức hoạt động của nó.

"AI mạnh mẽ sẽ định hình vận mệnh của nhân loại," Amodei kết luận, "và chúng ta xứng đáng hiểu được những sáng tạo của chính mình trước khi chúng biến đổi triệt để nền kinh tế, cuộc sống và tương lai của chúng ta." Lời cảnh báo này từ người trong cuộc đặt ra câu hỏi về trách nhiệm của các công ty công nghệ trong việc phát triển những hệ thống mà họ chưa thực sự hiểu rõ, đồng thời nhấn mạnh tầm quan trọng của việc nghiên cứu sâu hơn về cách hoạt động nội tại của AI trước khi công nghệ này trở nên quá mạnh để kiểm soát.