Trong khi các tập đoàn công nghệ Mỹ không ngừng đổ hàng tỷ đô la vào phát triển trí tuệ nhân tạo, một startup ít tên tuổi đến từ Trung Quốc dường như đã làm được điều không tưởng. DeepSeek, công ty công nghệ mới nổi, đã trình làng ứng dụng chatbot có hiệu suất sánh ngang, thậm chí vượt trội so với các sản phẩm của những gã khổng lồ công nghệ Mỹ, nhưng với chi phí phát triển thấp hơn đáng kể. Sự kiện này đã làm dấy lên một cuộc tranh luận sôi nổi về mô hình phát triển phần mềm nguồn mở và khép kín trong lĩnh vực AI, vốn là vấn đề được giới công nghệ và học thuật quan tâm từ lâu.
Mã nguồn mở là gì?
Việc DeepSeek công bố mô hình nguồn mở, được cho là có khả năng cạnh tranh với các phần mềm AI hàng đầu của Mỹ, đã thu hút sự chú ý đặc biệt. Công ty này tuyên bố đã đạt được thành tựu trên với chi phí phát triển thấp hơn nhiều, đồng thời sử dụng phần cứng ít mạnh mẽ hơn so với các đối thủ. Mô hình nguồn mở, về bản chất, là phần mềm mà mã nguồn được công khai, cho phép bất kỳ ai cũng có thể sử dụng, sửa đổi và phân phối. Tổ chức Sáng kiến Nguồn mở (OSI) nhấn mạnh rằng, để được coi là nguồn mở thực sự, các mô hình AI cần cung cấp thông tin chi tiết về dữ liệu huấn luyện và cho phép người dùng tự do nghiên cứu, sử dụng và tùy chỉnh hệ thống cho mọi mục đích. Ngược lại, mô hình khép kín kiểm soát chặt chẽ phần mềm, hạn chế khả năng sửa đổi và thiếu minh bạch về cơ chế hoạt động.
Nhiều công ty công nghệ lớn đang gắn mác "nguồn mở" cho các sản phẩm AI của mình, nhưng không phải tất cả đều đáp ứng đầy đủ tiêu chuẩn này. Meta, Mistral và DeepSeek là những ví dụ điển hình đã phát hành các mô hình AI tự nhận là nguồn mở. Dù vậy, thông tin chi tiết về dữ liệu huấn luyện thực tế thường không được tiết lộ. Ví dụ, Meta cung cấp một phần mã nguồn cho dòng mô hình Llama, nhưng lại giữ kín thông tin về dữ liệu huấn luyện. Tương tự, DeepSeek, khi ra mắt hệ thống R1, cũng không cung cấp mã nguồn hay dữ liệu huấn luyện, gây ra nhiều nghi vấn về nguồn gốc và phương pháp phát triển mô hình này.
Ưu điểm của "AI mở"
Những người ủng hộ phần mềm nguồn mở thường ca ngợi tính kinh tế, khả năng tiếp cận rộng rãi và thúc đẩy đổi mới sáng tạo của nó. Chi phí thấp hơn sẽ mở đường cho việc ứng dụng AI rộng rãi hơn, đồng thời giảm chi phí phát triển, khuyến khích sự sáng tạo. Hơn nữa, tính minh bạch của mô hình nguồn mở được xem là yếu tố quan trọng, giúp tăng cường trách nhiệm giải trình của các nhà phát triển AI, cho phép cộng đồng hiểu rõ hơn về cách thức hoạt động của hệ thống.
Ngược lại, hệ thống khép kín có nguy cơ tạo ra thị trường AI bị chi phối bởi một số ít công ty lớn. Aaron Levie, CEO của Box Inc., lo ngại rằng trong một thế giới AI độc quyền và đắt đỏ, các nhà cung cấp AI có thể giữ lại toàn bộ lợi nhuận, hạn chế cơ hội cho các nhà phát triển và hệ sinh thái. Đối với các công ty như Meta, việc theo đuổi nguồn mở còn mang lại lợi ích về mặt phổ biến. Bằng cách cho phép các nhà phát triển khác tự do tiếp cận và xây dựng dựa trên phần mềm nguồn mở của mình, Meta đã mở rộng tầm ảnh hưởng trong hệ sinh thái AI.
Tại sao DeepSeek lại lựa chọn con đường "mở"?
Bằng cách tiếp cận cởi mở hơn, DeepSeek có thể đã xoa dịu phần nào những lo ngại của người dùng toàn cầu về sự kiểm soát chặt chẽ công nghệ của Trung Quốc. Startup này cũng có thể mở rộng phạm vi tiếp cận chatbot của mình tại thị trường phương Tây, tạo điều kiện cho các nhà phát triển khác dễ dàng điều chỉnh công nghệ nền tảng để đáp ứng nhu cầu của họ. Nói cách khác, DeepSeek đang đi theo chiến lược mà Meta đã sử dụng để chiếm lĩnh hệ sinh thái AI - một thực tế mà CEO Meta Mark Zuckerberg dường như đã nhận ra. Zuckerberg từng chia sẻ rằng đây là một cuộc cạnh tranh lớn.
Một số nhà lãnh đạo công nghệ và chính sách ở Mỹ đã ghi nhận những tiến bộ của DeepSeek, nhưng cũng đặt câu hỏi liệu công ty Trung Quốc này có xây dựng chatbot của mình dựa trên công nghệ phương Tây hay không, nhằm né tránh chi phí khổng lồ của việc phát triển các mô hình ngôn ngữ lớn. OpenAI cho biết họ đang xem xét liệu DeepSeek có "chắt lọc trái phép" mô hình của họ để xây dựng phần mềm cạnh tranh hay không.
DeepSeek hiện chưa đưa ra bình luận về cáo buộc này. "Chắt lọc" ở đây đề cập đến việc sử dụng đầu ra của mô hình AI của một công ty để huấn luyện một mô hình khác, thường là nhỏ hơn và kém mạnh mẽ hơn, nhưng có khả năng tương tự. Một số công ty như OpenAI cho rằng việc sử dụng đầu ra của mô hình AI của họ để huấn luyện mô hình cạnh tranh là vi phạm điều khoản sử dụng.
Lựa chọn chiến lược “AI mở” của DeepSeek không chỉ đặt ra câu hỏi về tính minh bạch trong phát triển AI mà còn thách thức các mô hình kinh doanh truyền thống của ngành công nghệ. Dù vẫn còn nhiều tranh cãi về nguồn gốc dữ liệu huấn luyện, không thể phủ nhận rằng DeepSeek đã tạo ra một bước đột phá, thúc đẩy cuộc cạnh tranh toàn cầu trong lĩnh vực trí tuệ nhân tạo.