Đây hoàn toàn là một chú rùa hoàn chỉnh - nhưng trí thông minh nhân tạo của Google lại không nghĩ như vậy.
Nếu một vật có đủ các yếu tố từ kích cỡ, hình dạng và đặc điểm đều giống loài rùa thì không có lý do nào có thể bảo đó là một khẩu súng cả. Ấy vậy điều đó lại trở thành sự thật với trường hợp của trí tuệ nhân tạo Google, khiến nhiều người phải băn khoăn không biết lý do vì sao.
Nhưng đây lại chính là kết quả của một thí nghiệm về khả năng nhận diện vật thể của trí thông minh nhân tạo do Google phát triển, được thực hiện bởi các nhà khoa học Labsix ở Đại học MIT và được đăng trên ấn phẩm khoa học của trường.
Nhóm các nhà khoa học đã đưa ra một khái niệm có tên gọi là "hình ảnh đối nghịch". Đây là một dạng mô phỏng hình ảnh theo chiều từ dưới lên trên với mục đích "đánh lừa" trí thông minh nhân tạo, khiến chúng tưởng rằng vật thể được mô phỏng khác hoàn toàn với vật mẫu. Chẳng hạn, người ta mô phỏng một tấm ảnh chụp một chú mèo nâu và kết quả thật bất ngờ: 99% trí thông minh nhân tạo sẽ cho ra kết quả đó là một bát sa lát bơ kiểu Mexico.
Để hình ảnh mô phỏng đạt hiệu quả cao nhất, người ta sử dụng thêm hiệu ứng âm thanh hỗ trợ khiến cho những cảm biến môi trường xung quanh của trí thông minh nhân tạo bị rối loạn, trong khi con người bình thường không bị phân tâm bởi điều này.
Tuy rằng có rất nhiều công trình nghiên cứu chứng minh sự rối loạn này có thể diễn ra trên lý thuyết, ví dụ thực tế lại không thực sự thuyết phục. Hiệu ứng âm thanh kiểu trên hoàn toàn có thể bị qua mặt nếu như ta chỉ cần xoay ngược tấm ảnh, thay đổi mức cân bằng màu sắc của hình hay cắt ghép ảnh một chút.
Chính vì lý do đó, nhóm các nhà nghiên cứu tại Đại học MIT đã cải tiến phương pháp trên bằng cách, thay vì sử dụng hình ảnh 2 chiều đơn giản, họ sử dụng mô hình bề mặt 3 chiều của chú rùa. Kết quả là họa tiết trên lớp mai rùa trở nên kỳ ảo hơn nhưng vẫn đủ để hình dung đó là của một con rùa thật – còn đối với trí thông minh nhân tạo của Google, 90% số đáp án đưa ra lại cho kết quả đó là một khẩu súng trường.
Đây là rùa hay súng?
Nhóm các nhà nghiên cứu cũng thử một ví dụ khác với trái bóng chày 3D và thiết kế sao cho nó trông giống 1 cốc cà phê espresso nhất, tuy vậy hiệu quả lại không như mong đợi. Thi thoảng, trí thông minh nhân tạo vẫn cho ra kết quả đó là một quả bóng chày, mặc dù trên thực tế phần lớn những kết quả nhận được lại chính là hình ảnh của cốc espresso.
Họ chia sẻ: "Công trình nghiên cứu của chúng tôi cho thấy tại sao những hình ảnh đối nghịch đang ngày càng trở thành một vấn đề nghiêm trọng đối với thế giới thực tại". Khi mà việc áp dụng trí thông minh nhân tạo trong máy móc ngày càng trở nên phổ biến, việc để xảy ra những sai sót như thế này là điều vô cùng đáng báo động.
Hiện nay các nhà khoa học đang xem xét tính khả thi của hệ thống giám sát và theo dõi phát hiện vũ khí nguy hiểm ngay từ những hình ảnh máy quay camera CCTV. Việc hệ thống nhầm lẫn một chú rùa với 1 khẩu súng có thể tạo nên báo động giả vô hại, nhưng đổi lại nếu một khẩu súng bị hiểu nhầm là một con rùa thì hậu quả sẽ vô cùng lớn.
Thực tế vẫn có nhiều vấn đề chưa được các nhà khoa học lý giải. Điều quan trọng đó là cách thức "đánh lừa" hệ thống trí thông minh nhân tạo hiện nay chỉ được thực hiện thành công đối với từng hệ thống một, và yêu cầu phải có quyền truy cập vào toàn bộ hệ thống thì mới kích hoạt được. Nói cho dễ hiểu thì thí nghiệm trên chỉ có tác dụng với trí tuệ nhân tạo do Google phát triển, chứ không thể hoạt động được với Facebook và Amazon. Tuy vậy đã có những người thử phát triển những cuộc tấn công ảo với quy mô và mức độ thấp hơn nhưng có tác dụng với các dạng trí tuệ nhân tạo khác, bằng cách sử dụng những công nghệ có tính ứng dụng cao.
Phản ứng lại trước kết quả thí nghiệm trên, cả Facebook và Google đều đăng tải những nghiên cứu mới nhất của mình, trong đó nêu rõ họ đang xem xét lại vấn đề này một cách nghiêm túc, từ đó sẽ đưa ra những giải pháp giúp tăng cường tính bảo mật hệ thống của mình.