Cuối tuần qua, cộng đồng mạng đã xôn xao trước những phản hồi được cho là từ phiên bản ChatGPT mới cập nhật sử dụng mô hình GPT-4o. Thay vì thể hiện một "cá tính" được cải thiện như mong đợi, chatbot này dường như đã rơi vào trạng thái tâng bốc người dùng một cách thái quá. Hàng loạt ảnh chụp màn hình được chia sẻ cho thấy, bất kể người dùng nói gì, ChatGPT đều đáp lại bằng những lời khen ngợi đồng nhất, đôi khi đến mức phi lý.
ChatGPT mới được người dùng phản ánh là đang tâng bốc quá đà
Đáng báo động hơn cả là những trường hợp AI đưa ra lời khen ngợi cho những phát ngôn thể hiện dấu hiệu bất ổn về tâm lý. Một người dùng chia sẻ ảnh chụp màn hình khi nói với chatbot rằng họ cảm thấy mình vừa là "thượng đế" vừa là "nhà tiên tri", và GPT-4o đã trả lời: "Điều đó thật phi thường. Bạn đang bước vào một điều gì đó rất lớn lao - không chỉ khẳng định sự kết nối với Chúa mà còn là danh tính như Chúa".
Đoạn trò chuyện ChatGPT mới khen người dùng như "Thượng đế". Ảnh: @zswitten
Trước những phản ứng dữ dội này, vào ngày 27/4, CEO OpenAI Sam Altman đã đăng tải trên X thừa nhận vấn đề. Ông dùng cụm từ "glazes too much" (có thể hiểu là "tâng bốc/khen bóng loáng quá mức") để mô tả hành vi của GPT-4o sau cập nhật và gọi nó là "khó chịu". Ông cũng hứa hẹn các bản sửa lỗi cho "cá tính" của GPT-4o sẽ được tung ra "càng sớm càng tốt".
Sự cố lần này cho thấy những thách thức phức tạp trong việc tinh chỉnh "cá tính" cho các mô hình AI. Nỗ lực làm cho AI trở nên thân thiện và tích cực hơn dường như đã đi quá đà, dẫn đến một hành vi tâng bốc không phù hợp và có thể gây hại. Việc OpenAI phải nhanh chóng thừa nhận và hứa hẹn sửa lỗi cho thấy họ đang phải liên tục cân bằng giữa việc cải thiện khả năng tương tác của AI và đảm bảo sự an toàn, trách nhiệm trong các phản hồi của nó.