Giải được bộ đề "khó chưa từng có", hệ thống AI của DeepMind vượt mặt thí sinh đạt HCV kỳ thi Olympic Toán Quốc tế

Kim, Theo Thanh niên Việt 18:49 09/02/2025
Chia sẻ

Đây là lần đầu tiên, một hệ thống AI vượt qua thí sinh đạt HVC Olympic Toán Quốc tế với bộ đề khó tới vậy.

Được phát triển bởi phòng thí nghiệm DeepMind trực thuộc Google, một hệ thống AI đang được người trong cuộc đánh giá là vượt trội thí sinh đạt huy chương vàng tại kỳ thi Olympic Toán học Quốc tế (IMO), một cuộc thi dành cho học sinh trung học.

Theo khẳng định từ DeepMind, trung bình, hệ thống giỏi hơn thí sinh đạt HCV trong giải hình học. Có tên gọi AlphaGeometry2, tiên tiến hơn phiên bản tiền nhiệm AlphaGeometry ra mắt tháng 1 năm ngoái, hệ thống này có thể giải thành công 84% các bài toán hình học có mặt trong kỳ thi IMO suốt 25 năm qua.

Theo khẳng định từ DeepMind, họ tập trung vào giải toán hình cấp trung học bởi vì họ tin rằng, thông qua tìm cách giải mới cho những vấn đề hình học hóc múa, đặc biệt là các bài toán hình học Euclid, họ có thể nâng hiệu suất các hệ thống AI.

Chứng minh các định lý toán học, hay giải thích một cách logic tại sao một định lý (chẳng hạn như định lý Pythagoras) đúng, đòi hỏi cả khả năng lập luận và lựa chọn những bước giải chính xác, tối ưu nhất. Dự tính của DeepMind là phát triển được một AI sở hữu một kỹ năng giải quyết vấn đề: một hệ thống trí tuệ nhân tạo đa năng.

Giải được bộ đề "khó chưa từng có", hệ thống AI của DeepMind vượt mặt thí sinh đạt HCV kỳ thi Olympic Toán Quốc tế- Ảnh 1.

Trong bài toán yêu cầu "chứng minh tổng góc KIL và XPY bằng 180 độ", AlphaGeometry2 đề xuất vẽ thêm điểm E để góc AEB bằng 90 độ, qua đó tận dụng được điểm L là trung điểm đoạn thẳng AB, tạo ra các cặp tam giác tương đồng như ABE và YBI, hay ALE và IPC, qua đó giải thành công bài toán - Ảnh chụp màn hình.

Mùa hè vừa qua, DeepMind đã trình diễn một hệ thống kết hợp AlphaGeometry2 với AlphaProof - một mô hình AI dành cho lập luận toán học chính quy - để giải 4 trong số 6 bài toán có tại IMO 2024. Ngoài các bài toán hình học, những cách tiếp cận như thế này có thể được mở rộng sang các lĩnh vực toán học và khoa học khác - chẳng hạn như hỗ trợ các tính toán kỹ thuật phức tạp.

AlphaGeometry2 có một số thành phần cốt lõi, bao gồm một mô hình ngôn ngữ thuộc dòng Gemini của Google và một “bộ máy ký hiệu - symbolic engine”. Bộ máy ký hiệu sử dụng các quy tắc toán học để suy luận ra lời giải, kết hợp với “họ hàng của Gemini” nhằm tìm ra các chứng minh hợp lý cho một định lý hình học nhất định.

Các bài toán hình học Olympic thường cần thêm các “yếu tố cấu trúc” trước khi có thể giải, tức là vẽ thêm điểm, đường thẳng hay đường tròn. Mô hình Gemini của AlphaGeometry2 sẽ dự đoán các yếu tố cấu trúc hữu ích, để bộ máy ký hiệu dựa vào đó để suy luận ra kết quả.

AlphaGeometry2 giải thành công một bài toán khi nó tìm ra một chứng minh kết hợp thành công các đề xuất của mô hình Gemini và các nguyên tắc cho trước của bộ máy ký hiệu.

Trong quá trình nghiên cứu, nhóm DeepMind đã chọn 45 bài toán hình học từ các kỳ thi IMO trong 25 năm qua, từ năm 2000 đến 2024, bao gồm các phương trình tuyến tính và các bài toán yêu cầu di chuyển các đối tượng hình học trên mặt phẳng. Sau đó, họ đã “dịch” những bài toán này thành một bộ đề gồm 50 bài toán. (Vì lý do kỹ thuật, một số bài toán phải được tách thành hai).

Theo bài nghiên cứu , AlphaGeometry2 đã giải được 42 trong số 50 bài toán, vượt qua mức điểm trung bình của thí sinh giành huy chương vàng là 40,9.

Giải được bộ đề "khó chưa từng có", hệ thống AI của DeepMind vượt mặt thí sinh đạt HCV kỳ thi Olympic Toán Quốc tế- Ảnh 2.

Trực thuộc Google, DeepMind là phòng thí nghiệm AI đứng sau những thành công vang dội của AlphaGo hay AlphaStar - Ảnh: Google.

Được biết, tuy đã có những hệ thống AI đạt tới trình độ này, nhưng AlphaGeometry2 là mô hình AI đầu tiên đạt hiệu suất cao với một bộ đề lớn tới vậy.

Tiếp tục thử khả năng của AlphaGeometry2, nhóm nghiên cứu nhờ các chuyên gia toán học chọn ra một bộ đề khó hơn, chưa từng xuất hiện tại kỳ IMO nào. Trong tổng số 29 bài toán, AlphaGeometry2 chỉ giải được có 20 bài.

Kết quả nghiên cứu này có thể tiếp tục làm dấy lên tranh luận về xoay quanh việc các hệ thống AI nên được xây dựng theo cách nào, dựa trên thao tác ký hiệu - tức là thao tác các ký hiệu đại diện cho tri thức theo các quy tắc - hay dựa trên mạng nơ-ron, là cách huấn luyện AI theo cách não bộ con người tiếp thu kiến thức.

AlphaGeometry2 áp dụng một cách tiếp cận độc đáo, kết hợp giữa mô hình Gemini có kiến trúc mạng nơ-ron, trong khi bộ máy ký hiệu hoạt động dựa trên các quy tắc. Thành công mới của DeepMind có thể khiến các chuyên gia trong ngành xét lại cách tiếp cận vấn đề.

Tuy vậy, trong báo cáo nghiên cứu, nhóm DeepMind nói rằng họ sở hữu bằng chứng cho thấy mô hình ngôn ngữ vẫn có thể tạo ra một phần câu trả lời đúng mà không cần tới bộ máy ký hiệu.

“Kết quả này ủng hộ quan điểm rằng các mô hình ngôn ngữ lớn có thể tự vận hành mà không cần phụ thuộc vào các công cụ bên ngoài [như bộ máy ký hiệu]”, nhóm DeepMind viết trong bài báo nghiên cứu, “nhưng cho đến khi tốc độ của mô hình được cải thiện và vấn đề ảo giác được giải quyết hoàn toàn, các công cụ này vẫn sẽ là yếu tố thiết yếu cho các ứng dụng toán học”.

TIN CÙNG CHUYÊN MỤC
Xem theo ngày