Sau ba tháng thử nghiệm kể từ cuối tháng 3, nhãn "preview" (xem trước) đã được gỡ bỏ khỏi bộ chọn mô hình trong ứng dụng Gemini, đánh dấu sự ổn định và sẵn sàng của phiên bản này. Quá trình ra mắt diễn ra khá nhanh chóng, khi mô hình này đã bất ngờ được mở cho người dùng miễn phí chỉ vài ngày sau khi giới thiệu cho các tài khoản trả phí.
Gemini 2.5 Pro nổi bật với khả năng suy luận logic, giải toán, lập trình phức tạp và đặc biệt là cửa sổ ngữ cảnh khổng lồ lên tới 2 triệu token. Điều này cho phép nó xử lý và phân tích một lượng thông tin khổng lồ cùng lúc, tương đương với việc "đọc" toàn bộ một series tiểu thuyết hoặc một kho mã nguồn lớn chỉ trong một lần yêu cầu.
Thông tin đáng chú ý nhất trong lần ra mắt này là chiến lược phân cấp quyền truy cập của Google:
Bên cạnh đó, Google cũng làm rõ sự khác biệt giữa hai mô hình chính trong ứng dụng: Pro dành cho các tác vụ đòi hỏi “Suy luận, toán học & lập trình”, trong khi Flash tập trung vào việc “Trợ giúp nhanh toàn diện”.
Song song với việc ra mắt 2.5 Pro, Google cũng mang đến những cập nhật lớn cho các nhà phát triển đang xây dựng ứng dụng trên nền tảng của mình.
Theo đó, mô hình Gemini 2.5 Flash, vốn được tối ưu cho tốc độ và hiệu quả chi phí, cũng đã được phát hành chính thức. Bảng giá API của mô hình này đã được điều chỉnh như sau:
Google cũng đã loại bỏ sự chênh lệch giá giữa chế độ “thinking” (có suy nghĩ) và “non-thinking” (không suy nghĩ) trước đây, áp dụng một bậc giá duy nhất để đơn giản hóa việc tính toán chi phí cho nhà phát triển.
Ngoài ra, Google còn bất ngờ giới thiệu một thành viên mới trong gia đình Gemini: Gemini 2.5 Flash Lite, hiện đang ở giai đoạn xem trước. Đây là mô hình được thiết kế đặc biệt cho các tác vụ "có khối lượng lớn và nhạy cảm với độ trễ" như dịch thuật, phân loại văn bản, nơi chi phí và tốc độ là ưu tiên hàng đầu.
Flash Lite được quảng cáo là có độ trễ thấp hơn và chất lượng vượt trội hơn phiên bản 2.0 Flash-Lite, hỗ trợ cửa sổ ngữ cảnh lên tới 1 triệu token và tích hợp sẵn các công cụ mạnh mẽ như lấy thông tin nền tảng từ Google Search và thực thi mã.
Động thái này của Google cho thấy một chiến lược phân cấp sản phẩm AI vô cùng rõ ràng. Bằng cách cung cấp quyền truy cập hạn chế vào mô hình Pro cho người dùng miễn phí, Google vừa giữ chân được một lượng lớn người dùng phổ thông, vừa tạo ra động lực để họ nâng cấp lên các gói trả phí. Đồng thời, việc cung cấp một loạt các mô hình chuyên biệt (Pro, Flash, Flash Lite) với các mức giá khác nhau cho thấy Google muốn trao cho các nhà phát triển một bộ công cụ linh hoạt và tối ưu nhất, củng cố vị thế cạnh tranh trực tiếp với các đối thủ như OpenAI và Anthropic trên thị trường AI toàn cầu.
Theo: 9to5Google
KV