Như chúng ta đều biết, nội dung văn bản trên web tồn tại dưới hai hình thức: thuần kí tự hoặc các kí tự được lồng trong ảnh, biểu đồ, sơ đồ, tài liệu scan... Đối với các nội dung được thể hiện dưới hình thức thứ hai, để thực hiện các tác vụ như sửa chữa, sao chép,... không còn cách nào khác ngoại trừ việc bạn phải gõ lại. Tuy nhiên, một dự án mang tên Project Naptha đang được tập trung nghiên cứu để giải quyết vấn đề này.
Được biết, Project Naptha hoạt động dựa trên thuật toán Stroke Width Transform do Microsoft Research phát triển phục vụ cho việc nhận diện văn bản trong những điều kiện không thuận lợi. Bên cạnh đó, nhóm dự án chia sẻ họ cũng tiếp thu một số công nghệ của Google cho sản phẩm của mình. Website của dự án cho hay, tiện ích Project Naptha sở hữu công nghệ đặc biệt để tách được phần chữ ra khỏi hình ảnh và các yếu tố xung quanh nó một cách hoàn hảo.
Để bắt đầu trải nghiệm những khả năng tuyệt vời nêu trên, trước tiên bạn đọc cần tải về tiện ích Project Naptha cho Chrome tại đây. Bạn đọc cũng nên lưu ý, hiện nay Project Naptha mới chỉ hỗ trợ trình duyệt Chrome tuy nhiên phiên bản hỗ trợ Firefox sẽ ra mắt trong thời gian vài tuần tới.
Hiện nay, Project Naptha chỉ hoạt động hoàn hảo trên website của dự án với rất nhiều ví dụ thực tế để người dùng tương tác. Qua sử dụng đối với các hình ảnh bên ngoài website dự án, khả năng “bắt” chữ trong hình ảnh của Project Naptha còn nhiều hạn chế. Có lẽ cần thêm nhiều thời gian để dự án thú vị này trở nên hoàn thiện.