Như chúng ta đều biết, nội dung văn bản trên web tồn tại dưới
hai hình thức: thuần kí tự hoặc các kí tự được lồng trong ảnh, biểu đồ, sơ đồ,
tài liệu scan... Đối với các nội dung được thể hiện dưới hình thức thứ hai, để
thực hiện các tác vụ như sửa chữa, sao chép,... không còn cách nào khác ngoại
trừ việc bạn phải gõ lại. Tuy nhiên, một dự án mang tên Project Naptha đang được
tập trung nghiên cứu để giải quyết vấn đề này.
Tiện ích Project Naptha sẽ mang
đến cho người dùng khả năng tương tác với các văn bản được lồng trong hình ảnh
một cách dễ dàng.
Được biết, Project Naptha hoạt động dựa trên thuật toán
Stroke Width Transform do Microsoft Research phát triển phục vụ cho việc nhận
diện văn bản trong những điều kiện không thuận lợi. Bên cạnh đó, nhóm dự án chia
sẻ họ cũng tiếp thu một số công nghệ của Google cho sản phẩm của mình. Website
của dự án cho hay, tiện ích Project Naptha sở hữu công nghệ đặc biệt để tách được phần chữ
ra khỏi hình ảnh và các yếu tố xung quanh nó một cách hoàn hảo.
Khi hoàn thiện,
Project Naptha sẽ cho phép chỉnh sửa, sao chép, dịch... các nội dung văn bản
được chèn vào ảnh nhanh chóng.
Các văn bản được scan
dưới các định dạng hình ảnh như JPEG hay TIFF sẽ không còn là một vấn đề gây
đau đầu.
Cả những hình ảnh có độ
phức tạp cao như thế này cũng được xử lý khá trơn tru.
Món quà tuyệt vời cho
cộng đồng thích chế meme.
Để bắt đầu trải nghiệm những khả năng tuyệt vời nêu trên,
trước tiên bạn đọc cần tải về tiện ích Project Naptha cho Chrome tại đây. Bạn đọc
cũng nên lưu ý, hiện nay Project Naptha mới chỉ hỗ trợ trình duyệt Chrome tuy
nhiên phiên bản hỗ trợ Firefox sẽ ra mắt
trong thời gian vài tuần tới.
Hiện nay, Project Naptha chỉ hoạt động hoàn hảo trên website của dự án với rất nhiều ví dụ thực tế để người dùng tương tác. Qua sử dụng
đối với các hình ảnh bên ngoài website dự án, khả năng “bắt” chữ trong hình
ảnh của Project Naptha còn nhiều hạn chế. Có lẽ cần thêm nhiều thời gian để dự
án thú vị này trở nên hoàn thiện.