Sunday, 11 December 2011

VietOCR - Vietnamese OCR

Là Java/.NET GUI frontend cho Tesseract OCR engine, hỗ trợ nhận dạng

Tiếng Việt và nhiều ngôn ngữ khác trên các dạng ảnh phổ thông, như

TIFF, JPEG, GIF, PNG, BMP, và PDF, chương trình được tích hợp khả năng

điều khiển scanner quét văn bản, sửa lỗi chính tả, hậu xử lý cho TV,

batch processing, v.v.



Phiên bản 3.2 được xuất bản, bao gói bản final release của Tesseract

3.01.



http://vietocr.sf.net



2011/12/10 nguyenq :

>

> http://vietocr.sf.net



Bác có thể cho biết



- Độ chính xác của VietOCR

# VnDOCR chính xác tới 99% (họ nói vậy)

- Performance tùy thuộc vào chất lượng bitmap đầu vào (chữ viết tay,

đánh máy, chữ in)

# Chắc bác đã có benchmark và so sánh với VnDOCR rồi chứ nhỉ?

- Tốc độ xử lý 1 trang A4

- Xử lý ảnh có nền đen/sám (loại chống copy)

No comments:

Post a Comment