Dec 12, 2011

VietOCR - Vietnamese OCR

Là Java/.NET GUI frontend cho Tesseract OCR engine, hỗ trợ nhận dạng
Tiếng Việt và nhiều ngôn ngữ khác trên các dạng ảnh phổ thông, như
TIFF, JPEG, GIF, PNG, BMP, và PDF, chương trình được tích hợp khả năng
điều khiển scanner quét văn bản, sửa lỗi chính tả, hậu xử lý cho TV,
batch processing, v.v.

Phiên bản 3.2 được xuất bản, bao gói bản final release của Tesseract
3.01.

http://vietocr.sf.net

2011/12/10 nguyenq :
>
> http://vietocr.sf.net

Bác có thể cho biết

- Độ chính xác của VietOCR
# VnDOCR chính xác tới 99% (họ nói vậy)
- Performance tùy thuộc vào chất lượng bitmap đầu vào (chữ viết tay,
đánh máy, chữ in)
# Chắc bác đã có benchmark và so sánh với VnDOCR rồi chứ nhỉ?
- Tốc độ xử lý 1 trang A4
- Xử lý ảnh có nền đen/sám (loại chống copy)

No comments: