Không thể nhận diện text khi dùng GetOCRText

Hi team Akabot, bên mình đang dùng vesion 2.0.5.5 để AutomationTest thì gặp vấn đề lúc GetOCRText như sau:

  • Đối với 2 image cùng size (100x32), cùng độ phân giải, nội dung cũng gần giống nhau nhưng 1 image thì get được text, 1 image thì trả về giá trị không giống nội dung mô tả trong image, xem ảnh bên dưới (vì new user không được upload 2 ảnh nên mình sẽ chỉ upload ảnh bị lỗi) :
    AT_00811_scale1

=> Kết quả trả về giá trị: Riel]
Nhờ Akabot check lại giúp team nguyên nhân và cách khắc phục trường hợp này là như thế nào.

Đây là ảnh get bình thường, kết quả trả về: 500.0
AT_00800_scale1

Hi @TrinhMinh ,

Có thể do activity ocr đang dùng engine tesseract nên thỉnh thoảng 1 số case sẽ không get được text.
=> Có thể do màu chữ, số và màu background gần giống nhau nên không get được text nên cần 1 hình ảnh với màu sắc nét

Bạn upload thêm ảnh lỗi cho team xem nhé, mình đã chỉnh lại level user

Hi Akabot

Mình có upload ảnh ở trên rồi, ảnh 375.0 là ảnh lỗi, ảnh 500.0 là ảnh get ok. Check lại giúp mình nhé

Thanks

Hi Thanh. Về OCR sẽ ko đảm bảo chính xác được 100%. nếu như bạn đang dùng đúng activity như ảnh chụp sau:


thì bạn có thể tăng scale từ 1 lên 2 hoặc 3 và thử lại.

  • Ngoài ra cần đảm bảo bạn chụp đúng ảnh/vùng cần nhận diện, chánh tối đa việc lẹm ảnh

Hi @TrinhMinh ,

Với phần này, bạn có thể thử quét cái ảnh đó lớn hơn để có thể tăng size image cho đảm bảo việc nhận diện hình ảnh.
Nếu vẫn không được nữa, thì phiền bạn chờ bản cập nhật. Team sẽ lưu lại để cải tiến và bổ sung activity này để có thể get text với độ chính xác cao hơn nữa.

Hi anh TungVV2, Akabot Support Team,

Cảm ơn team Akabot vì đã phản hồi, mình xin feedback lại như sau:

Hiện tại bên mình cũng đã thực hiện trước đó theo solution là nếu không nhận diện OCR được lần thứ nhất sẽ thực hiện scale ảnh lên và get lại OCR, tuy nhiên vấn đề ở đây là mỗi ảnh có 1 giá trị scale thích hợp thì OCR mới get text đúng được (Có khoảng 10 giá trị scale bên mình đã tìm ra để đối ứng trường hợp này) nên thứ nhất: Trong tương lại sẽ không biết còn có những image nào không thể get được nếu chỉ dùng 10 giá trị scale mà bên mình đã tìm ra , thứ hai việc retry thêm 10 lần này làm tốn nhiều performance cho việc retry OCR

Về việc cắt ảnh thì bên mình dùng tool cắt ảnh theo tọa độ đã define sẵn nên sẽ không có trường hợp cắt lẹm

Mong Akabot phản hồi giúp team là lỗi này bên Akabot có chỉnh sửa trong bản cập nhật mới sắp tới không và bao giờ thì sẽ có bản cập nhật.

Many thanks.

Bên mình đã tiếp thu ý kiến từ bạn
Về phần cải tiến và bổ sung thì team sẽ cần phải bàn bạc kĩ lượng để quyết định có làm hay không. Vì sẽ mất nhiều thời gian và cần đánh giá độ ảnh hưởng.

Hi @CSD !

Liên quan đến vấn đề này nhờ cho mình hỏi thêm:
Các giá trị trong image là những giá trị số, có trường hợp GetOCRText get đúng giá trị trong image, có trường hợp get sai giá trị trong image.
Nhờ akabot confirm giúp team trường hợp get sai giá trị số trong image thì sẽ trả về giá trị có quy định theo các partern nào không? giá trị sai đó có trường hợp nào là 1 giá trị số khác không hay chỉ trả về kiểu text (không phải số)