Không thể nhận diện text, khi dùng step OCR

Khi dùng step OCR để nhận diện text từ image bên dưới, thì kết quả trả về là blank.
Nhờ akabot support giúp team.
AT_00005

Hi @TuongPV ,

Phiền bạn upload lại hình ảnh để team có thể check dễ dàng hơn nhé
Bạn cũng có thể check qua topic về OCR, để tránh trường hợp bị thiếu bước: Get Text OCR

hình ảnh cần nhận diện đây bạnAT_00005
Mình muốn get ra chữ tiếng nhật trong ảnh.
Nhưng kết quả trả về lại là blank

bên topic kia, mình tham khảo rồi nhé. Không liên quan đến vấn đề mình gặp phải

Hi @TuongPV ,

Hiện tại với chữ cái bên trên, chúng ta không thể get được text. Nếu được phiền bạn có thể mô tả kĩ hơn về bài toán, workflow mà bên bạn đang chạy để team có thể tìm phương án thay thế.

Mình truyền vào 1 cái image, và muốn nhận dạng chử ở trên image đó thôi bạn.
Hình trên, chính là hình ảnh thực tế mình cần get chữ.
Nếu không get được, thì bạn có thể cung cấp cho mình nguyên nhân được không.
Để mình report cho khách hàng nhé

Hi @TuongPV ,

Ở trường hợp này, nguyên nhân là do activity ocr đang dùng engine tesseract nên thỉnh thoảng 1 số case sẽ không get được text. Cụ thể với ảnh bên trên thì có thể do màu chữ và màu background gần giống nhau nên không get được text.

Hơn nữa, ở phần chữ kanji này, nếu được bạn có thể quét full cả chữ nhé, thường quét 1 chữ độc lập với màu sắc không được tốt như ảnh này thì sẽ khó nhận diện.
Ví dụ: 重 → 重い

Mình hiểu rồi. cảm ơn bạn

1 Like

Theo như bạn nói ở trên, do màu chữ gần giống background.
Mình đã thực hiện convert màu chữ và màu backgound cho nó khác nhau hoàn toàn.
Nhưng akabot vẫn không xử lý được
image1

Hiện tại trong 1 số trường hợp thì activity OCR vẫn chưa thể get đúng 100%, team sẽ lưu lại để cải tiến và bổ sung activity này để có thể get text với độ chính xác cao hơn nữa.
Còn về hình ảnh, nếu được mình có thể lấy ảnh rõ và nét nhất có thể như ảnh dưới thì sẽ get được text

image

  1. Nhờ bạn suggest cho team có cách nào để thay đổi chất lượng ảnh không.
  2. Ngoài ra, vấn đề cải tiến và bổ sung activity để có thể get text với độ chính xác cao hơn nhờ team akabot cung cấp cho chúng tôi thời gian được không ?

Hi,

  • Phần này bạn cần chọn những hình rõ nét nhất của 1 chữ, số giống như ảnh mình gửi trên thôi. Còn nếu bị nhòe nét hoặc k rõ nét thì OCR sẽ không get được
  • Phần cải tiến và bổ sung thì team sẽ cần phải bàn bạc kĩ lượng để quyết định có làm hay không. Vì sẽ mất nhiều thời gian và cần đánh giá độ ảnh hưởng.

This topic was automatically closed 60 minutes after the last reply. New replies are no longer allowed.