Deep Learning/Computer Vision

[OCR] EAST text detection w.pytesseract

frances._.sb 2023. 8. 28. 09:30
728x90

 ocr 관련 플젝을 위해 공부할 겸, 기본적으로 사용되는 모델을 가져와보았다.


 일반적으로 OCR에서 gradient를 적용하고 단락으로 그룹화하여 조건식으로 특징을 입력하여 찾는다.

 문제는 통제되지 않은 촬영 환경에서 촬영한 사진에서 텍스트를 감지하는 것은 매우 어렵다는 것이다. 시야각은 텍스트와 평행하지 않고 빛이나 조명에 의해 지나치게 어둡거나 밝을 수도 있다.

 

 사용한 모델은 Zhou et al.의 2017년 논문에 나와 있으며, 궁금하면 읽어보면 좋을 듯하다.

 EAST (an Efficient and Accurate Scene Text detector) 문자 감지 모델은 Text가 흐리거나 기울어진 환경에서도, 부분적으로 가려지고 경우에도 찾아낼 수 있는 딥러닝 문자 감지기이다.

 

EAST framework

 

 논문에 따르면 EAST는 720p 이미지에서 방향과 상관없이 인식할 수 있으며 13.2fps로 실행할 수 있다. 속도가 빠르기 때문에 정지 영상뿐 아니라 동영상에서도 사용이 가능하다고 한다.

 

 서론은 이정도로 마무리 짓고 pytesseract 설치부터 확인하여 보자.

 

 

 

 이 부분이 필요하다! 이거만 설치하면 한국어 인식하기 가능

 

 이후 코드 부분은 github에 올려두었으므로, 확인하여 직접 코드를 돌려보면 좋을 듯하다.

 

 

 부분 부분의 text를 잘 잡아냄을 볼 수 있었다. 하지만 아쉬운 점은 한글 텍스트가 많은 사진에는 아주 좋은 성능을 보이지 못하였다.

 

 

 두 번째에 정리해 둔 코드는 ROI (Region Of Interset)를 통한 결과인데, 위의 한글 데이터를 사용하여 보았다. 저기서, 다음의 부분을 인식한다고 할 때의 결과를 보여준다.

 

 

 결과는 다음과 같이 잘 추출해 냄을 볼 수 있었다.

 

728x90
반응형

'Deep Learning > Computer Vision' 카테고리의 다른 글

[OCR] scale 의 여러 방법  (0) 2023.10.05
[OCR] EasyOCR  (2) 2023.10.04
[Object Detection] YOLO : You Look Only Once  (0) 2022.04.20
Anomaly Detection -2  (0) 2022.02.28
Anomaly Detection -1  (0) 2022.02.28