[2022] Multi-modal Text Recognition Networks : Interactive Enhancements between Visual and Semantic FeaturesByeonghu Na 1 , Yoonsik Kim 2 , and Sungrae Park 3 ∗ 본문의 논문은 paper로, 링크를 확인해주세요. Abstract 언어 지식은 결과 시퀀스에서 개별적으로 적용이 되는데, 이전 방법들은 텍스트 인지에 대한 시각적인 내용을 이해하기 위해 의미론적인 내용을 전체적으로 활용하지 못하고 있었다. 제안하는 모델인 MATRN은 더 나은 인식을 위해 시각적인 것과 의미론 적인 특성을 함께 가지는 multi-modal 모델이다. 학습 과정에서 문자와 관련 있는 시각적인 단서들은 ..