Nâng cao hiệu quả phát hiện văn bản tiếng Việt trong ảnh ngoại cảnh dựa trên cơ chế tập trung ngữ cảnh

Bài viết này đề xuất một giải pháp để nâng cao hiệu quả phát hiện văn bản tiếng Việt trong ảnh ngoại cảnh. Về cơ bản, phương pháp phát hiện văn bản ở đây được đề xuất dựa trên ý tưởng xây dựng cơ chế tập trung ngữ cảnh (context attention) để học các thuộc tính hình học khác nhau nhằm tái tạo lại biểu diễn đa giác của các vùng văn bản.