Mô hình tách từ, gán nhãn từ loại và hướng tiếp cận tích hợp cho tiếng Việt

Giới thiệu hai bài toán cơ bản trong xử lý ngôn ngữ tự nhiên là bài toán tách tử và bài toán gán nhãn từ loại tiếng Việt, các hướng tiếp cận cho mỗi bài toán và tình hình nghiên cứu chung ở Việt Nam cũng như trên thế giới. Nghiên cứu và đề xuất mô hình cho bài toán tách từ tiếng Việt tận dụng thông tin tri thức từ nhiều nguồn khác nhau nhằm tăng độ chính xác của bộ tách từ. Nghiên cứu và đề xuất mô hình gán nhãn từ loại tiếng Việt, xây dựng một mô hình gán nhãn từ loại hiệu quả như thiết kết corpus gán nhãn từ loại, thiết kế các tập đặc trưng khác nhau để tìm ra các đặc trưng hữu ích cho tiếng Việt. Trình bày quá trình lựa chọn, xây dựng mô hình và tiến hành thực nghiệm một mô hình tích hợp tách từ và gán nhãn từ loại tiếng Việt

http://repository.vnu.edu.vn/handle/VNU_123/15401

Nhận xét

Bài đăng phổ biến từ blog này

Quan điểm thực tiễn của triết học Mác-Lênin và sự vận dụng của Đảng Cộng sản Việt Nam vào sự nghiệp đổi mới ở nước ta