Mô hình tách từ, gán nhãn từ loại và hướng tiếp cận tích hợp cho tiếng Việt
Giới thiệu hai bài toán cơ bản trong xử lý ngôn ngữ tự nhiên là bài toán
tách tử và bài toán gán nhãn từ loại tiếng Việt, các hướng tiếp cận cho
mỗi bài toán và tình hình nghiên cứu chung ở Việt Nam cũng như trên thế
giới. Nghiên cứu và đề xuất mô hình cho bài toán tách từ tiếng Việt tận
dụng thông tin tri thức từ nhiều nguồn khác nhau nhằm tăng độ chính xác
của bộ tách từ. Nghiên cứu và đề xuất mô hình gán nhãn từ loại tiếng
Việt, xây dựng một mô hình gán nhãn từ loại hiệu quả như thiết kết
corpus gán nhãn từ loại, thiết kế các tập đặc trưng khác nhau để tìm ra
các đặc trưng hữu ích cho tiếng Việt. Trình bày quá trình lựa chọn, xây
dựng mô hình và tiến hành thực nghiệm một mô hình tích hợp tách từ và
gán nhãn từ loại tiếng Việt
http://repository.vnu.edu.vn/handle/VNU_123/15401
http://repository.vnu.edu.vn/handle/VNU_123/15401
Nhận xét
Đăng nhận xét