Thông tin tài liệu


Nhan đề : So sánh cấu trúc mạng từ tiếng Việt (VietNet) với mạng từ tiếng Anh (WordNet) trên các danh từ thực thể (enity)
Tác giả : Phan Thị Mỹ Trang
Dương Thị An
Đinh Điền
Trần Thị Minh Phượng
Năm xuất bản : 3-2024
Nhà xuất bản : Viện Ngôn ngữ học. Viện Hàn lâm Khoa học Xã hội Việt Nam
Trích dẫn : Tạp chí Ngôn ngữ. – 2024. – Số 3 (401). – Tr. 3 - 14
Tóm tắt : WordNet là một hệ thống khái niệm nổi tiếng (một loại từ điển đồng nghĩa, hoặc từ điển đồng nghĩa) được thiết kế cho tiếng Anh, đã được công nhận rộng rãi và ứng dụng trong các công trình nghiên cứu liên quan đến ngữ nghĩa tính toán, ngữ nghĩa từ vựng, ngữ nghĩa đối chiếu, v.v. VietNet là một hệ thống khái niệm tương tự cho tiếng Việt, do Trung tâm Ngôn ngữ học tính toán (CLC) phát triển. Để đánh giá cấu trúc của VietNet, chúng ta cần so sánh cấu trúc của VietNet với WordNet bằng cách căn chỉnh các phép đo trong VietNet và WordNet. Trong nghiên cứu này, phép đo độ tương đồng ngữ nghĩa Resnik đã được sử dụng để tính khoảng cách ngữ nghĩa cho 1400 cặp danh từ thực thể tiếng Việt và 1400 cặp danh từ thực thể tiếng Anh. Kết quả so sánh cho thấy các giá trị khoảng cách ngữ nghĩa giữa danh từ thực thể tiếng Việt và tiếng Anh tương đối gần nhau, với sự khác biệt nhỏ là 0,26. Điều này cho thấy cấu trúc của VietNet là đáng tin cậy đối với danh từ thực thể, vì nó thể hiện sự tương đồng cao với cấu trúc của WordNet. Những phát hiện của nghiên cứu này có ý nghĩa quan trọng và có thể áp dụng trong nhiều lĩnh vực ngôn ngữ khác nhau, chẳng hạn như so sánh Anh-Việt về mặt ngữ nghĩa từ vựng và độ tương đồng văn bản liên ngôn ngữ. Ngoài ra, kết quả nghiên cứu làm nổi bật tiềm năng của VietNet và phép đo Resnik trong việc so sánh các giá trị khoảng cách ngữ nghĩa của danh từ giữa các ngôn ngữ. Chúng tôi hy vọng rằng nghiên cứu này sẽ đóng góp vào việc mở rộng kiến ​​thức về phép đo độ tương đồng ngữ nghĩa giữa các ngôn ngữ và làm nền tảng cho các nghiên cứu sâu hơn trong lĩnh vực này.
WordNet is a well-known conceptual system (a type of synonym dictionary, or a thesaurus) designed for the English language, which has been widely recognized and applied in research works related to computational semantics, lexical semantics, contrastive semantics, etc. VietNet is a similar conceptual system for the Vietnamese language, developed by the Computational Linguistics Center (CLC). To evaluate the structure of VietNet, we need to compare the structure of VietNet with WordNet by aligning the measures in VietNet and WordNet. In this study, the Resnik semantic similarity measure was used to compute semantic distances for 1400 pairs of Vietnamese entity nouns and 1400 pairs of English entity nouns. The comparison results showed that the semantic distance values between Vietnamese and English entity nouns are relatively close, with a small difference of 0.26. This indicates that the structure of VietNet is reliable for entity nouns, as it exhibits a high similarity with the structure of WordNet. The findings of this research are significant and can be applied in various linguistic domains, such as English-Vietnamese comparison in terms of lexical semantics and cross-lingual text similarity. Additionally, the research results highlight the potential of VietNet and the Resnik measure in comparing the semantic distance values of nouns across languages. We hope that this study will contribute to the expansion of knowledge regarding the measurement of semantic similarity between languages and serve as a foundation for further studies in this field.
URI: http://elib.hcmussh.edu.vn/handle/HCMUSSH/142033
ISSN : 0866-7519
Bộ sưu tậpBài trích
XEM MÔ TẢ

4

XEM & TẢI

0

Danh sách tệp tin đính kèm:
Ảnh bìa
  • Sosanhcautrucmang_PhanThiMyTrang.pdf
      Restricted Access
    • Dung lượng : 10,12 MB

    • Định dạng : Adobe PDF