Item Infomation


Title: Bước đầu xây dựng tụ động kho ngữ liệu song song thơ ca chữ Hán của Việt Nam có bản dịch nghĩa tiếng Việt hiện đại
Authors: Thái Hoàng Lâm
Dương Thi An
Đinh Điền
Issue Date: 12-2023
Publisher: Viện Ngôn ngữ học. Viện Hàn lâm Khoa học Xã hội Việt Nam
Citation: Tạp chí Ngôn ngữ. – 2023. – Số 12 (398). – Tr. 3 - 13
Abstract: Trong quá trình khai quật kho tàng tài liệu chữ Hán của Việt Nam, việc dịch ý nghĩa của chúng sang tiếng Việt đương đại là một bước quan trọng trong việc hỗ trợ người Việt Nam hiện đại học được nhiều bài học vô giá từ tổ tiên chúng ta. Để hỗ trợ việc giải thích một số lượng lớn các bài viết này, chúng ta nên tạo hoặc nâng cao các công cụ dịch máy. Tuy nhiên, do thiếu coipora song song chất lượng cao, các hệ thống dịch máy hiện tại đã phải vật lộn để thực hiện nhiệm vụ này một cách hiệu quả, đặc biệt là đối với lĩnh vực thơ. Trước những thách thức này, chúng tôi đề xuất sử dụng phần mềm máy tính để tự động tạo ra một kho ngữ liệu chữ Hán tiếng Việt với cách giải thích tiếng Việt đương đại, tập trung vào lĩnh vực thơ chữ Hán Việt Nam. Nghiên cứu của chúng tôi cho thấy rằng chúng tôi đã xây dựng một coipus song song với hơn 4000 bài thơ chữ Hán Việt Nam, mỗi bài có một cách giải thích tiếng Việt và bao gồm thông tin về tác giả và các triều đại có liên quan, v.v. Tài liệu này khuyến khích việc giải thích tự động các tác phẩm văn học của Việt Nam được viết bằng chữ Hán.
: In the progress of excavating the treasures of Vietnamese Han-script documents, translating their meanings into contemporary Vietnamese is a crucial step in assisting modem Vietnamese people in learning many priceless lessons from our ancestors. To support the interpretation of a large number of these writings, we should create or enhance machine translation tools. However, due to a shortage of high-quality parallel coipora, the existing machine translation systems have struggled to do this task effectively, especially for the poetic domain. In light of these challenges, we propose the utilization of computer software to automatically create a Vietnamese Han-script corpus with contemporary Vietnamese interpretation, concentrating on the domain of Vietnamese Han script poetry. Our research shows that we constructed a parallel coipus with more than 4000 Vietnamese Han-script poems, each having a Vietnamese interpretation and including information about the author and the relevant dynasties, etc. This corpus encourages automatic interpretation of Vietnam’s literary works written in Han script.
URI: http://elib.hcmussh.edu.vn/handle/HCMUSSH/140106
ISSN: 0866-7519
Appears in CollectionsBài trích
ABSTRACTS VIEWS

47

VIEWS & DOWNLOAD

0

Files in This Item:
Thumbnail
  • Buocdauxaydungtudongkhodulieu_thaihoanglam.pdf
      Restricted Access
    • Size : 30,2 MB

    • Format : Adobe PDF