25 tháng 6, 2010

Nền tảng hiện có

Bài báo về đề tài dịch máy nhiều vô kể, về đề tài "so sánh đánh giá các hệ dịch máy" lại còn nhiều hơn.
Kiểm lại tự nhận thấy có 2 kết quả quan trọng:
- Mô hình Văn phạm sinh, hay Ngữ pháp Sản sinh (Generative Grammar Formalism) của Chomsky - dùng để mô tả ngữ pháp cho ngôn ngữ tự nhiên
- Princeton University's Wordnet - một kho từ tiếng Anh được chú giải ngữ nghĩa rất công phu.
Điều cần phải làm là ghép nối một cách hữu cơ hai giá trị này lại với nhau.
Khi đó ta sẽ có thể đạt được một hệ dịch máy chất lượng cao

9 tháng 6, 2010

Dịch máy dựa theo luật

Các hệ dịch dựa theo luật thường không lưu tâm đến kiến trúc từ điển. Vài câu hỏi đơn giản nhưng chưa thấy ai trả lời :
- Một từ điển đủ tốt cho con người thì tại sao lại không tốt cho phần mềm dịch máy?
- Các thông tin tra cứu chéo giữa các mục từ điển là hữu ích đối với người học ngoại ngữ (hay người dịch thuật) thì tại sao lại không quan trọng đối với các hệ dịch máy?
- Bộ luật văn phạm và Từ điển tra cứu dùng để máy dịch thì người bình thường có thể sử dụng để học ngôn ngữ?

Kết luận:
- Giải pháp dịch máy đủ tốt phải sử dụng duy nhất một bộ từ điển tra cứu - cho phần mềm và cho con người.
- Bộ quy tắc văn phạm chứa tất cả thông tin quan trọng của một ngôn ngữ và không chứa thêm bất cứ điều gì mà, hoặc khó hiểu, hoặc không cần thiết đối với người đang học ngoại ngữ
Như vậy, con người và máy tính cần phải sử dụng chung một nguồn tri thức ngôn ngữ duy nhất.