Tại sao mình viết bài luận này?
Gần đây, mình nhận bình duyệt một bài báo cáo hội nghị trong lĩnh vực xử lý ngôn ngữ tự nhiên được viết bằng tiếng Việt. Vì mình rất hiếm khi tham khảo các bài báo viết bằng tiếng Việt nên khi đọc bài báo, mình có cảm giác khá lạ lẫm và gợi cho mình câu hỏi “có nên viết bài báo khoa học trong ngành AI (ngành kỹ nghệ nói chung) bằng tiếng Việt không?”. Trong bài luận này ngắn, mình muốn bàn luận về các khía cạnh xung quanh câu hỏi này.
Vì sao lại là ngành kỹ nghệ?
Theo ý kiến cá nhân của mình, ở Việt Nam, các bài báo tiếng Việt trong ngành khoa học xã hội là phổ biến hơn ngành kỹ nghệ và ít gây cảm giác lạ lẫm khi đọc hơn. Ngành kỹ nghệ, nhất là trong lĩnh vực trí tuệ nhân tạo đang phát triển rất nhanh, các thuật ngữ mới liên tục xuất hiện nên tốc độ cập nhật các từ mới tương ứng trong tiếng Việt khó theo kịp với tốc độ phát triển của ngành.
So sánh với việc viết bài báo khoa học bằng tiếng mẹ đẻ ở Nhật Bản
Nhật Bản có truyền thống lâu đời trong việc chuyển ngữ các tài liệu, sách vở từ tiếng nước ngoài sang tiếng mẹ đẻ. Từ hàng trăm năm trước, các nhà trí thức Nhật Bản đã có ý thức về tầm quan trọng của việc này ngay cả khi đất nước Nhật còn bế quan tỏa cảng, hầu hết chỉ giao thiệp với người Hà Lan. Khi đó, dù số người biết tiếng Hà Lan còn rất ít nhưng họ đã nỗ lực dịch rất nhiều sách vở, tài liệu khoa học từ tiếng Hà Lan sang tiếng Nhật.
Ngay cả hiện nay khi hầu hết các nhà nghiên cứu đều có thể đọc hiểu sách vở, tài liệu viết bằng tiếng Anh, người Nhật vẫn chuyển ngữ các sách vở viết bằng tiếng nước ngoài sang tiếng Nhật. Trong lĩnh vực trí tuệ nhân tạo, rất nhiều các đầu sách đã có bản dịch tiếng Nhật, ví dụ:
- Bản dịch tiếng Nhật của cuốn sách Deep Learning được bán trên Amazon Nhật
- Bản dịch tiếng Nhật của cuốn sách Pattern Recognition and Machine Learning (Bishop)
Một cuốn sách kinh điển khác (không phải về AI) có tên Structure and Interpretation of Computer Programs (SICP) cũng bản dịch tiếng Nhật.
Không chỉ dịch, các sách chuyên ngành về AI, học máy, hay xử lý ngôn ngữ tự nhiên bằng tiếng Nhật cũng có rất nhiều. Nhờ có các cuốn sách này, các từ vựng chuyên ngành sẽ được cập nhật và chuẩn hóa.
Trong ngành AI hay NLP, các nhà nghiên cứu Nhật cũng chịu khó viết và xuất bản các bài báo bằng tiếng mẹ đẻ. Tạp chí của hiệp hội NLP Nhật cho phép các tác giả viết và đăng bài báo cả bằng Anh và tiếng Nhật. Đa số các bài ở hội nghị NLP thường niên ở Nhật là các bài báo tiếng Nhật.
Ở Việt Nam, các đầu sách dịch trong ngành CNTT cũng có nhiều, nhưng đa phần là các đầu sách dạy về lập trình. Theo hiểu biết của tôi, các đầu sách trong ngành AI rất ít. Gần đây có một số nhóm đã nỗ lực dịch một số đầu sách nổi tiếng sang tiếng Việt, như cuốn Deep Learning hay cuốn sách Dive into Deep Learning. Các tạp chí như tạp chí “Tin học và điều khiển” hay Hội thảo quốc gia về Một số vấn đề chọn lọc của Công nghệ thông tin và truyền thông nhận các bài báo viết bằng cả tiếng Anh và tiếng Việt.
Sách chuyên môn ít được dịch sang tiếng Việt có mấy nguyên nhân. Nguyên nhân thứ nhất là tiền bản quyền để được dịch các sách này thường rất đắt mà sách lại kén bạn đọc nên các nhà xuất bản thường không mấy mặn mà để mua bàn quyển. Nguyên nhân thứ hai là các nhà chuyên môn, nhà nghiên cứu ở Việt Nam ít hứng thú với công việc dịch sách vở – vốn là công việc nặng nhọc và đòi hỏi sự kiên tâm.
Ưu nhược điểm của việc viết luận văn, bài báo khoa học bằng tiếng Việt
Ưu điểm
Ưu điểm lớn nhất của việc viết bài báo khoa học bằng tiếng Việt là bài báo sẽ đến được với lượng độc giả trong nước nhiều hơn. Không chỉ các nhà nghiên cứu trong cùng lĩnh vực, những người thuộc chuyên ngành khác hoặc người đọc bình thường sẽ nắm được ít nhất về mặt ý tưởng của bài báo ở dạng nguyên gốc. Tiếp cận nội dung bài báo gốc (uống nước tại nguồn) giúp cho thông tin không bị “tam sao thất bản” khi đi qua các nguồn thứ cấp khác. Đọc một bài báo bằng tiếng Việt cũng nhanh hơn nhiều so với đọc một bài báo bằng tiếng Anh. Nhiều người có thể cãi rằng: không phải ai cũng muốn đọc các bài báo khoa học và nếu có ý định đó họ sẽ phải học tiếng Anh một cách nghiêm túc. Đồng ý rằng học tiếng Anh là cần thiết nhưng nếu quan niệm người viết bài báo là người bán hàng thì việc tăng lượng khách hàng cho sản phẩm của mình là điều mà ai cũng muốn.
Ưu điểm thứ hai là với người Việt Nam, tốc độ viết bài báo bằng tiếng Việt sẽ nhanh hơn tốc độ viết bài báo bằng tiếng Anh nhiều lần. Điều này đặc biệt đúng với những người viết mà trình độ tiếng Anh còn kém. Khi viết bằng tiếng mẹ đẻ, chúng ta thường diễn đạt trôi chảy và (nhiều khi) rõ ý, đầy đủ hơn. Tôi cũng từng so sánh hai phiên bản tiếng Nhật và tiếng Anh của một bài báo thì thấy ở phiên bản tiếng Nhật, tác giả người Nhật giải thích cặn kẽ, chi tiết hơn phiên bản tiếng Anh.
Ưu điểm thứ ba của việc viết bài báo khoa học bằng tiếng Việt là làm giàu cho ngôn ngữ tiếng Việt. Bằng việc viết bài báo bằng tiếng Việt, các thuật ngữ chuyên môn bằng tiếng Việt trong ngành sẽ được bổ sung, chuẩn hóa dần.
Nhược điểm
Khi viết luận văn bằng tiếng Việt, các thuật ngữ chuyên ngành được chuyển ngữ ra tiếng Việt nên có thể gây khó khăn cho người đọc khi tìm thuật ngữ tiếng Anh tương đương. Khi bình duyệt một bài báo viết bằng tiếng Việt, tôi đã rất bối rối khi gặp cụm từ “Mô hình ngôn ngữ yểm mã”. Chỉ đến khi đọc nội dung, tôi mới luận ra được “Mô hình ngôn ngữ yểm mã” chính là “Masked Language Models”. Theo Hán Việt thì “yểm” là che đi nên “masked” được chuyển ngữ thành “yểm mã”. Vì lần đầu nghe thấy nên thực sự tôi đã cảm thấy tiêu đề của bài báo rất “bí ẩn”, và “nguy hiểm”. Vấn đề này sẽ được giải quyết khi sách vở chuyên ngành bằng tiếng Việt có nhiều hơn và các thuật ngữ được chuẩn hóa.
Hiện nay, so với tiếng Anh, sách vở dạy “văn phong khoa học”, cách diễn đạt trong văn bản khoa học bằng tiếng Việt là rất ít và khó tìm. Người viết chủ yếu học thông qua kinh nghiệm hoặc qua thầy hướng dẫn. Đây là nguyên nhân có nhiều bài báo viết bằng ngôn ngữ tiếng Việt chất lượng không được cao và diễn đạt lộn xộn.
Vấn đề thứ ba là vấn đề hội nhập quốc tế. Các đồng nghiệp khác trên thế giới không đọc và biết đến các bài báo được viết bằng tiếng Việt. Các kết quả mới nhưng vì được viết bằng tiếng Việt nên có thể bị bỏ qua mà không được trích dẫn hay nhắc tới. Đây là điều rất đáng tiếc, nhất là với các kết quả thực sự tốt.
Cần làm gì để việc viết luận văn bằng tiếng Việt được tốt hơn?
Để cải thiện chất lượng các bài báo khoa học được viết bằng tiếng Việt và việc viết văn bản khoa học bằng tiếng Việt, theo tôi cần làm mấy điều sau đây.
Để làm giàu và chuẩn hóa từ vựng về khoa học kỹ thuật, những nhà nghiên cứu, nhà chuyên môn cần bớt chút thời gian để viết các bài viết mang tính khai sáng về lĩnh vực của mình và có thể dịch hoặc hướng dẫn người khác dịch các cuốn sách kinh điển ở trong ngành. Dịch sách chuyên ngành là một công việc nặng nhọc, tốn thời gian nhưng nếu các nhà chuyên môn, nhà nghiên cứu không làm thì sẽ không ai làm cả.
Các hiệp hội nghề nghiệp hằng năm có thể chọn lọc và công bố các thuật ngữ mới trong chuyên ngành của mình. Các thuật ngữ này cần được cân nhắc, thảo luận kỹ lưỡng trước khi đưa ra trên nguyên tắc đảm bảo tính toàn vẹn về nghĩa gốc và cả tính thẩm mỹ trong ngôn ngữ.
Các nhà nghiên cứu, nhà chuyên môn cũng cần viết và phổ biến rộng rãi sách vở, tài liệu về cách viết bài báo bằng tiếng Việt, về văn phong của bài báo khoa học.
Kết luận
Vậy cuối cùng, chúng ta cần trả lời câu hỏi có nên viết bài báo, luận văn (về khoa học kỹ thuật) bằng tiếng Việt không?
Trên bình diện rộng, câu trả lời của tôi là “có” với những lợi ích đã viết ở trên. Với từng cá nhân thì tôi không có câu trả lời rõ ràng nên hay không nên! Tùy theo trình độ tiếng Anh của người viết và mục đích của viết bài báo, mỗi người có thể chọn viết bằng tiếng Anh hoặc tiếng Việt.
Nếu kết quả nghiên cứu thực sự tốt thì sau khi có phiên bản tiếng Việt, nên chuyển sang tiếng Anh để tăng độ ảnh hưởng và được các đồng nghiệp trên thế giới biết tới và ghi nhận.
Cuối cùng, theo tôi, ngôn ngữ không ảnh hưởng tới chất lượng của nghiên cứu mà chỉ ảnh hưởng tới sự giao tiếp và việc chọn lựa ngôn ngữ nào để viết là mang tính cá nhân và tùy thuộc vào mục đích viết.
Filed under: Tiểu luận | Leave a comment »