Deep thought

April 2024
M	T	W	T	F	S	S
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Heilmeier’s Catechism

Posted on April 30, 2015 by LightRiver

Nếu chưa tự trả lời một cách rõ ràng được những câu hỏi dưới đây, có lẽ chưa nên thực hiện nghiên cứu/dự án.

Một tập các câu hỏi được cho là của Heilmeier, mà bất kỳ ai đang đề xuất một dự án nghiên cứu hay cố gắng phát triển sản phẩm nên trả lời được.

Bạn đang cố gắng để làm điều gì? Hãy phát biểu rõ ràng các mục tiêu của bạn mà tuyệt đối không dùng các thuật ngữ khó hiểu.
Cho đến nay vấn đề đã được giải quyết ra sao, và đâu là những giới hạn của cách làm hiện tại? (nói cách khác đâu là những vấn đề mà các nghiên cứu/dự án hiện tại chưa giải quyết hoặc chưa giải quyết được?)
Điểm mới trong cách tiếp cận của bạn – tại sao bạn nghĩ nó sẽ thành công?
“Khách hàng” của nghiên cứu/dự án là ai? Hay nói cách khác ai sẽ quan tâm đến vấn đề nghiên cứu hay sản phẩm?
Nếu thành công, nó sẽ tạo ra sự khác biệt nào? (Nếu thành công, nghiên cứu/dự án của bạn sẽ có tác động như thế nào đến thế giới/cộng đồng?)
Rủi ro và và lợi ích của dự án/nghiên cứu là gì?
Chi phí dành cho dự án/nghiên cứu là bao nhiêu?
Thời gian để làm dự án/nghiên cứu là trong bao lâu?
Đâu là thời điểm trung hạn và thời điểm cuối cùng để đánh giá thành công của dự án/nghiên cứu? (Có cách nào để đánh giá tiến độ và sự thành công của nghiên cứu?)

————————————–

Source: http://en.wikipedia.org/wiki/George_H._Heilmeier#Heilmeier.27s_Catechism

A set of questions credited to Heilmeier that anyone proposing a research project or product development effort should be able to answer.

What are you trying to do? Articulate your objectives using absolutely no jargon.
How is it done today, and what are the limits of current practice?
What’s new in your approach and why do you think it will be successful?
Who cares?
If you’re successful, what difference will it make?
What are the risks and the payoffs?
How much will it cost?
How long will it take?
What are the midterm and final “exams” to check for success?

Filed under: Bài dịch, Kỹ năng mềm cho nhà khoa học | Tagged: advice, research, wisdom | 2 Comments »

Cách viết bài báo khoa học về NLP: từ ý tưởng đến công bố

Posted on December 15, 2022 by LightRiver

Dich từ blog How I write NLP papers in 8 months: idea to publication

(ND: Nghiên cứu là một quá trình lặp đi lặp lại từ lên ý tưởng, thực nghiệm, phân tích kết quả rồi tiếp tục lên ý tưởng. Tham khảo bài viết Weekly idea: The loop of progress trên blog của Francis Chollet)

Trước đó, trong tháng này tôi đã bảo vệ luận án tiến sĩ. Một phần lớn công việc của một nghiên cứu sinh tiến sĩ bao gồm hoàn thành công bố có bình duyệt, và ở trong lĩnh vực của tôi, ba công trình nghiên cứu với vai trò tác giả thứ nhất, về một chủ đề thống nhất trên các hội nghị hàng đầu (EMNLP, ACL, NAACL, TACL, v.v) là đủ tiêu chuẩn để lấy bằng tiến sĩ.

Nhìn lại quá trình xuất bản ba bài báo của tôi, tôi nhận ra rằng tất cả ba bài báo sẽ cần thời gian 8 đến 10 tháng kể từ thời điểm của ý tưởng ban đầu cho đến khi nộp bản thảo 8 trang tới hội nghị. Hơn nữa, mỗi bài báo tuân theo một con đường tương tự nhau từ cách nó phát triển từ một ý tưởng chưa rõ ràng tới một đóng góp vững chắc về mặt nghiên cứu.

Đây chắc chắn không phải là cách duy nhất để viết các bài báo, nhưng nó hiệu quả với tôi. Tất cả ba bài báo của tôi đã được chấp nhận ở các hội nghị chính (trong ngành NLP) ở lần đầu tiên gửi, với các điểm số nằm giữa 3.5 và 4 (trên thang đánh giá 1-5). Vì thế, tôi nghĩ rằng nó là một phương pháp tốt để áp dụng vào các dự án nghiên cứu và để xuất bản (một cách đáng tin cậy) các bài báo tốt trong ngành NLP.

Tháng 1: Khảo sát (Literature review)

Khi tôi bắt đầu một dự án, tôi thường chỉ có một ý tưởng mơ hồ về phương hướng hoặc một số hiện tượng mà tôi muốn khám phá. Vì tôi chưa hiểu rõ về lĩnh vực này nên ở giai đoạn này việc dành thời gian đọc các tài liệu trước đó thay vì đi sâu vào các thực nghiệm ngay lập tức, hữu ích với tôi. Đây là trọng tâm của tôi trong 3-4 tuần đầu tiên của một dự án.

Xem bài đăng trên blog của tôi ở đây để đọc hướng dẫn về cách tìm và đọc các tài liệu nghiên cứu.

Vào cuối tháng đầu tiên, tôi đã đọc khoảng 50 bài báo và hiểu rõ về:

Các khung lý thuyết và các giả định liên quan đến vấn đề.
Các công trình gần đây trong lĩnh vực này và họ sử dụng bộ dữ liệu và phương pháp nào để giải quyết vấn đề.
Những thách thức lớn và các vấn đề mở trong lĩnh vực này, và tại sao chúng vẫn khó giải quyết.

Tại thời điểm này, sau khi làm quen với công trình gần đây, tôi thường có thể xác định một số “khoảng trống nghiên cứu” chưa được giải quyết trong các nghiên cứu và có một số ý tưởng về cách bắt đầu giải quyết chúng. Đây là lúc tôi bắt đầu chạy thử nghiệm – những thử nghiệm ban đầu này hầu như không bao giờ được đưa vào bài báo cuối cùng, nhưng chúng cho phép tôi bắt đầu xây dựng trực giác cho vấn đề và làm quen với các kỹ thuật và tập dữ liệu thường được sử dụng.

Tháng 2-4: Khám phá

Giai đoạn tiếp theo của dự án là thăm dò và thử nghiệm một cách lặp đi lặp lại. Trong hai hoặc ba tháng tiếp theo, tôi thực hiện các thí nghiệm, xây dựng các thí nghiệm nối tiếp nhau, sử dụng các bài học rút ra từ một thí nghiệm để hướng dẫn thiết kế cho thí nghiệm tiếp theo. Hầu hết các thử nghiệm này sẽ là “thất bại” – không rút ra được kết luận vì nhiều lý do:

Tôi phát hiện ra rằng một số giả định mang tính lý thuyết không hợp lệ, khiến thí nghiệm trở nên vô nghĩa.
Sau khi chạy thử nghiệm, tôi thấy rằng kết quả không thú vị lắm: chúng có thể giải thích được bằng một điều gì đó hiển nhiên, hoặc không có mô thức nhất quán.
Tôi cố gắng chạy thử nghiệm nhưng thấy rằng điều đó là không thể vì bộ dữ liệu thiếu một số đặc trưng quan trọng hoặc công cụ của tôi không đủ mạnh.

Một điều bạn không bao giờ nên làm là quyết định trước bằng chứng nào bạn muốn tìm, sau đó chạy thử nghiệm cho đến khi bạn tìm thấy nó. Đó là một thứ khoa học tồi. Vì vậy, trong bối cảnh này, một thử nghiệm thất bại có nghĩa là nó không tạo ra kết quả đủ thú vị để đưa vào một bài báo. Một thử nghiệm có thể tạo ra kết quả khác với những gì tôi mong đợi, trong khi đó là một thử nghiệm rất thú vị và thành công.

Trong giai đoạn này, tôi đọc các bài báo theo một cách khác so với tháng đầu tiên. Thay vì tạo ra một mạng lưới rộng, việc đọc của tôi tập trung hơn vào việc hiểu các chi tiết để tôi có thể thực hiện một thí nghiệm cụ thể một cách chính xác.

Sau vài tháng lặp đi lặp lại và thực hiện khoảng 15-20 thử nghiệm, tôi có ít nhất 2 hoặc 3 thử nghiệm với kết quả đủ thú vị mà tôi muốn chia sẻ với cộng đồng. Những thử nghiệm này sẽ tạo thành cốt lõi của bài báo mới của tôi, nhưng vẫn chưa đủ, vì tôi vẫn phải kết hợp chúng lại với nhau thành một câu chuyện mạch lạc duy nhất và củng cố tất cả những điểm yếu sẽ bị tấn công không thương tiếc trong quá trình bình duyệt.

Tháng 5: Kể chuyện

Trước khi bạn có thể viết một bài báo, bạn phải quyết định một khung hoặc câu chuyện phù hợp với các thí nghiệm của bạn. Nếu điều này không được thực hiện một cách chính xác, người đọc sẽ bị nhầm lẫn; các thí nghiệm của bạn sẽ cho cảm giác không mạch lạc và không động cơ rõ ràng.

Cùng một dữ liệu và thử nghiệm có thể được đóng khung theo nhiều cách khác nhau. Chúng ta có tập trung vào việc đánh giá một số mô hình NLP về mức độ chúng thể hiện một số thuộc tính ngôn ngữ không? Hay chúng ta đang sử dụng bằng chứng từ các mô hình NLP để tranh luận về một số lý thuyết về khả năng (ND: máy tính) học ngôn ngữ con người? Hoặc có lẽ đóng góp chính của chúng tôi là phát hành một lược đồ gán nhãn dữ liệu mới và tập dữ liệu mới?

Để quyết định khung của bài báo, chúng tôi phải xem xét một số câu chuyện có thể kể và câu chuyện phù hợp nhất về mặt tổng thể với các thử nghiệm cốt lõi của chúng tôi. Chúng tôi sẽ cần đưa ra lời giải thích cho điều đó, đây thường không phải là lý do ban đầu mà chúng tôi thực hiện thử nghiệm (vì giai đoạn khám phá rất ngẫu nhiên).

Sản phẩm của việc suy nghĩ cho câu chuyện sẽ kể trong bài báo này là một bản thảo tóm tắt của bài báo cuối cùng, chứa các kết quả chính và động cơ thực hiện chúng. Bằng cách viết phần tóm tắt trước, mục tiêu khoa học tổng thể và cấu trúc của bài báo được làm rõ. Điều này cũng cung cấp cho mọi người ý tưởng về những khoảng trống trong câu chuyện và những thử nghiệm nào vẫn cần thiết để lấp đầy những khoảng trống này. Khoảng thời gian này là khi tôi quyết định nhắm đến ngày gửi bài báo tới hội nghị, khoảng 3-4 tháng sau.

Tháng 6-7: Củng cố kết quả nghiên cứu

Bây giờ chúng ta đang ở giai đoạn cuối của dự án: chúng ta đã quyết định về những đóng góp cốt lõi, bây giờ chúng ta chỉ cần kiên nhẫn dành thời gian để làm cho kết quả nghiên cứu vững chắc nhất có thể. Tôi lập một danh sách các thử nghiệm cần thực hiện để củng cố kết quả, chẳng hạn như chạy nó với các mô hình khác nhau, các bộ dữ liệu khác nhau bằng các ngôn ngữ khác, nghiên cứu cắt bỏ (ablation), kiểm soát các biến số gây nhiễu tiềm ẩn (confounding variables), v.v.

Về cơ bản, tôi xem xét bài báo của chính mình từ góc độ của một nhà phê bình, tự hỏi bản thân: “tại sao tôi lại từ chối bài báo này?” Các đồng tác giả của tôi sẽ giúp đỡ bằng cách chỉ ra những sai sót trong lập luận và phương pháp luận của tôi, dự đoán các vấn đề trước khi có đánh giá chính thức của đồng nghiệp và cho tôi nhiều thời gian để khắc phục chúng. Bài báo có thể có cơ hội được chấp nhận mà không cần phải làm thêm, nhưng nó đáng giá vì nó làm giảm nguy cơ bài báo bị từ chối và cần phải gửi lại, điều này sẽ lãng phí vài tháng quý giá của mọi người.

Tháng 8: Viết bài báo

Tôi mất khoảng 3 tuần để thực sự viết bài báo. Tôi muốn đóng băng tất cả mã nguồn và kết quả thử nghiệm một tháng trước thời hạn, để trong tháng cuối cùng, tôi có thể tập trung vào việc trình bày và viết. Khi tất cả các bảng và số liệu đã sẵn sàng, việc viết bài báo sẽ dễ dàng hơn rất nhiều mà không phải lo lắng về phần nào sẽ cần được cập nhật khi có kết quả mới.

Phần phương pháp thử nghiệm và kết quả là phần dễ viết nhất vì đó là những gì tôi đã nghĩ trong vài tháng qua. Phần giới thiệu là khó nhất vì tôi phải lùi lại một bước và suy nghĩ về cách trình bày công trình nghiên cứu cho những người lần đầu tiên nhìn thấy nó, nhưng đó là điều đầu tiên người đọc nhìn thấy và có lẽ là phần quan trọng nhất của bài báo.

Một tuần trước thời hạn, tôi có một bản thảo đầu tiên tương đối tốt. Sau khi gửi nó cho các đồng tác giả của tôi lần cuối để cải thiện bản trình bày cuối cùng, tôi đã sẵn sàng nhấn nút gửi. Bây giờ chúng tôi cầu nguyện và háo hức chờ đợi email thông báo kết quả bình duyệt!

Vĩ thanh

Có hai điều đã giúp tôi rất nhiều trong quá trình học Tiến sĩ: đọc nhiều bài báo về NLP và có một hội đồng tốt.

Đọc nhiều bài báo về NLP thực sự hữu ích vì nó giúp bạn xây dựng trực giác về những bài báo tốt và kém trông như thế nào. Khi mới bắt đầu sự nghiệp nghiên cứu của mình, tôi đã tham gia rất nhiều nhóm đọc bài báo, nơi chúng tôi thảo luận về các bài báo gần đây (cả bài báo đã xuất bản và bản in trước trên arXiV) và nói về phần nào mạnh và yếu cũng như lý do tại sao. Tôi nhận thấy các xu hướng lặp đi lặp lại của các vấn đề phổ biến và cách các bài báo xuất sắc giải quyết chúng, để tôi có thể kết hợp các giải pháp tương tự vào các bài báo của mình.

Điều này giống như đào tạo GAN (generative adversarial network). Tôi đã rèn luyện bản thân để trở thành một người phân biệt tốt các bài báo tốt và kém, và điều này cũng hữu ích cho công cụ sinh bài báo (generator) của tôi: khi bài báo của tôi vượt qua bộ phân loại của riêng tôi, nó cũng thường có thể vượt qua các bước bình duyệt của các nhà nghiên cứu khác (peer review).

Một điều nữa đã giúp tôi là có một hội đồng vững chắc bao gồm các chuyên gia từ các ngành khác nhau. Điều này hóa ra lại rất hữu ích vì họ thường chỉ ra những điểm yếu và những giả định sai lầm mà tôi không nhận ra, ngay cả khi họ không có giải pháp khắc phục những vấn đề này. Bằng cách này, tôi không ngạc nhiên khi các bài bình duyệt được gửi tới: tất cả các điểm yếu đã được chỉ ra trước đó (bởi hội đồng của tôi – lời người dịch).

Đối với các nghiên cứu sinh đang đọc bài này, tôi có hai lời khuyên. Đầu tiên, hãy đọc nhiều bài báo để tinh chỉnh bộ phân loại (thuật ngữ discriminator trong mạng GAN – lời người dịch) của bạn. Thứ hai, nhận phản hồi về bài báo của bạn thường xuyên và càng sớm càng tốt. Ở giai đoạn này sẽ đỡ đau đớn hơn rất nhiều khi bạn vẫn đang trong giai đoạn khám phá của dự án, thay vì sau khi bạn đã gửi bài báo để nhận được phản hồi tương tự từ những người bình duyệt (reviewer).

Filed under: Bài dịch, Kỹ năng mềm cho nhà khoa học | Tagged: advice, paper | Leave a comment »

Có nên viết bài báo khoa học hay luận văn trong ngành AI bằng tiếng Việt hay không?

Posted on December 8, 2020 by LightRiver

Tại sao mình viết bài luận này?

Gần đây, mình nhận bình duyệt một bài báo cáo hội nghị trong lĩnh vực xử lý ngôn ngữ tự nhiên được viết bằng tiếng Việt. Vì mình rất hiếm khi tham khảo các bài báo viết bằng tiếng Việt nên khi đọc bài báo, mình có cảm giác khá lạ lẫm và gợi cho mình câu hỏi “có nên viết bài báo khoa học trong ngành AI (ngành kỹ nghệ nói chung) bằng tiếng Việt không?”. Trong bài luận này ngắn, mình muốn bàn luận về các khía cạnh xung quanh câu hỏi này.

Vì sao lại là ngành kỹ nghệ?

Theo ý kiến cá nhân của mình, ở Việt Nam, các bài báo tiếng Việt trong ngành khoa học xã hội là phổ biến hơn ngành kỹ nghệ và ít gây cảm giác lạ lẫm khi đọc hơn. Ngành kỹ nghệ, nhất là trong lĩnh vực trí tuệ nhân tạo đang phát triển rất nhanh, các thuật ngữ mới liên tục xuất hiện nên tốc độ cập nhật các từ mới tương ứng trong tiếng Việt khó theo kịp với tốc độ phát triển của ngành.

So sánh với việc viết bài báo khoa học bằng tiếng mẹ đẻ ở Nhật Bản

Nhật Bản có truyền thống lâu đời trong việc chuyển ngữ các tài liệu, sách vở từ tiếng nước ngoài sang tiếng mẹ đẻ. Từ hàng trăm năm trước, các nhà trí thức Nhật Bản đã có ý thức về tầm quan trọng của việc này ngay cả khi đất nước Nhật còn bế quan tỏa cảng, hầu hết chỉ giao thiệp với người Hà Lan. Khi đó, dù số người biết tiếng Hà Lan còn rất ít nhưng họ đã nỗ lực dịch rất nhiều sách vở, tài liệu khoa học từ tiếng Hà Lan sang tiếng Nhật.

Ngay cả hiện nay khi hầu hết các nhà nghiên cứu đều có thể đọc hiểu sách vở, tài liệu viết bằng tiếng Anh, người Nhật vẫn chuyển ngữ các sách vở viết bằng tiếng nước ngoài sang tiếng Nhật. Trong lĩnh vực trí tuệ nhân tạo, rất nhiều các đầu sách đã có bản dịch tiếng Nhật, ví dụ:

Bản dịch tiếng Nhật của cuốn sách Deep Learning được bán trên Amazon Nhật
Bản dịch tiếng Nhật của cuốn sách Pattern Recognition and Machine Learning (Bishop)

Một cuốn sách kinh điển khác (không phải về AI) có tên Structure and Interpretation of Computer Programs (SICP) cũng bản dịch tiếng Nhật.

Không chỉ dịch, các sách chuyên ngành về AI, học máy, hay xử lý ngôn ngữ tự nhiên bằng tiếng Nhật cũng có rất nhiều. Nhờ có các cuốn sách này, các từ vựng chuyên ngành sẽ được cập nhật và chuẩn hóa.

Trong ngành AI hay NLP, các nhà nghiên cứu Nhật cũng chịu khó viết và xuất bản các bài báo bằng tiếng mẹ đẻ. Tạp chí của hiệp hội NLP Nhật cho phép các tác giả viết và đăng bài báo cả bằng Anh và tiếng Nhật. Đa số các bài ở hội nghị NLP thường niên ở Nhật là các bài báo tiếng Nhật.

Ở Việt Nam, các đầu sách dịch trong ngành CNTT cũng có nhiều, nhưng đa phần là các đầu sách dạy về lập trình. Theo hiểu biết của tôi, các đầu sách trong ngành AI rất ít. Gần đây có một số nhóm đã nỗ lực dịch một số đầu sách nổi tiếng sang tiếng Việt, như cuốn Deep Learning hay cuốn sách Dive into Deep Learning. Các tạp chí như tạp chí “Tin học và điều khiển” hay Hội thảo quốc gia về Một số vấn đề chọn lọc của Công nghệ thông tin và truyền thông nhận các bài báo viết bằng cả tiếng Anh và tiếng Việt.

Sách chuyên môn ít được dịch sang tiếng Việt có mấy nguyên nhân. Nguyên nhân thứ nhất là tiền bản quyền để được dịch các sách này thường rất đắt mà sách lại kén bạn đọc nên các nhà xuất bản thường không mấy mặn mà để mua bàn quyển. Nguyên nhân thứ hai là các nhà chuyên môn, nhà nghiên cứu ở Việt Nam ít hứng thú với công việc dịch sách vở – vốn là công việc nặng nhọc và đòi hỏi sự kiên tâm.

Ưu nhược điểm của việc viết luận văn, bài báo khoa học bằng tiếng Việt

Ưu điểm

Ưu điểm lớn nhất của việc viết bài báo khoa học bằng tiếng Việt là bài báo sẽ đến được với lượng độc giả trong nước nhiều hơn. Không chỉ các nhà nghiên cứu trong cùng lĩnh vực, những người thuộc chuyên ngành khác hoặc người đọc bình thường sẽ nắm được ít nhất về mặt ý tưởng của bài báo ở dạng nguyên gốc. Tiếp cận nội dung bài báo gốc (uống nước tại nguồn) giúp cho thông tin không bị “tam sao thất bản” khi đi qua các nguồn thứ cấp khác. Đọc một bài báo bằng tiếng Việt cũng nhanh hơn nhiều so với đọc một bài báo bằng tiếng Anh. Nhiều người có thể cãi rằng: không phải ai cũng muốn đọc các bài báo khoa học và nếu có ý định đó họ sẽ phải học tiếng Anh một cách nghiêm túc. Đồng ý rằng học tiếng Anh là cần thiết nhưng nếu quan niệm người viết bài báo là người bán hàng thì việc tăng lượng khách hàng cho sản phẩm của mình là điều mà ai cũng muốn.

Ưu điểm thứ hai là với người Việt Nam, tốc độ viết bài báo bằng tiếng Việt sẽ nhanh hơn tốc độ viết bài báo bằng tiếng Anh nhiều lần. Điều này đặc biệt đúng với những người viết mà trình độ tiếng Anh còn kém. Khi viết bằng tiếng mẹ đẻ, chúng ta thường diễn đạt trôi chảy và (nhiều khi) rõ ý, đầy đủ hơn. Tôi cũng từng so sánh hai phiên bản tiếng Nhật và tiếng Anh của một bài báo thì thấy ở phiên bản tiếng Nhật, tác giả người Nhật giải thích cặn kẽ, chi tiết hơn phiên bản tiếng Anh.

Ưu điểm thứ ba của việc viết bài báo khoa học bằng tiếng Việt là làm giàu cho ngôn ngữ tiếng Việt. Bằng việc viết bài báo bằng tiếng Việt, các thuật ngữ chuyên môn bằng tiếng Việt trong ngành sẽ được bổ sung, chuẩn hóa dần.

Nhược điểm

Khi viết luận văn bằng tiếng Việt, các thuật ngữ chuyên ngành được chuyển ngữ ra tiếng Việt nên có thể gây khó khăn cho người đọc khi tìm thuật ngữ tiếng Anh tương đương. Khi bình duyệt một bài báo viết bằng tiếng Việt, tôi đã rất bối rối khi gặp cụm từ “Mô hình ngôn ngữ yểm mã”. Chỉ đến khi đọc nội dung, tôi mới luận ra được “Mô hình ngôn ngữ yểm mã” chính là “Masked Language Models”. Theo Hán Việt thì “yểm” là che đi nên “masked” được chuyển ngữ thành “yểm mã”. Vì lần đầu nghe thấy nên thực sự tôi đã cảm thấy tiêu đề của bài báo rất “bí ẩn”, và “nguy hiểm”. Vấn đề này sẽ được giải quyết khi sách vở chuyên ngành bằng tiếng Việt có nhiều hơn và các thuật ngữ được chuẩn hóa.

Hiện nay, so với tiếng Anh, sách vở dạy “văn phong khoa học”, cách diễn đạt trong văn bản khoa học bằng tiếng Việt là rất ít và khó tìm. Người viết chủ yếu học thông qua kinh nghiệm hoặc qua thầy hướng dẫn. Đây là nguyên nhân có nhiều bài báo viết bằng ngôn ngữ tiếng Việt chất lượng không được cao và diễn đạt lộn xộn.

Vấn đề thứ ba là vấn đề hội nhập quốc tế. Các đồng nghiệp khác trên thế giới không đọc và biết đến các bài báo được viết bằng tiếng Việt. Các kết quả mới nhưng vì được viết bằng tiếng Việt nên có thể bị bỏ qua mà không được trích dẫn hay nhắc tới. Đây là điều rất đáng tiếc, nhất là với các kết quả thực sự tốt.

Cần làm gì để việc viết luận văn bằng tiếng Việt được tốt hơn?

Để cải thiện chất lượng các bài báo khoa học được viết bằng tiếng Việt và việc viết văn bản khoa học bằng tiếng Việt, theo tôi cần làm mấy điều sau đây.

Để làm giàu và chuẩn hóa từ vựng về khoa học kỹ thuật, những nhà nghiên cứu, nhà chuyên môn cần bớt chút thời gian để viết các bài viết mang tính khai sáng về lĩnh vực của mình và có thể dịch hoặc hướng dẫn người khác dịch các cuốn sách kinh điển ở trong ngành. Dịch sách chuyên ngành là một công việc nặng nhọc, tốn thời gian nhưng nếu các nhà chuyên môn, nhà nghiên cứu không làm thì sẽ không ai làm cả.

Các hiệp hội nghề nghiệp hằng năm có thể chọn lọc và công bố các thuật ngữ mới trong chuyên ngành của mình. Các thuật ngữ này cần được cân nhắc, thảo luận kỹ lưỡng trước khi đưa ra trên nguyên tắc đảm bảo tính toàn vẹn về nghĩa gốc và cả tính thẩm mỹ trong ngôn ngữ.

Các nhà nghiên cứu, nhà chuyên môn cũng cần viết và phổ biến rộng rãi sách vở, tài liệu về cách viết bài báo bằng tiếng Việt, về văn phong của bài báo khoa học.

Kết luận

Vậy cuối cùng, chúng ta cần trả lời câu hỏi có nên viết bài báo, luận văn (về khoa học kỹ thuật) bằng tiếng Việt không?

Trên bình diện rộng, câu trả lời của tôi là “có” với những lợi ích đã viết ở trên. Với từng cá nhân thì tôi không có câu trả lời rõ ràng nên hay không nên! Tùy theo trình độ tiếng Anh của người viết và mục đích của viết bài báo, mỗi người có thể chọn viết bằng tiếng Anh hoặc tiếng Việt.

Nếu kết quả nghiên cứu thực sự tốt thì sau khi có phiên bản tiếng Việt, nên chuyển sang tiếng Anh để tăng độ ảnh hưởng và được các đồng nghiệp trên thế giới biết tới và ghi nhận.

Cuối cùng, theo tôi, ngôn ngữ không ảnh hưởng tới chất lượng của nghiên cứu mà chỉ ảnh hưởng tới sự giao tiếp và việc chọn lựa ngôn ngữ nào để viết là mang tính cá nhân và tùy thuộc vào mục đích viết.

Filed under: Tiểu luận | Leave a comment »

Learning Day is a gift

Posted on July 16, 2020 by LightRiver

Công ty của bạn có khuyến khích và tạo ra môi trường thuận lợi để nhân viên học những kiến thức, kỹ năng mới bên cạnh những công việc phải làm hàng ngày? Nếu câu trả lời là có thì xin chúc mừng bạn, bạn đang làm việc cho một công ty thực sự tuyệt vời.

Công ty OpenAI – một công ty lớn chuyên về nghiên cứu, phát triển trong lĩnh vực AI đang áp dụng “Learning Day” – chính sách cho phép các nhân viên được sử dụng ngày thứ năm hàng tuần để tự học những kỹ năng mới giúp ích cho công việc nhưng không học được vì bận các công việc ở công ty. Ví dụ, các nghiên cứu viên có thể học thêm những kỹ năng về kĩ nghệ phần mềm (software engineering) hay các kĩ sư phần mềm có thể học thêm về AI. Điều này đã đem lại những lợi ích thiết thực cho công ty.

Vậy trong một ngày học tập, các nhân viên của OpenAI thường học những gì? Theo như bài blog, họ thường làm những việc sau:

Cài đặt lại các phương pháp trong các bài báo về AI
Học các tutorial về deep learning
Thử các công cụ, coding paradigm mới
Học cách làm nghiên cứu trên những vấn đề đủ nhỏ
Đọc về những sự phát triển mới trong những lĩnh vực có vẻ không liên quan gì đến AI.

Để áp dụng chính sách “Learning Day” vào công ty đòi hỏi tính tự giác và kỷ luật rất cao của các nhân viên. Nếu không learning day có thể trở thành một ngày nghỉ thứ 3 trong tuần hoặc nhân viên có thể tranh thủ hoàn thành dự án thay vì học tập. OpenAI đã đưa ra một số cách để “Learning Day” thực sự trở thành một ngày học tập và mang lại lợi ích thực sự.

Mình cũng muốn áp dụng “Learning Day” vào công việc của mình. Có thể dành 1 nửa ngày hoặc 2 buổi tối trong tuần để học thêm những kỹ năng mới không liên quan đến những công việc mình đang làm hàng ngày ở công ty, chẳng hạn như học Java Script để làm Web App Demo hay tìm hiểu các kiến thức về hệ thống.

Filed under: Cải thiện bản thân (Self-help) | Leave a comment »

Toward paper acceptance at top conferences (NLP research field version), by Jun Suzuki

Posted on September 13, 2019 by LightRiver

Jun Suzuki, PGS về NLP ở Đại học Tohoku, Nhật Bản có một bài chia sẻ về chủ đề “hướng tới việc có bài báo được chấp nhận đăng ở hội nghị hàng đầu” tại cuộc gặp thường niên của những nhà nghiên cứu trẻ trong lĩnh vực NLP ở Nhật Yans 2019. Với một người chưa từng có bài báo được đăng ở top conference như mình thì đây là những chia sẻ quý giá.

Trong bài viết có nhiều nội dung hay và mình thích nhất là đoạn PGS Suzuki chia sẻ về cách ông tìm ý tưởng, câu chuyện (từ trong tiếng Nhật là ネタ) cho bài báo của mình (slide từ 35-38). Mình sẽ tóm lược ở đây.

Chọn những câu chuyện nào khiến cho những nhà nghiên cứu cùng lĩnh vực cảm thấy thích thú hay kinh ngạc.

Reviewers thường là những người làm cùng lĩnh vực với mình nên điều này rất quan trọng
Chọn những ý tưởng, đề tài mà khiến những nhà nghiên cứu cùng lĩnh vực có những cảm giác như là “Cái vấn đề này cũng làm được cơ à!” hay “Nếu có nghiên cứu này thì nghiên cứu của mình sẽ tiến bộ (hoặc được trợ giúp)”

Không chỉ trích một nghiên cứu cụ thể nào đó rồi cải tiến

Vì làm điều này không thú vị
Đây là những công việc mang tính Incremental
Về mặt cá nhân, tôi là người theo chủ nghĩa “không viết với luận định rằng bài báo của người khác là kém”
- Tôi không muốn tạo ra kẻ địch
- Không phải là “một bài báo cụ thể là không tốt” mà nên tập trung vào những gì người khác chưa làm được, hay nói cách khác là “những vấn đề cần được giải quyết”

Để tìm ra những câu chuyện (ネタ) khiến cho những nhà nghiên cứu cùng lĩnh vực cảm thấy thích thú hay kinh ngạc, việc survey (đọc nhiều bài báo) là cần thiết

Sẽ là không đủ nếu dừng lại khi nắm bắt được nội dung của bài báo hay cảm nhận sự thú vị của bài báo (việc dừng lại như thế là lãng phí và không có ý nghĩa). Cần liên tục suy nghĩ về các câu hỏi cũng như cách giải quyết về:
- “Nếu đưa nghiên cứu này tiến thêm một bước thì sẽ như thế nào?”
- “Nếu vận dụng kỹ thuật này vào nghiên cứu của mình thì điều gì sẽ xảy ra”
Suy nghĩ về những vấn đề mà có vẻ các nhà nghiên cứu cùng lĩnh vực đang gặp khó
Về cơ bản, câu chuyện phát sinh từ những điều mình đang gặp khó cũng OK

Tóm lại, có mấy thông điệp trong việc tìm ý tưởng, câu chuyện cho bài báo

Những ý tưởng, vật liệu (ネタ) nghiên cứu dễ được đăng ở những hội nghị top là những ý tưởng làm cho những nhà nghiên cứu cùng lĩnh vực với mình cảm thấy thích thú hay kinh ngạc
- Tức là mình hãy đặt vào tâm thế của người khác (những reviewers là những nhà nghiên cứu cùng lĩnh vực với mình) để suy nghĩ
Những việc cần thiết để phát hiện ra những ý tưởng, câu chuyện đó
- Đọc thật nhiều bài báo (survey)
- Khi đọc, chỉ nắm bắt nội dung thôi không đủ, hãy liên tục suy nghĩ về các câu hỏi và cách giải quyết cho các câu hỏi “đâu là những gì được mong muốn giải quyết trong lĩnh vực nghiên cứu đó?”, “nếu vận dụng kỹ thuật này thì chúng ta sẽ làm được gì?”

Filed under: Kỹ năng mềm cho nhà khoa học | Leave a comment »

Học toán ở bậc đại học như thế nào?

Posted on February 7, 2019 by LightRiver

Dịch từ tài liệu “How to Study Mathematics” của tác giả Lawrence Neff Stout, khoa toán đại học Illinois Wesleyan.

Bài luận này mô tả một số chiến lược học môn hoán ở cấp độ đại học. Các tiểu đoạn có tiêu đề như sau

Toán đại học khác toán phổ thông như thế nào?
Chúng ta nên làm gì với những định nghĩa
Định lý, Mệnh đề, Bổ đề, Hệ quả
Lắp ráp các đối tượng với nhau
Phương pháp hiểu chứng minh
Phát triển kỹ thuật (giải toán)
Một vài gợi ý cuối

Toán đại học khác toán phổ thông như thế nào?

Trong toán phổ thông, bạn sử dụng rất nhiều thời gian để học các thuật toán và các kỹ thuật biến đổi mà bạn được kỳ vọng rằng bạn có thể áp dụng trong một số tình huống được mô tả rõ ràng. Sự hạn chế này về mặt tài liệu và những kỳ vọng về thành tích của bạn có lẽ đã khiến cho bạn phát triển những thói quen học tập mà có thể phù hợp với toán phổ thông nhưng có thể không đủ cho toán đại học. Điều này có thể là nguồn gốc của sự thất vọng cho bạn và cho giáo viên của bạn. Mục tiêu của tôi khi viết bài luận này là nhằm giảm nhẹ đi sự thất vọng này bằng cách đưa ra một số chiến lược học tập mà có thể giúp bạn hướng những khả năng và năng lượng của mình đi theo một định hướng cho năng suất tốt.

Sự khác biệt chủ yếu đầu tiên giữa toán phổ thông và toán ở bậc đại học là mức độ quan trọng của những cái mà sinh viên gọi là lý thuyết — phát biểu chính xác của những định nghĩa, định lý và những quá trình logic mà nhờ nó những định lý đó được xác lập. Đối với nhà toán học, những phát biểu này, cùng với những ví dụ minh họa thể hiện tại sao những định nghĩa được lựa chọn là những lựa chọn chuẩn xác và thể hiện những định lý có thể được sử dụng như thế nào trong thực hành, là bản chất của toán học. Một mô tả môn học (course description) có sử dụng thuật ngữ “chặt chẽ” ngụ ý rằng những định nghĩa và định lý sẽ được phát biểu với sự cẩn trọng đáng kể và những chứng minh cho những định lý sẽ được đưa ra thay vì chỉ đưa ra những phát biểu có vẻ đúng. Nếu cách tiếp cận của bạn là đi thẳng đến vấn đề bằng cách đọc lướt qua lý thuyết, khía cạnh này của toán đại học sẽ gây ra những khó khăn cho bạn.

Sự khác biệt thứ hai giữa toán đại học và toán phổ thông đến từ cách tiếp cận đối với các kỹ thuật và các bài toán áp dụng các kỹ thuật này. Ở cấp ba, bạn học một kỹ thuật tại một thời điểm, chẳng hạn một danh sách bài tập hoặc một bài học về cách giải phương trình bậc hai bằng cách nhân tử hóa hoặc sử dụng công thức bậc hai, nhưng một bài học sẽ không dạy bạn cả hai thứ và không yêu cầu bạn quyết định cách tiếp cận nào là tốt hơn đối với các vấn đề cụ thể. Bạn học các kỹ thuật riêng biệt rất tốt trong cách tiếp cận này, nhưng bạn nhiều khả năng sẽ không học cách “tấn công” một bài toán mà bạn không được dạy kỹ thuật nào sẽ dùng vào bài toán đó hoặc đâu là thứ không giống hoàn toàn với những bài tập áp dụng mà bạn đã thấy. Toán ở bậc đại học sẽ cung cấp nhiều kỹ thuật mà có thể được áp dụng vào một loại bài toán cụ thể, tức là các bài toán riêng biệt có thể có nhiều cách tiếp cận, một vài trong số đó sẽ tốt hơn những cái khác. Một phần trong công việc giải bài toán như thế nằm ở việc chọn lựa kỹ thuật phù hợp. Điều này đòi hỏi những thói quen học tập giúp phát triển óc phán đoán cũng như năng lực về kỹ thuật giải toán.

Chúng ta sẽ bắt đầu chủ để về phương pháp học toán bằng cách xem xét từng khía cạnh riêng biệt. Đầu tiên, chúng ta sẽ xem xét những định nghĩa, bởi những định nghĩa hình thành nên nền tảng cho bất kỳ phần nào của toán học và chúng là cốt yếu cho việc hiểu những định lý. Sau đó, chúng ta sẽ nói về các định lý, bổ đề, mệnh đề, hệ quả và phương pháp học tập cách các chủ đề này được kết hợp với nhau. Tiếp theo là chủ đề về chứng minh, phương pháp giải mã chúng và tại sao chúng ta lại cần chúng. Cuối cùng, chúng ta sẽ thảo luận về việc phát triển óc phán đoán trong việc giải quyết bài toán. Continue reading →

Filed under: Bài dịch | Leave a comment »

Cách học toán: phương pháp dấu hoa thị

Posted on May 24, 2018 by LightRiver

Dịch từ bài viết gốc “How to learn mathematics — The asterisk method” của tác giả Alan U. Kennington và dịch đối chiếu từ bản tiếng Nhật 数学の勉強の仕方 – アスタリスク学習法.

—–

Phương pháp asterisk là phương pháp tập trung sự chú ý vào những chỗ khó nhất.

Tôi đã khám phá ra phương pháp asterisk vào năm 1975. Nó rất hiệu quả!

Tìm một chỗ yên tĩnh. Tắt radio (và các thiết bị chơi nhạc số cầm tay). Phòng đọc sách của thư viện là nơi tốt nhất nếu đó là một phòng đọc yên tĩnh. Nếu có một bàn rộng để làm việc thì còn tốt hơn nữa.
Mở sách hoặc bài giảng mà bạn muốn học
Bắt đầu chép tay những phần liên quan trong sách hoặc bài giảng vào vở. Nếu bạn đang học một cuốn sách, bạn nên viết một bản tóm tắt hoặc diễn giải bằng những từ ngữ của bạn cho những gì bạn đang đọc. Nếu bạn đang học một bản ghi chép bài giảng, bạn nên chép tay tất cả và thêm vào những giải thích ở những chỗ cần thiết.
Bất kì khi bạn chép một điều gì, hãy tự hỏi xem bạn có hoàn toàn hiểu nó không. Nói cách khác, bạn phải hiểu tất cả mọi từ trong mọi câu. Khi bạn cảm thấy hoàn toàn thoải mái với những gì bạn đang chép, hãy tiếp tục.
Nếu bạn đang đọc một điều gì đó khó hiểu, hãy dừng (việc chép tay) lại và suy nghĩ cho đến khi bạn hiểu một cách rõ ràng. Nếu đó là một biểu thức toán học mà bạn không hiểu rõ, hãy minh định mỗi phần tử trong biểu thức đó thuộc vào lớp nào. Tất cả những biểu thức con của một biểu thức phức tạp phải thuộc về một số tập hợp hoặc một số lớp nào đó. Mọi toán tử và hàm trong một biểu thức toán học chỉ sử dụng những biến số trong phạm vi định nghĩa của toán tử hay hàm số đó.
Hãy vẽ đồ hình (diagram) về mối quan hệ giữa các khái niệm. Hãy vẽ sơ đồ cho tất cả mọi thứ.
Nếu có một thứ khiến bạn không thể hiểu được dù đã suy nghĩ lâu, hãy chép nó vào vở, nhưng hãy đánh dấu hoa thị (*) ở bên lề.
Điều đó có nghĩa là bạn đã chép một điều mà bạn không hiểu.
Trong khi bạn tiếp tục chép, hãy quay lại những dòng mà bạn đánh dấu hoa thị để xem liệu bạn có thể hiểu chúng.
Nếu sau đó bạn có thể tìm ra một giải thích cho những dòng đánh dấu hoa thị, bạn có thể xóa dấu hoa thị đi.
Khi bạn đã hoàn thành việc chép tay sau khi ngồi một lúc, hãy nhìn lại một lượt những ghi chép của bạn để xem liệu bạn có thể hiểu những dòng mà vẫn có dấu hoa thị hay không.
Nếu không có dấu hoa thị nào, điều đó có nghĩa là bạn đã hiểu mọi thứ.
Vì thế, bạn có thể tiếp tục phần hoặc chương tiếp theo.
Nếu bạn vẫn còn một hoặc nhiều dấu hoa thị trong bản ghi chép sau một ngày hoặc lâu hơn, bạn nên cố gắng hiểu những dòng có dấu hoa thị đó.
Bất kì khi nào bạn có thời gian rảnh và có hứng thú, chỉ cần nhìn vào những dòng có dấu hoa thị đó.
Những dòng đó là những dòng bạn cần chú ý nhiều nhất.
Nếu bạn thảo luận công việc của bạn với người khác, đặc biệt là với giáo viên hoặc người hướng dẫn học tập, hãy cho họ xem bản ghi chép với những dòng có đánh dấu hoa thị. Cố gắng nhờ họ giải thích những dòng đó cho bạn.

Continue reading →

Filed under: Bài dịch | 2 Comments »

Bạn có phù hợp để thành học giả không?

Posted on December 17, 2017 by LightRiver

Minh Pham dịch từ bài luận あなたは学者に向いているか？

“Mình có thể tự viết được bài báo khoa học không?”, “bản thân mình có thể trở thành nhà nghiên cứu được không?”, “mình có phù hợp để thành học giả không?”, “mình có năng lực để học lên sau đại học không?”. Cũng có người đầy tự tin vào bản thân rằng “cái gì mình cũng làm được” , nhưng nói chung nếu là người sẽ học tiếp sau đại học hay là người có định hướng trở thành nhà nghiên cứu, chúng ta đều mang với những nỗi bất an như thế.

Tuy chúng ta cần phải quyết định học lên sau đại học trước khi tự mình nhận ra những tố chất để trở thành học giả của bản thân, nhưng nếu chúng ta nhận ra mình không có tố chất của học giả sau khi học lên cao thì đó là một thất bại lớn trong cuộc đời. Cũng giống như rất nhiều lựa chọn nghề nghiệp khác và thậm chí còn ở mức độ cao hơn, việc lựa chọn con đường trở thành học giả có rủi ro. Việc rơi vào cái gọi là “bẫy học cao” và không có một công việc ổn định không phải là hiếm gặp.

Continue reading →

Filed under: Bài dịch | Leave a comment »

Khoảng giữa của nghiên cứu và phát triển

Posted on October 27, 2017 by LightRiver

(Minh Pham dịch từ bài blog “研究と開発のはざま“)

Ba năm sau khi lấy bằng tiến sĩ, tôi đã làm việc trong môi trường hàn lâm, nhưng từ tháng tư tới tôi sẽ chuyển sang một doanh nghiệp tư nhân. Tôi đã rất băn khoăn liệu có nên chuyển công việc hay không. Thời điểm đó, vì tôi đã suy nghĩ rất nhiều về công việc nghiên cứu nên tôi thử viết ra một chút.

Trong ngành kỹ nghệ, sự khác biệt của nghiên cứu và phát triển là không có

Tôi cho rằng, (giữa nghiên cứu và phát triển) không có sự khác biệt rõ ràng mà ai cũng thấu hiểu. Nếu có, bạn hãy chỉ cho tôi.

Trong thực tế, hầu hết các nghiên cứu (bài báo khoa học) đều phát triển một cái gì đó, và điều đó cũng không phải là vô ích đối với thế giới. Ngược lại, hầu hết các sản phẩm đều có tính mới (hoặc là có sự khác biệt với những sản phẩm khác). Tất nhiên, tôi nghĩ rằng, tính trung bình, trong lĩnh vực kỹ nghệ, những gì được gọi là nghiên cứu là làm những thứ mang tính cơ sở hơn những gì được gọi là phát triển, nhưng tôi không thể vẽ ra một đường ngăn cách rõ ràng.

Phải chăng hiện đang có phong trào thần thánh hóa quá mức việc nghiên cứu?

Nhiều người hay “bị khen ngợi” “ôi, siêu thế” khi người đó tự giới thiệu mình là nhà nghiên cứu. Được khen như thế thì cũng vui, nhưng thực tế thì cũng chẳng có gì siêu cả. 99% các nhà nghiên cứu đang làm những nghiên cứu không có ảnh hưởng (impact) gì đến thế giới và đang viết những bài báo không có ảnh hưởng gì. Điều đó được gọi là siêu ư? Một mặt, có rất nhiều người đang phát triển những sản phẩm mang lại rất nhiều tác động đến thế giới. Nói tóm lại, ý tôi muốn nói là việc cho rằng “nghiên cứu thì giỏi, siêu hơn phát triển” là hoàn toàn không có, và sự khác biệt giữa chúng (trong ngành kỹ nghệ) cũng không có.

Nghiên cứu là gì?

Vậy thì, nghiên cứu là gì? Định nghĩa này phụ thuộc vào cách nắm bắt của bản thân mỗi người. Nếu bản thân mình nghĩ đó là nghiên cứu thì đó là nghiên cứu. Bởi chúng ta không thể vẽ được một đường phân định khách quan (giữa nghiên cứu và phát triển) nên điều đó là đương nhiên.

Đối với bản thân tôi, khi suy nghĩ về câu hỏi “nghiên cứu là gì” thì tôi nghĩ rằng nghiên cứu là việc “đưa ra, đem lại những thành quả mà khiến bản thân cảm thấy phấn khích.” Ít nhất là với bản thân mình, nếu mình không thấy thích thú thì không có ý nghĩa gì, nếu không có thành quả thì cũng chẳng nghĩa lý gì.

Trong việc làm cho bản thân thấy phấn khích, việc tìm ra vấn đề mà bản thân muốn giải quyết, tìm ra câu hỏi mà bản thân muốn trả lời là bắt buộc. Và bạn phải giải quyết được vấn đề (mà bạn tìm ra) đó. Để làm cho bản thân thấy thích thú, chính bạn cũng phải thấy thỏa đáng với phương pháp giải quyết vấn đề. Để bản thân thấy thỏa đáng, bạn cũng phải làm cho người khác thấy thỏa đáng. Chính xác là, bạn không thể thỏa mãn với những kết quả của mình mà người khác thấy chưa thuyết phục. Khi người khác không thấy thuyết phục, khả năng có chỗ nhảy cóc ở đâu đó trong logic của bạn.

Nói tóm lại, tôi nghĩ rằng định nghĩa nghiên cứu ở trong mỗi bản thân chúng ta là việc “tìm ra vấn đề mà mình thấy phấn khích, giải quyết nó ở dạng thức mà người khác cũng thấy thuyết phục”.

Công việc nghiên cứu gặp khó khăn nếu không có câu hỏi lớn

Việc duy trì công việc nghiên cứu là rất khó nếu bạn không có vấn đề mà khiến bạn thấy phấn khích và cần khoảng 5 năm để giải quyết.

Nếu không có câu hỏi lớn, bạn chỉ tìm được vấn đề vừa phải, hoặc là là giải quyết những vấn đề mà người khác đưa cho, bạn sẽ trở thành người chuyên giải quyết vấn đề. Nếu chỉ đơn thuần là đi giải quyết vấn đề thì ở đâu bạn cũng có thể làm được. Nếu bạn dồn sức vào giải quyết những vấn đề mà ngay lập tức có thể giải quyết được, bạn không tận dụng được lợi điểm của nghiệp nghiên cứu. Nếu ngay lập tức có thể giải quyết được, có lẽ chúng ta nên làm vào ngày nghỉ thứ bảy, chủ nhật giống như khi một sở thích.

Điểm tốt của nghiệp nghiên cứu là bạn có nhiều tự do.

Bởi vì không dễ gì để được tự do quyết định việc mình sẽ làm, tôi muốn làm những nghiên cứu thú vị. Bởi vì không dễ gì có được thời gian mà mình có thể sử dụng một cách tự do, tôi muốn dùng vào những việc mình thích. Tự mình nỗ lực giải quyết những vấn đề khiến bản thân mình phấn khích. Tôi nghĩ rằng không có công việc nào thú vị bằng như vậy. Thực tế, tôi đã rất vui khi tìm thấy vấn đề thú vị và giải quyết nó.

Trong việc tìm ra những câu hỏi lớn, việc hiểu sâu sắc những điều về thế giới xung quanh là cần thiết.

Cái gì là thú vị đối với bản thân, xét đến cùng, nó nằm trong những giá trị quan bạn đã tạo nên từ trước đến nay. Nếu chúng ta không nghĩ ra dù có suy nghĩ nhiều thì có lẽ là chúng ta sẽ không nghĩ ra được. Do tầm hiểu biết của chúng ta còn hẹp. Có lẽ chúng ta sẽ tìm ra những điều thú vị mà chúng ta không bao giờ nghĩ đến trước đây khi mở rộng tầm hiểu biết. Mở rộng lĩnh vực nghiên cứu là điều khó, nhưng nếu chúng ta làm những điều mới mẻ dù ít hay nhiều tầm nhìn của chúng ta sẽ rộng mở và khả năng chúng ta tìm được những vấn đề thú vị sẽ tăng lên.

Tổng kết

Nếu chúng ta có vấn đề mà từ trong đáy lòng của bản thân muốn giải quyết thì việc theo nghiệp nghiên cứu là tuyệt vời. Tôi không có công việc nào cho mình lựa chọn như vậy. Nhưng nếu không tìm ra vấn đề như vậy thì tốt hơn là dừng lại một bước. Nếu không có vấn đề như vậy thì giữa nghiên cứu và phát triển không có khác biệt lớn.

Filed under: Bài dịch, Kỹ năng mềm cho nhà khoa học | Leave a comment »

Cử nhân, thạc sĩ, và tiến sĩ

Posted on October 10, 2017 by LightRiver

Cử nhân, thạc sĩ, và tiến sĩ
(Dịch từ: http://tinyurl.com/ya55jj4h)
—-
Tôi đã thử suy ngẫm về sự khác nhau giữa cử nhân, thạc sĩ và tiến sĩ.
1) Cử nhân
Có thể tự mình đọc bài báo khoa học và thực hiện những thử nghiệm bổ sung. Không nhất thiết phải theo đuổi những kết quả nghiên cứu tốt nhất nhưng cũng phải nắm bắt được những nghiên cứu tiêu biểu trong những năm gần đây.
2) Thạc sĩ
Có thể tiếp cận về mặt lý luận những vấn đề chưa được giải quyết (dù nhỏ cũng được); có thể tự mình thực hiện thực nghiệm và quan sát để kiểm chứng những giả thuyết được lập nên.
3) Tiến sĩ
Thử thách bằng cách tiếp cận độc đáo, sáng tạo với những vấn đề được nhận thức là vấn đề chung trong lĩnh vực nghiên cứu. Ví dụ, dù không giải quyết được vấn đề, nhưng cách tiếp cận tự nó ẩn chứa khả năng áp dụng sang vấn đề khác.
Trong thế giới này, có những công việc đòi hỏi thời gian. Nếu (chúng ta) vội vàng tiến lên những giai đoạn tiếp theo một cách vô lý thì về sau sẽ phải trả giá. Nếu bạn là típ người như vậy thì tôi nghĩ rằng bạn tốt nhất là theo con đường khác.

Bằng tiến sĩ
—
Chỉ là một giấy phép (license) trong nghiệp nghiên cứu. Nó không phải là một chứng nhận rằng bạn là bậc thầy trong ngành mà mang nghĩa giống như giấy phép lái xe hay chứng chỉ hành nghề bác sĩ. Không có nó, chúng ta vẫn có thể nghiên cứu. Nhưng sau đó, bạn có thể bị đặt câu hỏi là vì sao bạn không có nó. Trường hợp tôi cố gắng lấy bằng tiến sĩ đó là, tôi đã xấu hổ khi được giới thiệu trong hội nghị quốc tế: “diễn giả tiếp theo là tiến sĩ Kazawa. (những diễn giả từ doanh nghiệp và không có bằng tiến sĩ cũng không có gì dở cả). Điều đấy đã làm tôi khó chịu.

Filed under: Bài dịch | Leave a comment »

Review & Đánh giá một bài báo khoa học

Posted on July 20, 2017 by LightRiver

Với tư cách là một referee, bạn cần đánh giá 1 bài báo theo các tiêu chí sau:

✔ Tính mới (novelty)

✔ Độ quan trọng (significance)

✔ Tính đúng (correctness)

✔ Cách trình bày (readability)

Các câu hỏi quan trọng khi đánh giá một bài báo:

1- Mục đích của bài báo là gì?

☐ Vấn đề bài báo giải quyết là gì?

☐ Tác giả có phát biểu vấn đề một cách rõ ràng hay không?

☐ Tác giả có làm rõ các issues quan trọng hay không?

☐ Tác giả có nêu rõ các contribution của mình hay không

2- Bài báo có phù hợp hay không?

☐ Bài báo có phù hợp với hội nghị/journal không?

3- Mục tiêu (goal) của bài báo có quan trọng hay không?

☐ Vấn đề đặt ra có thực hay không?

☐ Ai quan tâm? (Who care)

☐ Vấn đề có quá specific hay applied hay không?

☐ Vấn đề, mục đích, kết quả có thực sự mới hay không?

✔ Có bài báo nào đã làm giống như vậy không?

✔ Vấn đề đã được giải quyết trước đó chưa?

✔ Bài báo có phải chỉ là một biến thế hay mở rộng đơn giản của các kết quả trước đó?

✔ Tác giả có trích dẫn các kết quả liên quan và phân biệt rõ đâu là kết quả của mình, đâu là kết quả đã được thực hiện trước đó hay không?

4- Phương pháp hay cách tiếp cận có đúng đắn hay không?

☐ Liệu có chỗ nào trong cách tiếp cận không phù hợp (hoặc đối lập) với kết quả hay không?

☐ Liệu có thể phát biểu bằng lời phương pháp của tác giả là gì hay không?

☐ Giả thiết là gì (assumption)? Nó có thực tế hay không?

☐ Nếu nó không thực tế, nó có ảnh hưởng gì tới kết quả? Kết quả có dễ bị ảnh hưởng bởi giả thiết hay không?

☐ Cách tiếp cận có đầy đủ đối với mục đích hay không?

☐ Nếu bài báo trình bày 1 ý tưởng mới, tác giả có thảo luận hay phân tích đầy đủ hay không?

5- Nghiên cứu/kết quả có đúng đắn hay không?

☐ Các phương trình toán học, mô hình toán học có đúng đắn hay không?

☐ Các chứng minh có thuyết phục không?

☐ Các thống kê có đúng không?

☐ Các phương pháp mô phỏng, làm thí nghiệm có thuyết phục bạn rằng kết quả đưa ra là đúng?

☐ Đối với các nghiên cứu về thống kê, tác giả có đưa ra confidence interval hay không?

☐ Kết quả có thống nhất với các giả thiết hoặc các quan sát (facts) và đo đạc không?

☐ Các điều kiện biên có được kiểm tra hay không?

☐ Kết quả có thể xảy ra hay không?

☐ Tác giả có làm những gì họ claim hay không? Ví dụ, tác giả có mô phỏng hệ ban đầu bằng 1 mô hình hợp lý hay chỉ xấp xỉ bẳng các mô hình toán học?

6- Các kết luận đưa ra có đúng đắn/phù hợp với kết quả hay không?

☐ Ứng dụng hoặc ngụ ý (implications) của kết quả là gì?

☐ Tác giả có thảo luận một cách hợp lý tại sao anh ta lại thu được các kết quả đó hay không?

7- Bài báo có được trình bày tốt hay không?

☐ Bài báo có được viết đủ tốt để bạn đánh giá các nội dung kỹ thuật hay không (technical content)

☐ Một bài báo viết khó hiểu không đáng được publish.

☐ Một bài báo cần phải sửa nhiều không đáng được đăng

☐ Nếu bài báo đọc được, bạn cần đánh giá cả về trình bày lẫn nội dung của nó.

☐ Phần tóm tắt có mô tả đúng nội dung bài báo hay không?

☐ Phần introduction có mô tả đúng vấn đề và research framework hay không?

☐ Các phần khác có clear và tuân thủ trình tự logic hay không?

☐ Liệu có quá ít hay quá nhiều các chi tiết kỹ thuật hay không?

☐ Ngữ pháp và cú pháp có đúng không?

☐ Các bảng biểu, hình vẽ có được label đúng, phù hợp và có ý nghĩa hay không?

☐ Có quá nhiều hay quá ít bảng biểu hình vẽ?

☐ Các giải thích có poor hoặc nonsense hay không?

☐ Tác giả viết quá dài dòng hoặc quá ngắn gọn?

☐ Liệu bài báo có self-contained để người trong ngành có thể hiểu được hay không, hay độc giả cần các kiến thức chi tiết khác ở các kết quả, bài báo khác?

☐ Nếu tác giả có refer người đọc tới các bài báo khác có các chi tiết quan trọng? Bạn có tin anh ta không hay cần phải check bài báo gốc?

☐ Style của bài báo có quá suồng sã hay quá formal?

☐ Liệu có quá nhiều lỗi typo hay không?

☐ Paper có quá dài không?

☐ Liệu paper có nên chia ra thành nhiều paper nhỏ mà không mất đi tính logic?

☐ Liệu paper có quá nhiều lỗi chính tả, ngữ pháp hoặc dấu câu? Bạn cần chỉ ra các lỗi đó cho tác giả.

8- Bạn học được gì từ bài báo?

☐ Bạn đã học được, hay độc giả có thể học được gì từ bài báo?

☐ Nếu bạn không học được gì hoặc độc giả mà nó hướng tới không học được gì, bài báo không nên được đăng.

————–

Nên viết gì trong một bản bình duyệt?

Viết 1 bản tóm tắt 1 trang của bài báo. Bạn nên sử dụng font 10 và căn lề tiêu chuẩn. Format 2 cột có thể được chấp nhận. Trong bản tóm tắt này bạn nên mô tả:

Vẫn đề mà bài báo này cố gắng giải quyết là gì? Tại sao vấn đề là quan trọng?
Những ý tưởng chính của bài báo là gì, và tại sao chúng là mới?
Những ý tưởng đó được đánh giá ra sao trong paper? Những đánh giá đó có fair hay phù hợp không?
Bạn có nghĩ rằng bài báo có tác động lớn (high impact) không? Bạn có thích bài báo không?

Một bản bình duyệt nên bao gồm:

Một đoạn văn ngắn nói về những ý sau: 1) Bạn cảm thấy đóng góp chính của bài báo là gì? 2) Những gì bạn thấy thú vị về công trình nghiên cứu? 3) Những nguyên lý cơ thiết yếu nào mà bài báo khai thác?
Một điểm mạnh chính của bài báo (1 câu)
Một điểm yếu của bài báo (1 câu)
Một câu hỏi hoặc hướng nghiên cứu cho future work mà bạn nghĩ rằng tác giả nên follow.

Tham khảo

The task of the referee: https://www.cs.utexas.edu/users/mckinley/notes/reviewing-smith.pdf
How to Review a Scientific Paper: http://www.bcl.hamilton.ie/~barak/how-to-review.html

Filed under: Kỹ năng mềm cho nhà khoa học | Leave a comment »

Categories

Blog Stats

Top Clicks

Tháng 1: Khảo sát (Literature review)

Tháng 2-4: Khám phá

Tháng 5: Kể chuyện

Tháng 6-7: Củng cố kết quả nghiên cứu

Tháng 8: Viết bài báo

Vĩ thanh

Tại sao mình viết bài luận này?

Vì sao lại là ngành kỹ nghệ?

So sánh với việc viết bài báo khoa học bằng tiếng mẹ đẻ ở Nhật Bản

Ưu nhược điểm của việc viết luận văn, bài báo khoa học bằng tiếng Việt

Ưu điểm

Nhược điểm

Cần làm gì để việc viết luận văn bằng tiếng Việt được tốt hơn?

Kết luận

Toán đại học khác toán phổ thông như thế nào?

Trong ngành kỹ nghệ, sự khác biệt của nghiên cứu và phát triển là không có

Nghiên cứu là gì?

Công việc nghiên cứu gặp khó khăn nếu không có câu hỏi lớn

Tổng kết

Với tư cách là một referee, bạn cần đánh giá 1 bài báo theo các tiêu chí sau:

Các câu hỏi quan trọng khi đánh giá một bài báo:

1- Mục đích của bài báo là gì?

2- Bài báo có phù hợp hay không?

3- Mục tiêu (goal) của bài báo có quan trọng hay không?

4- Phương pháp hay cách tiếp cận có đúng đắn hay không?

5- Nghiên cứu/kết quả có đúng đắn hay không?

6- Các kết luận đưa ra có đúng đắn/phù hợp với kết quả hay không?

7- Bài báo có được trình bày tốt hay không?

8- Bạn học được gì từ bài báo?

Nên viết gì trong một bản bình duyệt?

Một bản bình duyệt nên bao gồm:

Tham khảo

Meta

Blogs

Business

CS Related

Data Science

Job Related

Life Related

Math & Statistics

ML Related

NEWS

Newspapers

NLP Related

Programming

Science Related