Các ngôn ngữ lập trình được dùng nhiều trong các dự án NLP

Qua kinh nghiệm sử dụng tool và lập trình của bản thân, có thể thấy các ngôn ngữ sau được sử dụng nhiều trong các dự án NLP:

(1) Java

Có lẽ do bộ thư viện của Java rất phong phú, hỗ trợ nhiều thứ, lại có khả năng chạy trên nhiều platform khác nhau mà không cần phải viết lại code nên Java được dùng khá nhiều trong các dự án NLP

Nhóm NLP của đại học Stanford dùng Java để phát triển các thư viện xử lý ngôn ngữ tự nhiên: http://nlp.stanford.edu/software.  Tất cả các software ở đây đều được viết bằng Java.

(2) C++

C++ có đặc điểm là hiệu quả, thậm chí là với dữ liệu rất lớn. Còn nhược điểm là bộ thư viện sẵn có chưa phong phú (ngay cả STL). Một số tool điển hình: MaxEnt, CRF++, Brown Clustering,…

(3) Các ngôn ngữ script: Python, Perl, Ruby. Được dùng nhiều hơn cả là Perl, và gần đây là Python với bộ NLTK khá tốt. Mình thì thích Ruby vì tính trong sáng của ngôn ngữ này.

(4) Shell script: Vẫn được dùng khá nhiều như là file batch để run tự động các chương trình theo chế độ batch

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: