Install minipar parser (Step by Step)

Minipar là một tool dependency parsing cho tiếng Anh, viết bởi Dekang Lin (http://www.cs.ualberta.ca/~lindek/minipar.htm). Chạy tương đối nhanh, ví dụ trên máy Pentium II 300 với 128MB memory, nó phân tích khoảng 300 từ trên giây, khá nhanh so với một bộ phân tích Denpendency Parsing khác là Stanford Parser (http://nlp.stanford.edu/software/lex-parser.shtml)

Bài viết nhắm hướng dẫn cách sử dụng tool minipar cho dependency parsing, step by step. Môi trường sử dụng là Unix hoặc Unix-like ví dụ như Cygwin

Step 0: Download minipar từ trang chủ http://www.cs.ualberta.ca/~lindek/minipar/. Có nhiều version khác nhau, ở đây tôi sử dụng version cho linux 32bit. Giả sử tôi chép vào thư mục ~/nlp/local-tools

Step 1: Giải nénfile minipar-0.5-Linux32.tgz dùng lệnh tar
tar xvfz minipar-0.5-Linux32.tgz

sau đó đổi tên thư mục vừa giải nén ra thánh minipar, xóa file tgz
mv minipar-0.5-Linux32 minipar
rm minipar-0.5-Linux32.tgz

Step 2: Thiết lập đường dẫn cho minipar. Với bash shell, thêm dòng sau vào file .bashrc
export MINIPATH=/cygdrive/d/workspaces/minipar

Step 3: Sử dụng pdemo để phân tích Dependency

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: