Sử dụng tool edits cho bài toán RTE (step by step)

(1) Download bản EDITS 2.0 ở: http://edits.fbk.eu/

Bản mới nhất hiện nay là 3.0

đặt tại thư mục, chẳng hạn my_dir

(2) Giải nén:

tar -xvzf edits-2.0.tar.gz

(3) Vào thư mục vừa giải nén (edits)

(4) Annotate dữ liệu, sử dụng bin/edits-stanford

./bin/edits -a -stanford-parser -o RTE_dev-annotated.xml rte/RTE_dev.xml

2 File dữ liệu (đã được parsed) thu được, chẳng hạn RTE_dev_annotated.xml và RTE_test_annotated.xml

Note: Bản 2.0 bị lỗi (thiếu tag </entailment-corpus> nên phải thêm dòng này vào cuối file)

(5) Training:

Chuẩn bị 1 configuration file. Ví dụ conf1.xml

Sử dụng developement set để learn model

bin/edits -r -c share/configurations/conf1.xml -sm data/RTE_dev-model-conf1 data/RTE_dev_annotated.xml

(6) Test using learned model

bin/edits -e -m data/RTE_dev-model-conf1 -o data/test-result data/RTE_test_en_annotated.xml

trong đó test-result là file kết quả (option -o)

RTE_dev-model-conf1 là model học từ bước (5)

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: