Tài liệu tham khảo về Text Coherence/Text Readability

Nhân câu hỏi của một bạn về đánh giá chất lượng của văn bản khi chèn/sửa/xoá câu trong đó. Khi còn làm Master/Ph.D. mình cũng có đọc một số trong những tài liệu này.

  1. Barzilay, Modeling Local Coherence: An Entity-based Approach: https://www.aclweb.org/anthology/J/J08/J08-1001.pdf
  2. Micha Elsner, Joseph Austerweil, and Eugene Charniak. A Unified Local and Global Model for Discourse Coherence. ACL 2007: http://www.ling.ohio-state.edu/~melsner/pubs/order.pdf
  3. Micha Elsner and Eugene Charniak. Coreference-inspired Coherence Modeling. ACL 08: http://www.aclweb.org/anthology/P08-2011
  4. Guinaudeau, and Strube. Graph-based Local Coherence Modeling. ACL 2013: http://www.aclweb.org/anthology/P13-1010.pdf
  5. Tool: Brown Coherence model, by Micha Elsner https://bitbucket.org/melsner/browncoherence/
  6. Text Readability: http://www.readability.biz/index.html
  7. PHP Text Statistics: https://github.com/DaveChild/Text-Statistics
  8. Methods for measuring text readability: http://www.standards-schmandards.com/2005/measuring-text-readability/
  9. Text readability and intuitive simplification: A comparison of readability formulas:http://nflrc.hawaii.edu/rfl/April2011/articles/crossley.pdf
  10. http://pageperso.lif.univ-mrs.fr/~nuria.gala/publis/NLPCS2013_Todirascuetal.pdf
Advertisements

Best paper award at ACL 2014

Source: http://acl2014.org/BestPaper.htm

Best Long Paper Award (sponsored by Bloomberg)

Fast and Robust Neural Network Joint Models for Statistical Machine Translation
Jacob Devlin, Rabih Zbib, Zhongqiang Huang, Thomas Lamar, Richard Schwartz and John Makhoul

Best Student Long Paper Award (sponsored by IBM Research)

Low-Rank Tensors for Scoring Dependency Structures
Tao Lei, Yu Xin, Yuan Zhang, Regina Barzilay and Tommi Jaakkola

Best Long Paper Honorable Mention

Structured Learning for Taxonomy Induction with Belief Propagation
Mohit Bansal, David Burkett, Gerard de Melo and Dan Klein

Semantic Parsing via Paraphrasing
Jonathan Berant and Percy Liang

A Discriminative Graph-Based Parser for the Abstract Meaning Representation
Jeffrey Flanigan, Sam Thomson, Jaime Carbonell, Chris Dyer and Noah A. Smith

Best Short Paper Honorable Mention

Predicting Power Relations between Participants in Written Dialog from a Single Thread
Vinodkumar Prabhakaran and Owen Rambow

Improving sparse word similarity models with asymmetric similarity measures
Jean Gawron

My ACL 2013 and CoNLL 2013 reading list

Tiêu chí chọn paper để đọc:

1- Các papers cùng topic với topic hiện tại

2- Các paper liên quan đến việc hiện tại

3- Các paper giới thiệu new task

4- Các paper sử dụng phương pháp độc đáo, có thể áp dụng, biến đổi để sử dụng cho nhiều bài toán.

======= ACL 2013 =========

** Main conference **
1. Is a 204 cm Man Tall or Small ? Acquisition of Numerical Common Sense from the Web
(Narisawa et al.)
Numerical reasoning trong textual inference mặc dù có độ phủ không cao (low coverage) nhưng thường là khó. Paper đặt ra vấn đề thu thập các common sense về numerical expressions. Ví dụ: 3 tỷ người là lớn hay nhỏ,…

2. Aid is Out There : Looking for Help from Tweets during a Large Scale Disaster
(Varga et al)
Bài này nằm trong dự án của lab mình. Bài toán được đặt ra trong ngữ cảnh của thảm hoạ động đất của Nhật. Nhiều người sử dụng twiter để đăng các thông tin báo cáo về tình trạng hiện tại, các tổ chức chính phủ thì đăng các tweet thông báo về các trợ giúp của họ. Vấn đề là làm sao để match các problem tweet với các aid tweet. Kỹ thuật đáng chú ý trong nhất là excitation polarity matrix.
3. Plurality, Negation, and Quantification:Towards Comprehensive Quantifier Scope Disambiguation

4. Joint Event Extraction via Structured Prediction with Global Features

5. Graph-based Local Coherence Modeling

6. Fast and Robust Compressive Summarization with Dual Decomposition and Multi-Task Learning

7. The Impact of Topic Bias on Quality Flaw Prediction in Wikipedia

8. Paraphrase-Driven Learning for Open Question Answering

9. Question Answering Using Enhanced Lexical Semantic Models

10. Grounded Unsupervised Semantic Parsing

11. Sentiment Relevance

12. Grammatical Error Correction Using Integer Linear Programming

======= CoNLL 2013 ===========

** Main conference **

1. A Boosted Semi-Markov Perceptron

2. Spectral Learning of Refinement HMMs

3. Learning Adaptable Patterns for Passage Reranking

4. Better Word Representations with Recursive Neural Networks for Morphology

5. Multilingual WSD-like Constraints for Paraphrase Extraction

6. Acquisition of Desires before Beliefs: A Computational Investigation

Ý nghĩa của Machine Learning

Một discussion hay về Impact của Machine Learning.

Theo tác giả: nhiều nghiên cứu trong ML hiện nay thiếu connection với các “real-world” problem. Một số view trong bài hơi bị bias như trong phần Discussion về các obstacles mà ML community cần overcome. Tuy nhiên worth reading.

http://www.wkiri.com/research/papers/wagstaff-MLmatters-12.pdf

Bài báo này có vẻ làm cho giới ML researcher hơi động chạm. Rất nhiều comments, discussion và thậm chí 1 site đã được lập lên: http://mlimpact.com/ (trang này đã không còn) nhằm discuss về  chuyện này.

http://mloss.org/community/blog/2012/jun/20/machine-learning-already-matters/

Discussion tại ICML 2012: http://icml.cc/discuss/2012/298.html (Link died)

Quote from the paper: Cách các ML researcher và những người apply ML hay làm:

Papers that achieve “Best Paper Award” (since 1996)

Vửa được 1 anh bạn cùng lab gửi cho 1 list các bài báo được “Best Paper Award” từ năm 1996.

Thấy cũng thú vị nên Post lên đây:

http://jeffhuang.com/best_paper_awards.html

Theo Institution:

http://jeffhuang.com/best_paper_awards.html#institutions

ICML 2012 conferences

2 Tutorials có vẻ hay và đáng xem:

[1] Performance Evaluation for Learning Algorithms: Techniques, Application and Issues:

Một vấn đề quan trọng khi nghiên cứu về Machine Learning là làm sao để đánh giá một phương pháp này tốt hơn hay kém hơn 1 phương pháp khác.

http://www.mohakshah.com/tutorials/icml2012/Tutorial-ICML2012/Tutorial_at_ICML_2012.html

[2] Topic Modeling by David Blei:

http://www.cs.princeton.edu/~blei/topicmodeling.html

List các accepted papers của ICML 2012 tại đây:

http://icml.cc/2012/papers/

 

Các Tutorials ở NIPS 2011

Nguồn: Tutorial Schedule in NIPS 2011

(To be editted)

[1] Amir Globerson, Tommi Jaakkola. Linear Programming Relaxations for Graphical Models

[2] Alexander Rush, Michael Collins. Lagrangian Relaxation Algorithms for Inference in Natural Language Processing

Có thể lấy các tutorial, papers về chủ đề này ở trang chủ của Rush:

Bài báo sử dụng kỹ thuật này từng được Best Paper Award ở EMNLP. Worth reading more!

[3] Peter Orbanz, Yee Whye Teh. Modern Bayesian Nonparametrics

Một tutorial cũng được đánh giá cao. Slide có thể lấy tại đây.

[4] Amr Ahmed, Alexander Smola. Graphical Models for the Internet

[5] Naftali Tishby.  Information Theory in Learning and Control

Một bài tutorial theo đánh giá của một số người. Không hiểu sao không kiếm được slide cho bài tutorial này.
Có thể nghe một bài liên quan tại đây: http://videolectures.net/mmdss07_tishby_itam/

[6] Jonathan Pillow. Flexible, Multivariate Point Process Models for Unlocking the Neural Code