Công việc của Ngọc

12 views
Skip to first unread message

Nguyen Quan

unread,
May 27, 2014, 11:23:02 PM5/27/14
to viettr...@googlegroups.com
Dear Ngọc,
Để thuận tiện cho công việc, anh gửi Ngọc 
1.Tool. Em giải nén ra rồi đổi tên SyntaxTool.ex_ thành SyntaxTool.exe.  Cái tool này là từ 22/5. Quyền có cái mới rồi sao chưa gửi Quyền ơi.
2. Viet Tree Bank chắc em có rồi nhưng anh cứ gửi cho đồng bộ, link đây https://www.dropbox.com/s/dylks1akgo6zb3y/VietTreebank_VLSP_SP73_April09_2012.zip
3. Hướng dẫn sử dụng Tool của Quyền 
4. File chứa danh sách các lỗi , em là chuyên gia nên được anh Thái ưu tiên làm nhiều -:), khoảng 800  lỗi. Giải thích thêm một chút:
    -   các dòng chứa lỗi sẽ được tool tự động nhặt vào cửa sổ list_error, ví dụ:
           61:      WHNP -> P N  #1#3
     - Câu chứa lỗi: 61
     - Luật có thể là lỗi: WHNP -> P N  ,tìm trong cấu trúc xem đây có phải là lỗi không, nếu đúng vậy thì  sửa. Chú ý rằng các nhãn             chức năng đã bị remove đi rồi nhé.
     - Mỗi lần sửa là nhớ ghi lại nhé.
5. Nếu em làm xong sớm thì làm luôn cái phần của anh nhé (để anh viết đánh giá, hic)
Chúc khoẻ.



SyntaxTools.rar
Huong_dan_su_dung.doc
err_all_800.txt

Nguyen Quan

unread,
May 27, 2014, 11:44:11 PM5/27/14
to viettr...@googlegroups.com
Nói thêm:
#1: lỗi kiểu 1, một vế phải có nhiều hơn một vế trái
#2: lỗi kiểu 2, điểm cho các token của vế phải ít xuất hiện nhất (nhỏ hơn ngưỡng)
#3: lỗi kiểu 3, điểm cho bigram ít xuất hiện nhất (nhỏ hơn ngưỡng)
Có thể tham khảo thêm trong file err.txt để  vì sao nó là ứng viên lỗi ở dòng thứ 3 trong một cấu trúc ghi lỗi của file err.txt
ví dụ:
<81344.prd>, 29                           file và câu chứa lỗi
VP -> V  A  AP #3                        luật bị lỗi, kiểu lỗi
2 A AP                                          lỗi kiểu 3, bigram     A AP chỉ xuất hiện có 2 lần.
Reply all
Reply to author
Forward
0 new messages