Hôm bữa mình có lên bảng làm bài thầy giao, thầy góp ý là mấy ký hiệu (nhãn) mình dùng chưa được chính xác, mà đúng thiệt, mấy ký hiệu mình dùng nó đều không theo một quy tắc nào cả. Một số cái đúng chuẩn nhưng lại gán sai. Ngoài ra còn chế thêm mấy cái ký hiệu khác nữa khiến số lượng nhãn quá nhiều, gây trở ngại cho việc gán nhãn sau này.
Mình thấy các bạn chủ yếu dùng nhãn tiếng Anh (mặc dù phân tích câu tiếng Việt) nên mình xin gửi lên cái danh sách nhãn từ pháp tiếng Anh, để có gì đọc ví dụ tiếng Anh khỏi bị bỡ ngỡ. Trong danh sách này có tới 36 nhãn, nhưng phân tích chủ yếu là tiếng Việt nên chắc chỉ còn khoảng 34 nhãn là dùng được, ngoài ra có một số nhãn hiếm gặp nên chắc chỉ còn lại cỡ 30 thôi. (danh sách trong file đính kèm)
Mấy cái nhãn từ pháp thì dễ rồi, chỉ cần nhớ hết là được, khi nào phân tích thì gán nó vào câu thôi, cái khó là bộ nhãn ngữ pháp. Theo như tìm hiểu thì bộ nhãn ngữ pháp của tiếng Anh nó gồm 12 nhãn sau:
01. ADJP = Adjective Phrase (ngữ tính từ)
02. ADVP = Adverb Phrase (ngữ trạng từ)
03. AUX = Auxiliary Verb Phrase (ngữ động từ có trợ động từ)
04. CONJP = Coordinate Phrase (ngữ liên từ)
05. INTJ = Interjecton (ngữ cảm thán từ)
06. NEG = Negative (ngữ phủ định)
07. NP = Noun Phrase (danh ngữ)
08. PP = Prepositional Phrase (giới ngữ)
09. PRT = Particle Phrase (ngữ bắt đầu là tiểu từ)
10. S = Simple declarative clause (mệnh đề khẳng định đơn)
11. VP = Verb Phrase (động ngữ)
12. X = Constituent of unknown or uncertain type (thành phần không xác định)
Cái quan trọng là cách sử dụng 12 cái nhãn này sao cho chính xác thì lúc phân tích câu mới ra đúng cú pháp được. Mình đọc trên mạng thì thấy có 2 bài này viết là dễ đọc mà phân tích cũng đúng bạn nào có hứng thú thì đọc thêm cho biết.
1. Phrase:
http://en.wikipedia.org/wiki/Phrase2. Phrase structure rules:
http://en.wikipedia.org/wiki/Phrase_structure_rules
Ngoài ra có thể xem thêm một số bài ở mục "See also" để hiểu rõ hơn.