白老师:
关于汉语篇章基于广义话题的结构,其基本理论框架与2010年我在厦门大学介绍的差不多,这两年来主要是标注了更多的语料(现在大约有30万字,涉及语体有现代小说、当代小说、古典白话小说、法律法规、大陆报刊新闻、台湾报刊新闻、政治报告、百科全书、操作说明等),发现并归纳了更多的语言现象,对这个理论框架的适用性更有底了。
目前只是在语料调查的基础上构建了广义话题结构的形式模型,并归纳出其中的重要性质。我们的语料标注实践说明,以汉族人为操作者,对于99%左右的标点句,将自然状态的生语料文本转化成广义话题的形式结构,是可操作的。但是,目前还不能进行自动转换。要进行自动转换,需要进行约束条件的深入挖掘,还需要走很长的路。这次的讲习班,主要是讲这个形式模型,以及其背后的思想、人工标注语料的方式,听取同学们的意见。
附件是一篇最近的论文、工作的简介、一些标注的语料以及标记说明。由于时间匆忙,标记说明写得不够清楚,标注的语料中还有不少问题,至于理论框架可能有更多的问题。我希望通过这个讲习班,在讲解和讨论中发现问题。这里,更希望白老师和其他各位专家多提意见。我打算秋天适当时候开一个专家咨询会,专门请各位老师提意见。这次的材料先请各位看一下。
宋柔
在 12-8-29,FengZhiwei<zwfeng...@hotmail.com> 写道:
>
> 宋柔老师:你好!
> 我因为出差,不能参加讲习班了。很遗憾。祝讲习班成功。
> 冯志伟8-29
>
>> Date: Wed, 29 Aug 2012 20:10:11 +0800
>> Subject: 基于广义话题的汉语篇章结构讲习班
>> From: songrou...@gmail.com
>> To: comp...@googlegroups.com