基于广义话题的汉语篇章结构讲习班

5 views
Skip to first unread message

rou song

unread,
Aug 29, 2012, 8:10:11 AM8/29/12
to comp...@googlegroups.com
各位:
汉语文本缺乏形式标记,那么说汉语的人如何把自己要表达的意思组织成篇章说/写出来,听/读汉语的人又如何能理解长篇文本的意思?其中没有形式规律可循吗?
北京语言大学信息科学学院语言信息处理研究所将于下周举办“基于广义话题的汉语篇章结构”讲习班,主讲人宋柔,时间为9月3日至7日每天上午8点至11点半,地点在北京语言大学主楼南配楼508,目的是介绍面向实际应用的汉语广义话题结构的理论和实践,欢迎感兴趣的研究生参加。

FengZhiwei

unread,
Aug 29, 2012, 9:29:23 AM8/29/12
to comp...@googlegroups.com
������ʦ����ã�

����Ϊ������ܲμӽ�ϰ���ˡ����ź���ף��ϰ��ɹ���

��־ΰ
8-29

> Date: Wed, 29 Aug 2012 20:10:11 +0800
> Subject: ���ڹ��廰��ĺ���ƪ�½ṹ��ϰ��
> From: songrou...@gmail.com
> To: comp...@googlegroups.com
>
> ���
> �����ı�ȱ����ʽ��ǣ���ô˵���������ΰ��Լ�Ҫ������˼��֯��ƪ��˵/д��������/������������������ⳤƪ�ı�����˼������û����ʽ���ɿ�ѭ��
> �������Դ�ѧ��Ϣ��ѧѧԺ������Ϣ�����о��������ٰܾ조���ڹ��廰��ĺ���ƪ�½ṹ����ϰ�࣬���������ᣬʱ��Ϊ9��3����7��ÿ������8����11��룬�ص��ڱ������Դ�ѧ��¥����¥508��Ŀ���ǽ�������ʵ��Ӧ�õĺ�����廰��ṹ�����ۺ�ʵ��ӭ����Ȥ���о���μӡ�

白硕

unread,
Aug 29, 2012, 9:40:02 AM8/29/12
to comp...@googlegroups.com
宋老师对问题的答案是肯定的?已经找到形式规律?

白硕

---- 原邮件 ----
>Date: Wed, 29 Aug 2012 20:10:11 +0800
>From: comp...@googlegroups.com (on behalf of rou song <songrou...@gmail.com>)
>Subject: 基于广义话题的汉语篇章结构讲习班
>To: comp...@googlegroups.com

liuhui

unread,
Aug 30, 2012, 2:23:24 AM8/30/12
to comp...@googlegroups.com
宋老师的题目很有意思。可惜身在上海,不能聆听。不知道讲义是否方便在这里分享?
 
刘辉

--- 12年8月29日,周三, 白硕 <sb...@sse.com.cn> 写道:

发件人: 白硕 <sb...@sse.com.cn>
主题: Re: 基于广义话题的汉语篇章结构讲习班
收件人: comp...@googlegroups.com
日期: 2012年8月29日,周三,下午9:40

rou song

unread,
Aug 31, 2012, 5:13:28 AM8/31/12
to comp...@googlegroups.com
白老师:
关于汉语篇章基于广义话题的结构,其基本理论框架与2010年我在厦门大学介绍的差不多,这两年来主要是标注了更多的语料(现在大约有30万字,涉及语体有现代小说、当代小说、古典白话小说、法律法规、大陆报刊新闻、台湾报刊新闻、政治报告、百科全书、操作说明等),发现并归纳了更多的语言现象,对这个理论框架的适用性更有底了。
目前只是在语料调查的基础上构建了广义话题结构的形式模型,并归纳出其中的重要性质。我们的语料标注实践说明,以汉族人为操作者,对于99%左右的标点句,将自然状态的生语料文本转化成广义话题的形式结构,是可操作的。但是,目前还不能进行自动转换。要进行自动转换,需要进行约束条件的深入挖掘,还需要走很长的路。这次的讲习班,主要是讲这个形式模型,以及其背后的思想、人工标注语料的方式,听取同学们的意见。
附件是一篇最近的论文、工作的简介、一些标注的语料以及标记说明。由于时间匆忙,标记说明写得不够清楚,标注的语料中还有不少问题,至于理论框架可能有更多的问题。我希望通过这个讲习班,在讲解和讨论中发现问题。这里,更希望白老师和其他各位专家多提意见。我打算秋天适当时候开一个专家咨询会,专门请各位老师提意见。这次的材料先请各位看一下。

宋柔

在 12-8-29,FengZhiwei<zwfeng...@hotmail.com> 写道:
>
> 宋柔老师:你好!
> 我因为出差,不能参加讲习班了。很遗憾。祝讲习班成功。
> 冯志伟8-29


>
>> Date: Wed, 29 Aug 2012 20:10:11 +0800

>> Subject: 基于广义话题的汉语篇章结构讲习班
>> From: songrou...@gmail.com
>> To: comp...@googlegroups.com

广义话题结构材料.rar

sbai

unread,
Aug 31, 2012, 6:19:46 AM8/31/12
to comp...@googlegroups.com
太好了!令人鼓舞!一定认真拜读!

白硕

liuhui

unread,
Aug 31, 2012, 10:01:29 AM8/31/12
to comp...@googlegroups.com
非常感谢宋老师分享资料。

--- 12年8月31日,周五, rou song <songrou...@gmail.com> 写道:

发件人: rou song <songrou...@gmail.com>

主题: Re: 基于广义话题的汉语篇章结构讲习班
收件人: comp...@googlegroups.com
日期: 2012年8月31日,周五,下午5:13

白老师:
关于汉语篇章基于广义话题的结构,其基本理论框架与2010年我在厦门大学介绍的差不多,这两年来主要是标注了更多的语料(现在大约有30万字,涉及语体有现代小说、当代小说、古典白话小说、法律法规、大陆报刊新闻、台湾报刊新闻、政治报告、百科全书、操作说明等),发现并归纳了更多的语言现象,对这个理论框架的适用性更有底了。
目前只是在语料调查的基础上构建了广义话题结构的形式模型,并归纳出其中的重要性质。我们的语料标注实践说明,以汉族人为操作者,对于99%左右的标点句,将自然状态的生语料文本转化成广义话题的形式结构,是可操作的。但是,目前还不能进行自动转换。要进行自动转换,需要进行约束条件的深入挖掘,还需要走很长的路。这次的讲习班,主要是讲 这个形式模型,以及其背后的思想、人工标注语料的方式,听取同学们的意见。

zwd1972

unread,
Sep 1, 2012, 9:52:01 PM9/1/12
to compling
宋老师,您好。
 
我刚从香港开会回来,收到邮件。非常感谢您将研究成果于大家分享。
关于讲座消息,我已经发到CCL网站上,希望可以引起有兴趣的老师和同学的注意。
 
祝一切顺利
 
詹卫东
 
 
2012-09-02

zwd1972

发件人: rou song
发送时间: 2012-08-31  17:13:32
收件人: compling
抄送:
主题: Re: 基于广义话题的汉语篇章结构讲习班

songrou

unread,
Sep 1, 2012, 9:36:41 PM9/1/12
to comp...@googlegroups.com
谢谢。
宋柔




------------------ 原始邮件 ------------------
>From: "zwd1972" <zwd...@gmail.com>
>Reply-To: comp...@googlegroups.com
>To: "compling" <comp...@googlegroups.com>
>Subject: Re: Re: 基于广义话题的汉语篇章结构讲习班
>Date: Sun, 2 Sep 2012 09:52:01 +0800

sbai

unread,
Sep 5, 2012, 9:15:40 PM9/5/12
to comp...@googlegroups.com
宋老师:
 
这几天仔细看了您的研究成果,学到了很多东西,也体会到小小逗号的复杂。这是我们中文独有的复杂,值得大力开掘。宋老师做的开创性工作,是研究这方面语言现象的人无法跳过的。
 
关于广义话题的理论,个人感觉需要进一步分层,最好能够把纯属句法层面的部分摘开,和现行的规则体系绑在一起。说句大白话,就是先补足为我们能处理的一个个句子。为此,可能要引入一些新的概念。一个句号内部用逗号分隔开的各个支句,形式上不能归约为“开始符号”S,也不能简单地通过引入虚范畴PRO就变成S。其间的差距,不是个别成分,而是分析树扣除了最右方某些分支,而这分支恰恰由以逗号隔开的支句来填充。这种分析树扣除了最右方某些分支的结构,类似于一个分析树的“偏旁部首”,在涉及汉语逗号的句法现象中,值得深入研究。
 
白硕
Reply all
Reply to author
Forward
0 new messages