1999 年电影《黑客帝国》(The Matrix)向我们展示了这样一个镜头:男主角阿新(Neo)的脑子被插上一种数据传输管子后,几秒钟之内就学会了中国功夫。
如果这种未来科技应用于外语学习,那必将是当之无愧的“世界最强外语学习法”。但作为读者的你,更感兴趣的或许是,在这种未来科技实现之前,什么才是当今的“世界最强外语学习法”?
本书将要告诉你答案!欲知后事如何,请看下回分解。
在接下来的几回里,笔者将先介绍一下外语学习的几个“定律”和“常见误区”作为预备知识,然后再揭开“世界最强外语学习法”。
介绍“定律”是因为,告诉您“世界最强外语学习法”是什么并不难,而证明它为什么是“最强的”才是关键,而这个“证明”就需要你先明白这些“定律”。
介绍“常见误区”是因为,当我们知道了什么是错误的外语学习法(即“误区”),以及它们错在哪里,那么我们把它们跟正确的“世界最强外语学习法”对照时,会更显得后者的伟大、光明、正确。
本回就向您介绍外语学习的第一定律。
还记得上回我们说到电影《黑客帝国》里那种插在人脑上、让人几秒钟就学会全套中国功夫的神奇管子吗?我们还说到,如果这种管子用来把外语知识(如一门外语的海量词汇)在很短的时间内传输到人脑,将是当之无愧的世界最强外语学习法。
然而现实是,这种将大量数据高速传输到人脑的管子仍然是科学幻想。那么在这种技术实现以前,可想而知,人脑接收信息仍然要靠眼睛和耳朵这两个天然的“输入设备”,而且我们都知道它们的“输入速度”都有一个极限——也就是说我们浏览和聆听信息的速度是有限的。
除此以外,我们看到或听到的信息并不会立即成为我们脑子里永久的记忆;例如,我们看到一个外语生词后,并不能立即将它永久地牢记在脑海里。这就是说,我们用眼睛和耳朵“输入”到脑子里的信息,要“存储”为脑子里的长期记忆,需要一个“记忆”的过程,它的速度(“记忆速度”)也是有限的。
以上所说的“输入”和“记忆”,可以统称为“认知”;而“输入速度”和“记忆速度”,可以统称为“认知速度”。
于是我们可以很容易理解:
外语学习的第一定律:人的认知速度是有极限的。(又称为“认知速度定律”。)
欲知后事如何,请看下回分解。
在上一回里,我们讲到了“外语学习的第一定律”,即我们用眼睛和耳朵将外界信息“输入”到脑子里的速度是有限的,要形成长期记忆的速度也是有限的。可以说,无论是什么神通广大的外语学习法,都会受到这些“人肉设备”的“带宽限制”。
那么,外语学习的效率是不是只受到第一定律的限制呢?我们可以假设一个人,他除了饮食和休息,其它时间都在一刻不停地进行外语学习。理论上,这是在不违反第一定律的前提下,将外语学习的工作量最大化,应该就是一种“最强”的外语学习法了,但实际上,有多少人能做到这一点呢?
笔者在小学五年级时,课堂上正式开始教英语。相信很多好学生都有这种跟笔者类似的经历:作为一个好学生,你很可能有一种初生牛犊不怕虎的气魄,敢于挑战学习上的一切难题,于是你买了一本袖珍英汉词典,试图从 A 打头的单词开始,把整本词典的单词都学会。
但事实是,你很可能连第一页都没看完就放弃了。这是因为,当我们做一件本质上不能给我们带来快乐的事情时,我们每次能坚持的时间是很有限的,换句话说,就是我们的耐心是很有限的。
这是人与机器的一个很大的区别。机器只要有供电,就能昼夜不停地连续工作下去,只受运行速度的限制(也就是我们前面说到的“第一定律”的限制);而人不光受到工作速度的限制,还受到工作情绪的限制;人的天性其实都是好逸恶劳的。
因此:
外语学习的第二定律:人的认知耐心是有极限的。(又称为“认知耐心定律”)
欲知后事如何,请看下回分解。
在前两回里,我们讨论了人在学外语的过程中会遇到的两个基本限制——速度限制和耐心限制(即第一和第二定律)。那么,外语教学内容本身,是否也有什么基本规律呢?本回就要告诉你这个基本规律。
首先我们假定一个人一直生活在他母语的社会里,在这个社会里他看不到、听不到任何外语,而只能接触到他的母语。那么我们可想而知,他是永远学不到任何外语的,因为这是一个“单语”(monolingual)的环境,而且是“以母语为单语”的环境。
那么如果他到外国,在外语的社会里生活一段时间呢?有一种很流行的观念,认为如果一个人到外国生活一段时间,他的外语自然就突飞猛进了。是这样吗?
我们来做个思想实验:你是一个中国人,你以前从来没有学过任何阿拉伯语,现在给你一台收音机,这个收音机里有一个纯阿拉伯语的频道。那么让你天天抱着这收音机,几年、几十年地听这个阿拉伯语频道,你最后会学到任何可观的阿拉伯语吗?
答案显然是否定的,因为你尽管听了很多“阿拉伯语”,你却从来不知道它们的意思是什么,它们对你来说只是一串毫无含义的“音”,就像我们在电脑上看到一段“乱码”。
那么一个在外国生活了很久的中国人其实也是类似。我们不否认当他看到外国人指着一个实物呼唤它的名字时,他的确能学到一些实物的名词,如看到外国人向一辆出租车招手,嘴里同时喊道“Taxi”,那么这个中国人的确能学到出租车的外语是 taxi;但我们也必须认识到,一门语言中还有大量表示抽象概念的单词,是你无法通过生活中的实物对照来了解其含义的。笔者小时候就有过一个真实的经历:那时笔者在小学一二年级,有一天傍晚,笔者和父母还有楼上的一个小姐姐一家在单位洗完澡,笔者提议“我们到四百去走走吧”(笔者家附近的“第四百货商店”);小姐姐说:“何必!”笔者当时并没有学过“何必”这个词,就问:“‘何必’是什么意思?”小姐姐开玩笑说:“河里没笔!”两家的家长都笑了。
我们看到很多老华侨(所谓“老中”),在国外生活了几十年,外语水平仍然只停留在生活中一些很基本的单词和用法,就是这个道理——他虽然长期被一个“外语”的环境包围,但他基本上就上上面那个听了很久阿拉伯语频道的人一样,无法或很少能通过某种“对照”(如实物对照)来了解听到的外语的意思,于是外语对他来说始终是一大堆“乱码”。
于是我们现在知道,“以母语为单语的环境”(也就是一个人一直生活在只有母语、没有任何外语的社会里),和“以外语为单语的环境”(也就是一个人虽然生活在外国或者天天听外语收音机),都不是外语学习的理想环境。
于是现在我们就不难理解:
外语学习的第三定律:外语学习内容必须是母语和外语对照的。(又称为“双语内容定律”)
也就是说,第一,我们的学习内容中必须有外语,否则就成了“以母语为单语”的内容,就像一本纯母语的小说,你是无法从中学到任何外语的;第二,光有外语还不够,因为我们必须通过某种方式得知所示外语的意思,而“母语和外语对照”就是得知外语意思的最简单有效的方法;它比起“实物与外语对照”,解决了“抽象概念的外语很难用实物表示”的大问题。
你可能有时看到新闻上说,某小留学生被某外国大学录取,在谈到学外语方法时,他说“喜欢看纯英文的文学名著”。真是这样吗?这种方法似乎违反了上面所说的第三定律,即他的学习内容不是双语对照的。但其实,他在阅读英文名著时遇到生词,仍然是要去查词典的,也就是说,他仍然需要双语对照。与其频频查词典,还不如“直接在学习内容中提供母语和外语的双语对照”。
有的人还会问:“我们学自己的母语时,就没有用过什么双语对照嘛!”对,因为我们学母语时,是把听到的母语跟现实生活中的实物对照来了解听到的母语的含义的,比如家长指着路上一辆汽车对小时候的我们说“汽车”,我们就学到了“汽车”这个母语单词的发音和含义。但这种“实物与母语的对照”,仍然可以被看作是一种特殊的“双语对照”,因为我们可以把现实生活中的见闻看作一种特殊的“语言”,姑且称为“形象语言”(visual language)吧。于是我们学母语的过程,就是一个把“形象语言”和“母语”不断发生对照的过程;我们学外语的过程,则是一个把“母语”和“外语”不断发生对照的过程(有时也不排除通过“形象语言”和“外语”的对照来学一些外语)。
在外语教学理论中,习惯把我们的母语称作 L1(即 first language:第一语言),而把我们要学的外语称作 L2(即 second language:第二语言)。其实笔者认为还有一个“L0”,即上面所说的“形象语言”——我们在现实世界中看到和听到的事物;L0 是我们与生俱来就懂得的语言,我们通过 L0 与 L1 的对照来学会 L1,又通过 L0/L1 与 L2 的对照来学会 L2。
欲知后事如何,请看下回分解。
前面三回我们讲了外语学习的三个定律。从本回起,我们要讨论一些常见外语学习法的谬误。
看美剧、美国电影,无疑就是我们生活中一种很常见的外语学习法。然而,它其实并不是很有效的。下面让笔者告诉你为什么。
很多人看的美剧或者美国电影,是这样一种情况:配音是美语原声,屏幕下方有中英双语字幕。这种形式的外语学习,其实是违反前面说的“第一定律”(也就是“认知速度定律”)的,因为我们首先关注的焦点其实是中文字幕,然后去看整个画面;当我们看完中文字幕并感受完画面后,其实我们已经没有时间去看英文字幕和仔细听英文配音,因为我们眼睛、耳朵和大脑的认知速度是很有限的。
所以一个人可能看过很多美剧、美国电影,但他基本上都是在看中文字幕,对英语学习自然帮助甚微。
那有的人可能会问:“那么我强迫自己不去看中文字幕,只看英文字幕或者只听英文配音呢?”
这样也不行,因为这样违反了前面说的“第三定律”,即失去了双语对照,使得你只是在看一个“以外语为单语”的内容,很多抽象单词的意思你就无法通过电影画面中实物对照来得知了。
所以,看美剧、美国电影,其实并不是一种很有效的外语学习法。这个方法所固有的缺点,我们会在以后的章回里,提出一个化解的方法。
欲知后事如何,请看下回分解。
免责声明:本回的部分内容涉及对“托福”和“GRE”等知名的标准化考试的评论。为了避免可能引起的诽谤诉讼,笔者声明这些评论只是表达一些“看法”而非“事实”。读者必须自行判断和独立证实这些看法的真实性;如果读者无法自行判断和独立证实,读者应该把这些看法视为未经证实,并且不让这些看法影响读者对这些知名标准化考试的看法和消费决策。
托福、GRE 等英语国家主办的标准化考试,一般被作为去这些国家留学或工作时的一种英语水平检测标准。然而,这些考试考得好,就意味着英语水平真的好吗?
笔者认为至少有两大问题。
一是很多应试者备考时往往借助于“真题”和“机经”。真题一般是指历史上考过的题——由于这些考试的某种机制,这些历史上的考题有可能重新出现在新的考卷上;机经则一般是指某些考生参加最近举行过的考试后写下的考试经验(特别是对考题的回忆)——在同一波考试里,时区靠前的考点出现的考题有可能出现在时区靠后的考点的考卷上,因此机经往往被认为是很重要的。
可想而知,通过借鉴真题和机经而得到的分数提高,显然不意味着真实的外语水平也得到了相同比例的提高。
二是这些考试虽然在一定程度上考察了应试者的“词汇量”,但对每个单词的“造句知识”似乎考察得不够,导致应试者在外语的实际运用中常常造出不正确的句子。例如,笔者常常在社交网站和一些个人主页上看到“in US”(正确用法是 in the US)、“stuffs”(正确用法是 stuff)、“the nature”(作“大自然”时正确用法是 nature,没有 the)、“infos”、“techs”、“softwares”等错误用法。
这是由于应试者在备考时往往只是背诵一个词汇表,这个表列出每个英文单词的拼写、发音和中文意思。但其是这只是对词汇的最基本的掌握;当我们要用一个单词造句时,就要求具备一些额外的知识,学术上称为“句法实现”(syntactic realization)知识;这些知识包括:一个名词是否可数(如上面的 stuff、info、software 其实就不可数)、一个动词是否及物(如笔者曾经在网上聊天时看到一个 8 岁时去美国、已经在美国呆了 10 年的中国学生打出了“emphasize on”这样的错误用法,而 emphasize 只是及物动词,不可加 on)、一个单词前面可用什么介词(如 topic 的前面往往用 on,如 give a talk on this topic)、一个单词后面可用什么介词(如动词 search 后面可跟 for 来衔接“搜索的目标”——如 searching for a cat,还可直接跟一个宾语来表示“搜索的范围”——如 searching this room)、一个单词前面是否要用冠词(如 US 作名词时前面一定要有 the,而 nature 作“大自然”时前面却不能有 the),等等。
从现实的角度,其实美国并不特别在乎这些去美国留学和工作的“第一代移民”的英语问题——毕竟,美国企业主们最关心的还是这些人的专业工作能力(而且这些人往往从事编程之类的理工职业,是天天与机器打交道的,不大需要用外语跟社会上的客户交流),而且他们的第二代自然就变成从小讲英语的了。
欲知后事如何,请看下回分解。
市场上充斥了各种外语学习产品——参考书、软件、音像制品等等,很多人把学外语的希望寄托在这些产品上。然而,笔者以一个多年研究外语学习的学者的身份,可以告诉你:这种认识是有问题的。
首先,笔者真挚地承认,市场上的每一个外语学习产品,都能多多少少提高你的外语的某个方面(如词汇、阅读、口语等等)。笔者所要指出的,不是它们在内容质量上的问题,而是人在使用这些产品的过程中会出现的一些人性方面的问题,导致这些学习方法存在天生的低效性。
让我们来审视一下,一个普通人在使用这样一个产品的过程中,会发生哪些问题:
问题 1:根本就没买。很多普罗大众对外语学习其实不是特别有热情和实际需要,再加上买了这样一个产品后必然要专门花时间去用,而很多人可能并没有这么多空闲时间或者不想把空闲时间用于这种目的,所以他们从一开始就根本没买外语学习产品。
问题 2:买了以后扔在一边。这其实是一个非常普遍的现象,而且并不局限于外语学习产品。就拿任何一本普通的书来说吧,比如一本世界名著,你在书店一时心血来潮把它买回家,然后就发现自己再也找不出时间和激情去翻开它了。事实上你的时间都用在更吸引你的活动上了:上网,玩游戏,等等。
问题 3:即使偶尔心血来潮用一下,也很快就去做别的事了,而且下次用都不知是猴年马月。这也是一种常见的结果。它可以用前面说过的“外语学习的第二定律”(即“认知耐心定律”)解释:人做一次外语学习活动的持续耐心是很有限的。
这些问题又可以总结为两点,一是“启动成本高”——很多人只有心血来潮时才会买一个外语学习产品,买回家后只有偶尔心血来潮时才会去用一下,也就是说,他们“启动”一次外语学习活动的难度很高(也就是“成本很高”);二是“单次持续时间短”——也就是说,很多人即使偶尔心血来潮启动了一次外语学习活动,由于受到“外语学习第二定律”(耐心定律)的制约,一次活动持续不了多久。
启动频率低,再加上每次持续时间短,做个乘法,你就知道外语学习的时间总量不会大,这就是这些产品实际上往往缺乏成效的原因。
反之,一个真正高效的外语学习法,必然能用某种手段,来改善“启动成本”,或者改善“单次持续时间”,或者两者都改善,从而提高外语学习的时间总量。由于“第二定律”的限制,“单次持续时间”其实是不可能有很大改善的;也就是说,我们最好在“启动成本”上做文章。本书即将揭示的世界最强外语学习法,正是做到了这一点。
欲知后事如何,请看下回分解。
相对于参考书、软件、音像制品等等需要用户本人在学习态度上“采取主动”的学习方法(即用户需要常常主动从百忙中抽身,去用这些产品),很多人倾向于一种“被动”的学习方法——上学校里的外语课和参加各种校外的培训班,让教师掌握主导权,就像跟着导游游览一个城市一样。
中小学阶段的课堂外语教学的确是有必要的——它能为你打下基本的外语基础;但无论是校内还是校外的外语课,都有三大问题:
问题 1:课时有限。我们在学校里每周接受外语课的时间总量是很少的,就算每天一节 45 分钟的外语课吧,一周五个工作日也总共只有 4.5 小时;你想,我们小时候学母语时是在生活中每时每刻都可能出现语言学习的机会,外国人学他们的母语(对我们来说是外语)当然也是这样,而如果我们只用每周 4.5 小时去学外语,自然离外国人讲外语的水平十分遥远。参加校外的外语培训班可以让我们增加一些额外的每周学习时间,但这种增加也十分有限,而且往往意味着不小的培训费用。一个理想的外语学习法,应该用一种巧妙的方式,在我们平时的生活中制造外语学习机会,让我们跳出每周 4.5 小时的可怜的时间局限。
问题 2:内容范围有限。外语课的内容范围受到了两个因素的限制。第一个因素就是上面说的“课时有限”——在每周有限的课堂时间(4.5 小时)里,我们学到的外语内容量自然就十分有限。第二个因素是,很多课堂时间往往被用来反复练习旧内容,而不是学习新内容。尤其是,教学大纲往往将每个年级的词汇量限制在一个固定范围内,而我们在外语课上常常做的“阅读理解”训练,就是阅读大量几乎仅仅由这些“大纲词汇”写成的故事,通过这些故事我们学到的新词汇几乎为零。这就好像我们反复在一个小游泳池里练习游泳,对这个游泳池的每个角落都很熟悉,但我们没有机会到更广阔的水域如海洋里去见识更丰富的风光。
问题 3:课程时间不灵活,单节课持续过久,都影响学习热情。一方面,尤其是校外的外语培训课程,它的课程时间是预先固定下来的,学员必须为了适应这种安排而重新调整自己的生活规划,有时甚至还要放弃一些其它活动,这些矛盾就可能导致对外语的负面情绪。另一方面,我们前面说过的“外语学习第二定律”告诉我们,人每次持续一段外语学习活动的耐心是有限的;其实,一个理想的外语学习法,它每次让人接受学习的时间应该不超过 5 分钟,以免累积越来越高的抵触情绪,而通常的一节外语课往往持续 45 分钟到 1 个小时,这其实已经对人的耐心造成了一定的挑战。
本书即将揭开的“最强外语学习法”,由于设计上的优越性,从一开始就不存在上述的种种问题。
欲知后事如何,请看下回分解。
在前几回中,笔者介绍了外语学习的几个定律和一些误区,使你初步具备了对形形色色的外语学习法的品鉴能力;而从本回开始,我们终于可以开始了解“世界最强外语学习法”的前世今生、来龙去脉了!
一切都还得从 1960 年代美国一个叫 Robins Burling 的语言学家兼人类学家说起。
话说这 Burling 对于人类学语言(无论是母语还是外语)的过程很感兴趣。有一回,他看到耶鲁大学出版社出版的一套《学中文》(Learning Chinese)系列教材。这是一套教西方人学中文的教材,分为两部分,第一部分是教西方人学会拼音写成的中文单词、句子乃至整篇文章,第二部分才开始教汉字。
这套教材教汉字的方式十分特别。首先,就像上面说的,学完教材第一部分的西方人,已经能看懂一篇全部由拼音写成的中文文章了,如:
Liǎng zhī lǎohǔ, liǎng zhī lǎohǔ, pǎo de kuài, pǎo de kuài.
Yì zhī méiyǒu ěrduō, yì zhī méiyǒu wěibā, zhēn qíguài, zhēn qíguài.
于是,教材的第二部分,就从这样一篇全部由拼音写成的文章入手,慢慢将新的汉字代换到拼音文章里,使读者逐渐学到越来越多的汉字:
两 zhī lǎohǔ, 两 zhī lǎohǔ, pǎo de kuài, pǎo de kuài.
一 zhī méiyǒu ěrduō, 一 zhī méiyǒu wěibā, zhēn qíguài, zhēn qíguài.
在这里,笔者要提醒大家注意:事实上,用一个新汉字完全替换原来的拼音(就像上面这样)前,最好有一个“过渡”的阶段,就是汉字和拼音对照、并存:
Liǎng (两) zhī lǎohǔ, liǎng (两) zhī lǎohǔ, pǎo de kuài, pǎo de kuài.
Yì (一) zhī méiyǒu ěrduō, yì (一) zhī méiyǒu wěibā, zhēn qíguài, zhēn qíguài.
因为,这样便于让学习者(学中文的西方人)知道一个新的汉字的读音和意思,省得他自己去查汉字字典。这也就是我们前面说过的“外语学习的第三定律”(双语内容定律)所说的——只有通过双语对照才能学会新的语言内容。
话说 Burling 看到这样一种学汉字的方法,觉得十分新奇而且有潜力,因为在一篇很长的拼音文章里,只要零星地出现汉字(就像上面的例子所示),就能让西方人以一种轻松的节奏,来学到越来越多的汉字。这比起一上来就学整篇课文的所有汉字,显然要轻松多了。
于是 Burling 就想,这样一种“拼音中夹着汉字来教汉字”的方法,能不能应用到学一门外语上来呢?例如,如果一个美国人要学法语,教师能否准备一篇全英文的文章,但把这文章中的少许英文单词换成对应的法语单词,来让这个美国人逐渐学到越来越多的法语单词?
欲知后事如何,请看下回分解。
上回说到,1960 年代美国语言学家 Robins Burling 从一套《学中文》教材得到启发,产生了“在一篇母语文章中故意夹带少许外语词汇来教外语”的设想。他说干就干,做了一些教学实验,发表成一篇论文《关于外语教学的一些非同寻常的提议》(Some Outlandish Proposals for the Teaching of Foreign Languages)。这篇论文就成了这个全新研究领域的开山之作。
让我们来看一个“Burling 式读本”的实例——就以风靡全球的《哈利·波特与魔法石》的开头为素材吧!
家住女贞路 4 号的德思礼夫妇总是得意地说他们是非常规矩的人家,拜托 ,拜托了。他们从来跟神秘古怪的事不沾边,因为他们根本不相信那些邪门歪道。
弗农·德思礼先生在一家名叫格朗宁的公司做主管,公司生产钻机。他高大魁梧,胖得几乎连脖子 (neck /nek/) 都没有了,却蓄着一脸大胡子。德思礼太太是一个瘦削的金发女人。她的 neck 几乎比正常人长一倍。这样每当她花许多时间隔着篱墙引颈而望、窥探左邻右舍时,她的长 neck 可就派上了大用场。德思礼夫妇有一个小儿子,名叫达力。在他们看来,人世间没有比达力更好的孩子了。
德思礼一家什么都不缺,但他们拥有一个秘密,他们最害怕的就是这秘密会被人发现。他们想,一旦有人发现波特一家的事,他们会承受不住的。波特太太是德思礼太太的妹妹 (younger sister /ˈjʌŋɡər ˈsɪstər/),不过她们已经有好几年不见面了。实际上,德思礼太太佯装自己根本没有这么个 sister,因为她 sister 和她那一无是处的妹夫与德思礼一家的为人处世完全不一样。一想到邻居们会说波特夫妇来到了,德思礼夫妇会吓得胆战心惊。他们知道波特也有个儿子,只是他们从来没有见过。这孩子也是他们不与波特夫妇来往的一个很好的借口,他们不愿让达力跟这种孩子厮混。
我们看到,在上面第二段里,“脖子”第一次出现时,后面注明了对应的英文 neck 以及发音;“脖子”第二和第三次出现时,则完全被对应的英文 neck 替代。同样,在第三段里,“妹妹”的三次出现也被做了类似的处理。
设想一下,以这种从容不迫的外语词汇教学节奏,当一个中国人读完整本《哈利·波特与魔法石》时,他必然就掌握了数量可观的外语词汇,而且这个学习过程始终是在轻松愉快的环境——母语阅读——中进行的。
国际学术界对 Burling 开创的这种外语学习方法没有统一的命名。Burling 本人将这种读本称为“双语读本”(diglot reader),其它称呼则包括“语码转换”(code switching)、“双语编织”(diglot weave)、“双语教学法”(bilingual method)、“混合语文”(mixed texts)等等。笔者认为用“双语”(bilingual/diglot)一词来命名这个方法是不明确的,因为“双语”其实有两种意思,一个是“双语对照”(就是用两种语言把一篇文章各写一遍,如我们在书店看到的中英对照的世界名著),一个是“双语切换”(就是一个人在用一种语言时突然在中间夹带了另一种语言的一个元素,如上例中的“她的 neck 几乎比正常人长一倍”)。很显然,Burling 方法是“双语切换”而非“双语对照”。因此,笔者建议不用“双语”这个意义含糊的词,而用“Burling 式读本”来命名这种方法。本书往后一律用这个称呼。
自从 Burling 在 1960 年代首次发表该方法的半个世纪以来,“Burling 式读本”在外语教学研究界一直有一定的支持者,以纸质书、电子书、录音磁带、视频光盘等各种媒体形式制作的 Burling 式外语教学内容也一直在外语教学产品市场上占有一席之地。例如,在西方,PowerGlide (www.power-glide.com) 这个网站就销售一些 Burling 式的互动式电子书,主要是供西方人学习另一门欧洲语言;在东方,纪玉华和许其潮教授制作了一系列 Burling 式的视频光盘如《三只小猪进阶英语》,用“讲故事并且在故事中夹带外语单词”的形式,教中国儿童学一些基础英语。
(未写完)
欲知后事如何,请看下回分解。
上回说到,1960 年代美国语言学家 Robins Burling 从一套《学中文》教材得到启发,产生了“在一篇母语文章中故意夹带少许外语词汇来教外语”的设想。他说干就干,做了一些教学实验,发表成一篇论文《关于外语教学的一些非同寻常的提议》(Some Outlandish Proposals for the Teaching of Foreign Languages)。这篇论文就成了这个全新研究领域的开山之作。
让我们来看一个“Burling 式读本”的实例——就以风靡全球的《哈利·波特与魔法石》的开头为素材吧!
家住女贞路 4 号的德思礼夫妇总是得意地说他们是非常规矩的人家,拜托 ,拜托了。他们从来跟神秘古怪的事不沾边,因为他们根本不相信那些邪门歪道。
弗农·德思礼先生在一家名叫格朗宁的公司做主管,公司生产钻机。他高大魁梧,胖得几乎连脖子 (neck /nek/) 都没有了,却蓄着一脸大胡子。德思礼太太是一个瘦削的金发女人。她的 neck 几乎比正常人长一倍。这样每当她花许多时间隔着篱墙引颈而望、窥探左邻右舍时,她的长 neck 可就派上了大用场。德思礼夫妇有一个小儿子,名叫达力。在他们看来,人世间没有比达力更好的孩子了。
德思礼一家什么都不缺,但他们拥有一个秘密,他们最害怕的就是这秘密会被人发现。他们想,一旦有人发现波特一家的事,他们会承受不住的。波特太太是德思礼太太的妹妹 (younger sister /ˈjʌŋɡər ˈsɪstər/),不过她们已经有好几年不见面了。实际上,德思礼太太佯装自己根本没有这么个 sister,因为她 sister 和她那一无是处的妹夫与德思礼一家的为人处世完全不一样。一想到邻居们会说波特夫妇来到了,德思礼夫妇会吓得胆战心惊。他们知道波特也有个儿子,只是他们从来没有见过。这孩子也是他们不与波特夫妇来往的一个很好的借口,他们不愿让达力跟这种孩子厮混。
我们看到,在上面第二段里,“脖子”第一次出现时,后面注明了对应的英文 neck 以及发音;“脖子”第二和第三次出现时,则完全被对应的英文 neck 替代。同样,在第三段里,“妹妹”的三次出现也被做了类似的处理。
设想一下,以这种从容不迫的外语词汇教学节奏,当一个中国人读完整本《哈利·波特与魔法石》时,他必然就掌握了数量可观的外语词汇,而且这个学习过程始终是在轻松愉快的环境——母语阅读——中进行的。
国际学术界对 Burling 开创的这种外语学习方法没有统一的命名。Burling 本人将这种读本称为“双语读本”(diglot reader),其它称呼则包括“语码转换”(code switching)、“双语编织”(diglot weave)、“双语教学法”(bilingual method)、“混合语文”(mixed texts)等等。笔者认为用“双语”(bilingual/diglot)一词来命名这个方法是不明确的,因为“双语”其实有两种意思,一个是“双语对照”(就是用两种语言把一篇文章各写一遍,如我们在书店看到的中英对照的世界名著),一个是“双语切换”(就是一个人在用一种语言时突然在中间夹带了另一种语言的一个元素,如上例中的“她的 neck 几乎比正常人长一倍”)。很显然,Burling 方法是“双语切换”而非“双语对照”。因此,笔者建议不用“双语”这个意义含糊的词,而用“Burling 式读本”来命名这种方法。本书往后一律用这个称呼。
自从 Burling 在 1960 年代首次发表该方法的半个世纪以来,“Burling 式读本”在外语教学研究界一直有一定的支持者;而在外语教学产品市场上,以纸质书、电子书、录音磁带、视频光盘等各种媒体形式制作的 Burling 式外语教学内容也始终占有一席之地。例如,在西方,PowerGlide (www.power-glide.com) 这个网站就销售一些 Burling 式的互动式电子书,主要是供西方人学习另一门欧洲语言;在东方,纪玉华和许其潮教授制作了一系列 Burling 式的视频光盘如《三只小猪进阶英语》,用“讲故事并且在故事中夹带外语单词”的形式,教中国儿童学一些基础英语。
然而,Burling 式读本也有一些局限性,使它离世界最理想外语学习法仍有一段距离:
需要用户主动从生活中抽身,去阅读一段与当前生活无关的内容。这其实就是本书第七回《误区:买了外语参考书/软件/音像产品就 OK》所说的,无论你有多么好的外语教学法,当你把这个方法做成一个独立的图书、软件或者音像制品时,你就需要用户主动从他的生活百忙中抽身,从他生活中的一切吸引人的娱乐(如上网、玩游戏、看电视等等)中抽身,从看电视的舒适的沙发上站起来,艰难地走向你那本图书(或者其它形式的教学产品),不情愿地打开它,读下去。这种产品一与用户的当前生活无关,二不能像游戏一样给用户带来快感,还需要用户有很大的自律性、自觉性、主动性从他当前的事务或娱乐中抽身——可以说,不管内容多么有效的教学产品,一旦做成这种与用户生活脱节的形式,它的实际使用效果就已经骤降 95%。
当母语和外语混合在一起时,语法结构上的不相容会导致种种问题。这也是为什么 Burling 方法虽然已经问世 50 多年却一直被很多外语教育家诟病、没有成为一种主流的外语教学方法的原因。什么是“语法结构上的不相容”?让我们来看一个简单的例子:中文“买你一个苹果”和英文“buy you an apple”,虽然单词的顺序完全一样,但意思却大不一样:前者是“从你那里买苹果”,后者是“买苹果送给你”。这就是说,中文动词“买”和英文动词“buy”的“短语结构”(phrase structure)是不同的,前者的短语结构是“买 <销售者> <商品>”(如“买你一个苹果”),后者的短语结构是“buy <受益者> <商品>”(如“buy you an apple”)。那么,如果我们用 Burling 的方法,故意把中文“买你一个苹果”中的“买”置换成英文“buy”,成了“buy 你一个苹果”,那么这句话应该按前面哪种短语结构解释呢?是“从你那里买一个苹果”,还是“买一个苹果送给你”?可想而知,如此的双语混合,会导致理解上的混乱。有的人会说,那么如果我们把原句“买你一个苹果”改写成“buy 一个苹果 from 你”,意思不就清楚了?对,这样意思的确是清楚了,但同时我们也把句子的主体结构(backbone)完全改成了外语式的,改得面目全非;想象一下,当一个读者看一篇中文文章时,他看到的句子本来都是中文式的主体结构,却突然遇到一句“buy 一个苹果 from 你”这样的结构反常的句子,这必然会对他的认知带来一定困扰,对他的阅读情绪也会造成负面影响。
同一本 Burling 式读本无法满足不同外语水平的学习者的需要。就拿本回开头的“哈利·波特”的例子来说吧,这个例子教读者“neck”和“younger sister”。但如果读者的外语水平已经远远超过了这两个单词(短语)了呢?也就是说,同一本 Buring 式读本,无法满足不同词汇量的学习者的需要。当然,理论上,我们可以针对不同词汇量的读者,编写不同词汇水平的 Burling 式读本,如《哈利·波特与魔法石:初级 Burling 读本》、《哈利·波特与魔法石:中级 Burling 读本》和《哈利·波特与魔法石:高级 Burling 读本》。但这种划分仍然是比较粗糙的;理想的外语教学法应该对一个学习者的词汇水平做一个比较精确的测量,然后提供量身定制的(personalized)的外语教学。
但传统的 Burling 方法毕竟为后来进一步的改进——直至“世界最强外语学习法”——打下了基础,就像莱特兄弟原始粗糙的第一架飞机是所有当代舒适航空的先驱一样。
欲知后事如何,请看下回分解。
上回说到,1960 年代美国语言学家 Robins Burling 从一套《学中文》教材得到启发,产生了“在一篇母语文章中故意夹带少许外语词汇来教外语”的设想。他说干就干,做了一些教学实验,发表成一篇论文《关于外语教学的一些非同寻常的提议》(Some Outlandish Proposals for the Teaching of Foreign Languages)。这篇论文就成了这个全新研究领域的开山之作。
让我们来看一个“Burling 式读本”的实例——就以风靡全球的《哈利·波特与魔法石》的开头为素材吧!
家住女贞路 4 号的德思礼夫妇总是得意地说他们是非常规矩的人家,拜托 ,拜托了。他们从来跟神秘古怪的事不沾边,因为他们根本不相信那些邪门歪道。
弗农·德思礼先生在一家名叫格朗宁的公司做主管,公司生产钻机。他高大魁梧,胖得几乎连脖子 (neck /nek/) 都没有了,却蓄着一脸大胡子。德思礼太太是一个瘦削的金发女人。她的 neck 几乎比正常人长一倍。这样每当她花许多时间隔着篱墙引颈而望、窥探左邻右舍时,她的长 neck 可就派上了大用场。德思礼夫妇有一个小儿子,名叫达力。在他们看来,人世间没有比达力更好的孩子了。
德思礼一家什么都不缺,但他们拥有一个秘密,他们最害怕的就是这秘密会被人发现。他们想,一旦有人发现波特一家的事,他们会承受不住的。波特太太是德思礼太太的妹妹 (younger sister /ˈjʌŋɡər ˈsɪstər/),不过她们已经有好几年不见面了。实际上,德思礼太太佯装自己根本没有这么个 sister,因为她 sister 和她那一无是处的妹夫与德思礼一家的为人处世完全不一样。一想到邻居们会说波特夫妇来到了,德思礼夫妇会吓得胆战心惊。他们知道波特也有个儿子,只是他们从来没有见过。这孩子也是他们不与波特夫妇来往的一个很好的借口,他们不愿让达力跟这种孩子厮混。
我们看到,在上面第二段里,“脖子”第一次出现时,后面注明了对应的英文 neck 以及发音;“脖子”第二和第三次出现时,则完全被对应的英文 neck 替代。同样,在第三段里,“妹妹”的三次出现也被做了类似的处理。
设想一下,以这种从容不迫的外语词汇教学节奏,当一个中国人读完整本《哈利·波特与魔法石》时,他必然就掌握了数量可观的外语词汇,而且这个学习过程始终是在轻松愉快的环境——母语阅读——中进行的。更赞的是,改进后的 Burling 方法不仅能教外语词汇,也能教外语语法——这将在后面的章回里介绍。
上回说到,1960 年代美国语言学家 Robins Burling 从一套《学中文》教材得到启发,产生了“在一篇母语文章中故意夹带少许外语词汇来教外语”的设想。他说干就干,做了一些教学实验,发表成一篇论文《关于外语教学的一些非同寻常的提议》(Some Outlandish Proposals for the Teaching of Foreign Languages)。这篇论文就成了这个全新研究领域的开山之作。
让我们来看一个“Burling 式读本”的实例——就以风靡全球的《哈利·波特与魔法石》的开头为素材吧!
家住女贞路 4 号的德思礼夫妇总是得意地说他们是非常规矩的人家,拜托 ,拜托了。他们从来跟神秘古怪的事不沾边,因为他们根本不相信那些邪门歪道。
弗农·德思礼先生在一家名叫格朗宁的公司做主管,公司生产钻机。他高大魁梧,胖得几乎连脖子 (neck /nek/) 都没有了,却蓄着一脸大胡子。德思礼太太是一个瘦削的金发女人。她的 neck 几乎比正常人长一倍。这样每当她花许多时间隔着篱墙引颈而望、窥探左邻右舍时,她的长 neck 可就派上了大用场。德思礼夫妇有一个小儿子,名叫达力。在他们看来,人世间没有比达力更好的孩子了。
德思礼一家什么都不缺,但他们拥有一个秘密,他们最害怕的就是这秘密会被人发现。他们想,一旦有人发现波特一家的事,他们会承受不住的。波特太太是德思礼太太的妹妹 (younger sister /ˈjʌŋɡər ˈsɪstər/),不过她们已经有好几年不见面了。实际上,德思礼太太佯装自己根本没有这么个 sister,因为她 sister 和她那一无是处的妹夫与德思礼一家的为人处世完全不一样。一想到邻居们会说波特夫妇来到了,德思礼夫妇会吓得胆战心惊。他们知道波特也有个儿子,只是他们从来没有见过。这孩子也是他们不与波特夫妇来往的一个很好的借口,他们不愿让达力跟这种孩子厮混。
我们看到,在上面第二段里,“脖子”第一次出现时,后面注明了对应的英文 neck 以及发音;“脖子”第二和第三次出现时,则完全被对应的英文 neck 替代。同样,在第三段里,“妹妹”的三次出现也被做了类似的处理。
设想一下,以这种从容不迫的外语词汇教学节奏,当一个中国人读完整本《哈利·波特与魔法石》时,他必然就掌握了数量可观的外语词汇,而且这个学习过程始终是在轻松愉快的环境——母语阅读——中进行的。更赞的是,Burling 方法(特别是经过改进以后)不仅能教外语词汇,也能教外语语法——这将在后面的章回里介绍。
国际学术界对 Burling 开创的这种外语学习方法没有统一的命名。Burling 本人将这种读本称为“双语读本”(diglot reader),其它称呼则包括“语码转换”(code switching)、“双语编织”(diglot weave)、“双语教学法”(bilingual method)、“混合语文”(mixed texts)等等。笔者认为用“双语”(bilingual/diglot)一词来命名这个方法是不明确的,因为“双语”其实有两种意思,一个是“双语对照”(就是用两种语言把一篇文章各写一遍,如我们在书店看到的中英对照的世界名著),一个是“双语切换”(就是一个人在用一种语言时突然在中间夹带了另一种语言的一个元素,如上例中的“她的 neck 几乎比正常人长一倍”)。很显然,Burling 方法是“双语切换”而非“双语对照”。因此,笔者建议不用“双语”这个意义含糊的词,而用“Burling 式读本”来命名这种方法。本书往后一律用这个称呼。
自从 Burling 在 1960 年代首次发表该方法的半个世纪以来,“Burling 式读本”在外语教学研究界一直有一定的支持者;而在外语教学产品市场上,以纸质书、电子书、录音磁带、视频光盘等各种媒体形式制作的 Burling 式外语教学内容也始终占有一席之地。例如,在西方,PowerGlide (www.power-glide.com) 这个网站就销售一些 Burling 式的互动式电子书,主要是供西方人学习另一门欧洲语言;在东方,纪玉华和许其潮教授制作了一系列 Burling 式的视频光盘如《三只小猪进阶英语》,用“讲故事并且在故事中夹带外语单词”的形式,教中国儿童学一些基础英语。
然而,Burling 式读本也有一些局限性,使它离世界最理想外语学习法仍有一段距离:
一本 Burling 式读本的故事内容可能并不令用户感兴趣。就以本回开头的《哈利·波特与魔法石》为例,我们不能不承认,有很多人对这类奇幻文学故事是不感兴趣的;如果他们连这个故事本身都不想看,那么基于这个故事的 Burling 式外语教学内容就没有机会进入到他们的视野了。
需要用户主动从生活中抽身,去阅读一段与当前生活无关的内容。这其实就是本书第七回《误区:买了外语参考书/软件/音像产品就 OK》所说的,无论你有多么好的外语教学法,当你把这个方法做成一个独立的图书、软件或者音像制品时,你就需要用户主动从他的生活百忙中抽身,从他生活中的一切吸引人的娱乐(如上网、玩游戏、看电视等等)中抽身,从看电视的舒适的沙发上站起来,艰难地走向你那本图书(或者其它形式的教学产品),不情愿地打开它,读下去。这种产品一与用户的当前生活无关,二不能像游戏那么给用户带来快感,因此需要用户有很大的自律性、自觉性、主动性从他当前的事务或娱乐中抽身——可以说,不管内容多么有效的教学产品,一旦做成这种与用户生活脱节的形式,它的实际使用效果就已经骤降 95%。
当母语和外语混合在一起时,语法结构上的不相容会导致种种问题。这也是为什么 Burling 方法虽然已经问世 50 多年却一直被很多外语教育家诟病、没有成为一种主流的外语教学方法的原因。什么是“语法结构上的不相容”?让我们来看一个简单的例子:中文“买你一个苹果”和英文“buy you an apple”,虽然单词的顺序完全一样,但意思却大不一样:前者是“从你那里买苹果”,后者是“买苹果送给你”。这就是说,中文动词“买”和英文动词“buy”的“短语结构”(phrase structure)是不同的,前者的短语结构是“买 <销售者> <商品>”(如“买你一个苹果”),后者的短语结构是“buy <受益者> <商品>”(如“buy you an apple”)。那么,如果我们用 Burling 的方法,故意把中文“买你一个苹果”中的“买”置换成英文“buy”,成了“buy 你一个苹果”,那么这句话应该按前面哪种短语结构解释呢?是“从你那里买一个苹果”,还是“买一个苹果送给你”?可想而知,如此的双语混合,会导致理解上的混乱。有的人会说,那么如果我们把原句“买你一个苹果”改写成“buy 一个苹果 from 你”,意思不就清楚了?对,这样意思的确是清楚了,但同时我们也把句子的主体结构(backbone)完全改成了外语式的,改得面目全非;想象一下,当一个读者看一篇中文文章时,他看到的句子本来都是中文式的主体结构,却突然遇到一句“buy 一个苹果 from 你”这样的结构反常的句子,这必然会对他的认知带来一定困扰,对他的阅读情绪也会造成负面影响。(在后面的章回里,笔者会介绍改进后的方法,以更好地教授外语语法。)
同一本 Burling 式读本无法满足不同外语水平的学习者的需要。就拿本回开头的“哈利·波特”的例子来说吧,这个例子教读者“neck”和“younger sister”,但如果读者的外语水平已经远远超过了这两个单词(短语)了呢?也就是说,同一本 Buring 式读本,无法满足不同词汇量的学习者的需要。当然,理论上,我们可以针对不同词汇量的读者,编写不同词汇水平的 Burling 式读本,如《哈利·波特与魔法石:初级 Burling 读本》、《哈利·波特与魔法石:中级 Burling 读本》和《哈利·波特与魔法石:高级 Burling 读本》。但这种划分仍然是比较粗糙的;理想的外语教学法应该对一个学习者的词汇水平做一个比较精确的测量,然后提供量身定制(personalized)的外语教学。
上回以《哈利·波特与魔法石》为例,介绍了“Burling 式读本”这种“在母语阅读中引入外语教学”的外语教学法。一方面,Burling 方法是划时代的,有无与伦比的优势:它能让学习者在一种轻松愉快的活动——母语阅读——中从容不迫、甚至不知不觉地认识越来越多的外语元素,将“外语”这一“大数据挑战 ”化整为零、各个击破;但另一方面,在上回的结尾,我们也指出人工编写的“Burling 式读本”仍然存在一些问题,其中又以第一和第二个问题最为重大:
一本 Burling 式读本的故事内容可能并不令用户感兴趣。就以本回开头的《哈利·波特与魔法石》为例,我们不能不承认,有很多人对这类奇幻文学故事是不感兴趣的;如果他们连这个故事本身都不想看,那么基于这个故事的 Burling 式外语教学内容就没有机会进入到他们的视野了。
需要用户主动从生活中抽身,去阅读一段与当前生活无关的内容。这其实就是本书第七回《误区:买了外语参考书/软件/音像产品就 OK》所说的,无论你有多么好的外语教学法,当你把这个方法做成一个独立的图书、软件或者音像制品时,你就需要用户主动从他的生活百忙中抽身,从他生活中的一切吸引人的娱乐(如上网、玩游戏、看电视等等)中抽身,从看电视的舒适的沙发上站起来,艰难地走向你那本图书(或者其它形式的教学产品),不情愿地打开它,读下去。这种产品一与用户的当前生活无关,二不能像游戏那么给用户带来快感,因此需要用户有很大的自律性、自觉性、主动性从他当前的事务或娱乐中抽身——可以说,不管内容多么有效的教学产品,一旦做成这种与用户生活脱节的形式,它的实际使用效果就已经骤降 95%。
那么,有没有办法解决这两个问题呢?答案是肯定的!想象一下这样一种情景:当用户在网上看新闻(或者看帖子、看网络小说)时,浏览器自动对这个新闻(或者帖子、网络小说)做“Burling 式处理”——围绕这个母语新闻中的少量母语单词,显示相应的外语教学内容,如下图所示:
(图)
我们把这种情景称为 Burling 方法的自动化;它与前面介绍的“人工编写的 Burling 式读本”最主要的区别在于,“Burling 式读本”是基于某个特定的母语读物(如《哈利·波特与魔法石》)来提供外语教学,而“Burling 方法的自动化”总是基于“用户正在关注的母语信息”(如用户正在浏览的一个母语新闻)来提供外语教学。这就带来了两个优势:
Burling 自动化的优势一:总是基于用户感兴趣的信息来提供外语教学。这是因为 Burling 自动化的母语文本是用户正在浏览的母语网页,而用户正在浏览的显然就是用户感兴趣的(否则用户不会去浏览它)。这就自然解决了上述关于 Burling 式读本的第一大问题——“一本 Burling 式读本的故事内容可能并不令用户感兴趣”。
Burling 自动化的优势二:总是与用户当前的生活相结合。这是因为 Burling 自动化发生时,用户正在做的事就是在浏览一个母语网页,而 Burling 自动化就发生在这个母语网页中,因此它不需要用户从当前活动(浏览母语网页)中抽身。这就自然解决了上述关于 Burling 式读本的第二大问题——“需要用户主动从生活中抽身,去阅读一段与当前生活无关的内容”。
另外,由于 Burling 自动化是计算机动态从当前母语网页中选择母语单词来实施相应的外语教学,理论上计算机就可以优先选择那些用户没学过对应外语的母语单词:
Burling 自动化的优势三:可以根据用户已有的词汇量进行量身定制(personalized)的外语教学。计算机可以事先比较精确地测定用户已有的词汇量,然后在当前母语网页中优先选择那些用户没学过对应外语的母语单词来进行外语教学。
综上所述,Burling 自动化是 Burling 式外语教学法的正确发展方向;甚至可以说,在所有外语教学方法中,Burling 自动化都代表着最先进的生产力,因为它能在服从本书所说“外语学习的三大定律”的同时,在日常生活中充分制造学习机会,将学习效率最大化。
而 Burling 自动化的具体系统设计,又经历了四代的演进。欲知详情,请看下回分解。
上回以《哈利·波特与魔法石》为例,介绍了“Burling 式读本”这种“在母语阅读中引入外语教学”的外语教学法。一方面,Burling 方法是划时代的,有无与伦比的优势:它能让学习者在一种轻松愉快的活动——母语阅读——中从容不迫、甚至不知不觉地认识越来越多的外语元素,将“外语”这一“大数据挑战”化整为零、各个击破;但另一方面,在上回的结尾,我们也指出人工编写的“Burling 式读本”仍然存在一些问题,其中又以第一和第二个问题最为重大:
一本 Burling 式读本的故事内容可能并不令用户感兴趣。就以上回的《哈利·波特与魔法石》为例,我们不能不承认,有很多人对这类奇幻文学故事是不感兴趣的;如果他们连这个故事本身都不想看,那么基于这个故事的 Burling 式外语教学内容就没有机会进入到他们的视野了。
需要用户主动从生活中抽身,去阅读一段与当前生活无关的内容。这其实就是本书第七回《误区:买了外语参考书/软件/音像产品就 OK》所说的,无论你有多么好的外语教学法,当你把这个方法做成一个独立的图书、软件或者音像制品时,你就需要用户主动从他的生活百忙中抽身,从他生活中的一切吸引人的娱乐(如上网、玩游戏、看电视等等)中抽身,从看电视的舒适的沙发上站起来,艰难地走向你那本图书(或者其它形式的教学产品),不情愿地打开它,读下去。这种产品一与用户的当前生活无关,二不能像游戏那么给用户带来快感,因此需要用户有很大的自律性、自觉性、主动性从他当前的事务或娱乐中抽身——可以说,不管内容多么有效的教学产品,一旦做成这种与用户生活脱节的形式,它的实际使用效果就已经骤降 95%。
那么,有没有办法解决这两个问题呢?答案是肯定的!想象一下这样一种情景:当用户在网上看新闻(或者看帖子、看网络小说)时,浏览器自动对这个新闻(或者帖子、网络小说)做“Burling 式处理”——围绕这个母语新闻中的少量母语单词,显示相应的外语教学内容,如下图所示:
上回以《哈利·波特与魔法石》为例,介绍了“Burling 式读本”这种“在母语阅读中引入外语教学”的外语教学法。一方面,Burling 方法是划时代的,有无与伦比的优势:它能让学习者在一种轻松愉快的活动——母语阅读——中从容不迫、甚至不知不觉地认识越来越多的外语元素,将“外语”这一“大数据挑战”化整为零、各个击破;但另一方面,在上回的结尾,我们也指出人工编写的“Burling 式读本”仍然存在一些问题,其中又以第一和第二个问题最为重大:
一本 Burling 式读本的故事内容可能并不令用户感兴趣。就以上回的《哈利·波特与魔法石》为例,我们不能不承认,有很多人对这类奇幻文学故事是不感兴趣的;如果他们连这个故事本身都不想看,那么基于这个故事的 Burling 式外语教学内容就没有机会进入到他们的视野了。
需要用户主动从生活中抽身,去阅读一段与当前生活无关的内容。这其实就是本书第七回《误区:买了外语参考书/软件/音像产品就 OK》所说的,无论你有多么好的外语教学法,当你把这个方法做成一个独立的图书、软件或者音像制品时,你就需要用户主动从他的生活百忙中抽身,从他生活中的一切吸引人的娱乐(如上网、玩游戏、看电视等等)中抽身,从看电视的舒适的沙发上站起来,艰难地走向你那本图书(或者其它形式的教学产品),不情愿地打开它,读下去。这种产品一与用户的当前生活无关,二不能像游戏那么给用户带来快感,因此需要用户有很大的自律性、自觉性、主动性从他当前的事务或娱乐中抽身——可以说,不管内容多么有效的教学产品,一旦做成这种与用户生活脱节的形式,它的实际使用效果就已经骤降 95%。
那么,有没有办法解决这两个问题呢?答案是肯定的!想象一下这样一种情景:当用户在网上看新闻(或者看帖子、看网络小说)时,浏览器自动对这个新闻(或者帖子、网络小说)做“Burling 式处理”——围绕这个母语新闻中的少量母语单词,显示相应的外语教学内容,如下图所示:
(图)
我们把这种情景称为 Burling 方法的自动化;它与前面介绍的“人工编写的 Burling 式读本”最主要的区别在于,“Burling 式读本”是基于某个特定的母语读物(如《哈利·波特与魔法石》)来提供外语教学,而“Burling 方法的自动化”总是基于“用户正在关注的母语信息”(如用户正在浏览的一个母语新闻)来提供外语教学。这就带来了两个优势:
Burling 自动化的优势一:总是基于用户感兴趣的信息来提供外语教学。这是因为 Burling 自动化的母语文本是用户正在浏览的母语网页,而用户正在浏览的显然就是用户感兴趣的(否则用户不会去浏览它)。这就自然解决了上述关于 Burling 式读本的第一大问题——“一本 Burling 式读本的故事内容可能并不令用户感兴趣”。
Burling 自动化的优势二:总是与用户当前的生活相结合。这是因为 Burling 自动化发生时,用户正在做的事就是在浏览一个母语网页,而 Burling 自动化就发生在这个母语网页中,因此它不需要用户为了学一下外语而从当前活动(浏览母语网页)中抽身。这就自然解决了上述关于 Burling 式读本的第二大问题——“需要用户主动从生活中抽身,去阅读一段与当前生活无关的内容”。
上回说到,如果能把 Burling 的的外语教学方法“自动化”——使得“用户正在浏览什么母语网页,计算机就顺势在其中嵌入相关的外语教学内容”,将是一种理想的发展方向。
从上回的示意图看,这种自动化的构想似乎实现起来并不复杂:不就是让计算机在当前母语网页里,每隔一段距离选一个母语单词,然后在旁边开辟一个小框,显示一段跟这个母语单词有关的外语教学内容(比如告诉用户,这个母语单词对应的外语单词是什么)么?
如果让人类来做这件事,的确没什么问题。比如,假设当前母语网页上有这样一个句子:
他是一个好同志。
又假设被选中的母语单词是“同志”,那么任何一个合格的人类翻译员都可以正确地写出这样一段关于“同志”的外语教学内容:
“同志”的英语说法是 comrade。
然而,对于计算机而言,就面对着一个问题:“同志”这个词是有歧义的。一本比较完善的汉语词典会告诉你,汉语单词“同志”至少有 3 个意思:① 革命同志;② 同性恋;③ 某些年代对陌生人的一种称呼。一个人类翻译员可以一眼从“同志”所在的上下文看出应该翻译成哪个意思;但对计算机来说,这是一个至今不能完美解决的问题。在有关学术界,这个问题叫“单词词义解歧”(word sense disambiguation,简称 WSD)。
“单词词义解歧”,就成了 Burling 自动化的道路上的头等问题(事实上也是唯一一个棘手的问题)。如何处理这个问题,就先后产生了四代解法,称之为 Burling 自动化的四代模型。本回即在下面介绍第一代模型。
有些偷懒的人认为,只要把所选的母语单词(如上面的“同志”)扔给一个在线机器翻译系统(如谷歌的 Google Translate、微软的 Bing Translator、百度的“百度翻译”),然后把机器翻译的结果作为外语教学内容显示在框中即可。这种观点就是 Burling 自动化的第一代模型:机器翻译。
说到“机器翻译”,有经验的读者会联想到一些公共场所令人啼笑皆非的双语标示牌,如笔者所在城市的中央公园的湖边有块牌子“小心落水”,对应的英文写道“Take care overboard”,这英文实际上是“落水时保重”的意思,很显然是用机器翻译出来的英文。如果你从未接触过机器翻译系统,可以现在去“百度翻译”(fanyi.baidu.com)玩玩。总之,机器翻译的特点就是:机器翻译结果是不可靠的。
学习者花了很大精力去学习(learn)一个错误的外语知识,日后发现错误后就必须再花很大精力去忘记(unlearn)这条错误的知识,同时再花很大精力去重新学习(relearn)正确的知识。不可靠的机器翻译,会导致这样一波三折的“learn—unlearn—relearn”,反复浪费学习者大量精力。
这种用机器翻译实现 Burling 自动化的做法的另一个问题是,它只是直接把所选的母语单词(“同志”)扔给一个机器翻译系统,也就是说,机器翻译系统并不知道这个“同志”所在的上下文是什么。在不知道上下文的情况下,即使是人类翻译员,显然也是无法确定“同志”的具体含义的,何况是智商比人类低很多的机器?
因此,笔者从一开始就不支持用机器翻译来实现 Burling 自动化。而之所以仍然把机器翻译列为 Burling 自动化的第一代模型,是因为网上有一些现成的软件正是采用了这个模型:
Firefox 浏览器扩展程序 ming-a-ling(调用 Google Translate 机器翻译系统)
Chrome 浏览器扩展程序 Polyglot(调用 Google Translate 机器翻译系统)
Chrome 浏览器扩展程序 Mind the Word(调用 Google Translate 机器翻译系统)
Chrome 浏览器扩展程序 Language Immersion for Chrome(调用 Google Translate 机器翻译系统;已下架)
在此尤其要提一下以上列表中最后一个程序“Language Immersion for Chrome”,因为它是 2012 年由谷歌(Google)委托、由一个叫“Use All Five Inc.”的小公司开发的。信息产业巨头谷歌的参与,意味着 Burling 自动化已经受到谷歌的关注。此事更加启发了笔者发现了 Burling 自动化的第四代模型(将在后面的章回中揭示)。
否定了第一代模型以后,Burling 自动化的下一步发展路在何方?请看下回分解。
上回说到,如果能把 Burling 的的外语教学方法“自动化”——使得“用户正在浏览什么母语网页,计算机就顺势在其中嵌入相关的外语教学内容”,将是一种理想的发展方向。
从上回的示意图看,这种自动化的构想似乎实现起来并不复杂:不就是让计算机在当前母语网页里,每隔一段距离选一个母语单词,然后在旁边开辟一个小框,显示一段跟这个母语单词有关的外语教学内容(比如告诉用户,这个母语单词对应的外语单词是什么)么?
如果让人类来做这件事,的确没什么问题。比如,假设当前母语网页上有这样一个句子:
他是一个好同志。
又假设被选中的母语单词是“同志”,那么任何一个合格的人类翻译员都可以正确地写出这样一段关于“同志”的外语教学内容:
“同志”的英语说法是 comrade。
然而,对于计算机而言,就面对着一个问题:“同志”这个词是有歧义的。一本比较完善的汉语词典会告诉你,汉语单词“同志”至少有 3 个意思:① 革命同志;② 同性恋;③ 某些年代对陌生人的一种称呼。一个人类翻译员可以一眼从“同志”所在的上下文看出这个“同志”是哪个意思(即“革命同志”),然后教对应的外语(即“comrade”);但对计算机来说,判断“同志”是哪个意思,是一个至今不能完美解决的问题。在有关学术界,这个问题叫“单词词义解歧”(word sense disambiguation,简称 WSD)。
上回我们讨论了 Burling 自动化的第一代模型——机器翻译,也就是把网页中选出的母语单词(如“同志”)喂给一个机器翻译系统,翻译成用户想学的外语语种(如英语),然后把这个机器翻译结果显示在网页上的小框里,作为外语教学内容。我们也指出了这种方法的致命缺点:机器翻译的结果是不可靠的,用户学习了错误的翻译结果却茫然不知。比如,上回我们说过,“同志”可以有三种意思(① 革命同志;② 同性恋;③ 某些年代对陌生人的一种称呼),而机器翻译无法像人一样准确地根据上下文判断“同志”是哪个意思,从而也就无法针对那个意思来教外语。
于是有些人会说,既然计算机无法准确判断一个母语单词的意思,何不把所有的可能的意思都列出来,并且在每个意思后面分别显示相应的外语教学内容?如,对于“同志”,可以在框中显示如下教学内容:
① 革命同志:comrade;② 同性恋:homosexual;③ 某些年代对陌生人的一种称呼:comrade。
我们把这种想法叫做 Burling 自动化的第二代模型:词典式翻译,因为这种方法就像一部汉英词典,把一个母语单词的所有词义都列出来,并提供每个词义对应的外语说法,让用户自己找出符合上下文的那个词义,并学习对应的外语。
聪明的读者不难发现,“词典式翻译”虽然避免了第一代模型“机器翻译”的固有问题——无法准确判断词义,却带来了属于自己的新问题:
第一,让用户从多个词义中选择符合上下文的那个词义,这道手续在客观上会耗费用户额外的时间和精力,并且降低了整体学习效率。假设用户花在“选择词义”上的时间精力为 X,然后花在“学习该词义的外语”上的时间精力为 Y,那么用户真正用于学外语的“有效功率”其实只有 Y / (X + Y),因为他“选择词义”时并不在学外语,属于“无用功”。另外,用户从阅读母语网页的过程中抽空来关注框中的内容,他的这种注意力的期限(attention span)或者说“耐心”其实是非常短暂的;如果这种宝贵的“耐心”还要分出一部分去“选择词义”,对于学习效率无疑是可惜的。
第二,用户面对一串候选词义,有如面对一道多选题;在本来轻松愉快的母语网页阅读活动中竟要做“多选题”,无疑会伤害用户感情、打击学习热情。如果由于计算机的无能而迫使用户必须代替计算机来做“选择词义”这一枯燥无味的工作,用户会感到自己反而成了机器的奴隶,或者说成了一套机械化大系统中的一个零件,而非一个人性化的学习活动的主导者。
而且,显然,一个单词的可能词义越多,以上两个问题就越严重。那么,一词多义现象究竟有多普遍、多严重呢?结果超乎你想象:
对于英语这样的语言,一词多义主要怪罪于同一个单词反复被赋予新的含义。就拿 air 这个再普通不过的单词(就像“空气”一样普通)来说吧,它本是指“空气”,19 世纪下半叶无线电发明后又被赋予了“无线电播送”的含义,如 airing a show(播送一个电视剧)、you're on the air(你已经打进了本台的广播节目中),20 世纪初飞机发明后又被赋予了“航空”的含义,如 air hostess(空中小姐)、go by air(坐飞机前往)。事实上,《韦氏英语词典》对 air 光是作为名词时就有 10 类意思并进一步细分为 23 个具体词义。而像 air 这种常见词汇随着时间的演变被赋予很多新含义的现象,在英语中十分普遍,因为英语不太喜欢造专门的新词,而是借用一个旧词来指代新的含义。
对于汉语这样的语言,一词多义主要发生在“一个汉语单词对应多个外语近义词”上。现代汉语的很多单词其实是由日本人人为制造的,在制造的过程中就已经注意尽量做到“一词一义”,因此许多汉语单词看似是只有一个意思的;但当我们把一个汉语单词翻译到英语这样一种近义词发达的外语时,原来的“一个意思”往往就要分化成“多个意思”。如,《新时代汉英大词典(第二版)》对“看(kàn)”这个字列出了 9 个意思:① 用视觉去感受(如“看电视”);② 认为(如“我看这样吧”);③ 看望(如“去看朋友”);④ 看待(如“把你当客人看”);⑤ 看病(如“看急诊”);⑥ 照看(如“看小孩”);⑦ 当心(如“看车!”);⑧ 尝试(如“等等看”、“想想看”);⑨ 依赖(如“就看你的了”)。其中的第一个意思(① 用视觉去感受),从汉语本身的角度来说是一个意思,但翻译到英语时就要分成 look、see、watch 等情况,即“近义词”。这些英语近义词常常是不能互相代换的,因此在英语中实际上就是一些各自独立的词义:⒜ 看过去(look);⒝ 看到(see);⒞ 持续观看(watch)。也就是说,汉语中的“一个意思”——“① 用视觉去感受”,在翻译到英语时,就必须分裂成至少“三个意思”——“①⒜ 看过去;①⒝ 看到;①⒞ 持续观看”。许多汉语单词,就因为这个原因,从原本的单义词,变成了多义词。如,“船”这个单词一般必须分出“小船”和“大船”这两个词义来分别对应英语中的 boat 和 ship(虽然英语中也有概括 boat 和 ship 的“船舶”一词 vessel,但这个词是书面语,多出现在海事法律条文中,日常生活中少见;如汉语“看,船来了!”翻译到英语,则必须在 boat 和 ship 之间选择其一,而不能用书面语 vessel,因为这就好像“看,船舶来了!”一样可笑)。再比如,汉语单词“物质”看似一个单义词,但翻译到英语时,就分“物理上的物质”(matter)、“化学上的物质”(substance)和“社会科学上的物质”(material,如“物质女孩——material girl”)。
除了上述的两大造成一词多义的原因外,尚有其它一些原因:“比喻义”(如汉语单词“空气”,可以有“消息”这个比喻义——“放出空气来”是“放出消息”的意思),“词性变化”(如上文提到英语单词“air”可以指广播电视的播送,而这个意思本身又因为词性的变化而分成动词——“airing a show”和名词——“you're on the air”这两个更细分的意思),等等。所有这些原因都可能造成一个单词的词义数量成倍增长。
了解了一词多义现象的普遍性、复杂性、严重性,你就可以理解“词典式翻译”这种 Burling 自动化模型亦非理想——前面分析了这种模型有两个自身的新问题,而且这两个问题随着词义数量的增加而越发严重。
那么,Burling 自动化还有没有更好的发展方向?请看下回分解。
上回我们讨论了 Burling 自动化的第一代模型——机器翻译,也就是把网页中选出的母语单词(如“同志”)喂给一个机器翻译系统,翻译成用户想学的外语语种(如英语),然后把这个机器翻译结果显示在网页上的小框里,作为外语教学内容。我们也指出了这种方法的致命缺点:机器翻译的结果是不可靠的,用户学习了错误的翻译结果却茫然不知。比如,上回我们说过,“同志”可以有三种意思(① 革命同志;② 同性恋;③ 某些年代对陌生人的一种称呼),而机器翻译无法像人一样准确地根据上下文判断“同志”是哪个意思,从而也就无法针对那个意思来教外语。
于是有些人会说,既然计算机无法准确判断一个母语单词的意思,何不把所有可能的意思都列出来,并且在每个意思后面分别显示相应的外语教学内容?如,对于“同志”,可以在框中显示如下教学内容:
① 革命同志:comrade;② 同性恋:homosexual;③ 某些年代对陌生人的一种称呼:comrade。
我们把这种想法叫做 Burling 自动化的第二代模型:词典式翻译,因为这种方法就像一部汉英词典,把一个母语单词的所有词义都列出来,并提供每个词义对应的外语说法,让用户自己找出符合上下文的那个词义,并学习对应的外语。
聪明的读者不难发现,“词典式翻译”虽然避免了第一代模型“机器翻译”的固有问题——计算机无法准确判断词义,却带来了属于自己的新问题:
第一,让用户从多个词义中选择符合上下文的那个词义,这道手续在客观上会耗费用户额外的时间和精力,并且降低了整体学习效率。假设用户花在“选择词义”上的时间精力为 X,然后花在“学习该词义的外语”上的时间精力为 Y,那么用户真正用于学外语的“有效功率”其实只有 Y / (X + Y),因为他“选择词义”时并不在学外语,属于“无用功”。另外,用户从阅读母语网页的过程中抽空来关注框中的内容,他的这种注意力的持续时间(attention span)或者说“耐心”其实是非常短暂的;如果这种宝贵的“耐心”还要分出一部分去“选择词义”,对于学习效率无疑是可惜的。
第二,用户面对一串候选词义,有如面对一道多选题;在本来轻松愉快的母语网页阅读活动中竟要做“多选题”,无疑会伤害用户感情、打击学习热情。如果由于计算机的无能而迫使用户必须代替计算机来做“选择词义”这一枯燥无味的工作,用户会感到自己反而成了机器的奴隶,或者说成了一套机械化大系统中的一个零件,而非一个人性化的学习活动的主导者。
而且,显然,一个单词的可能词义越多,以上两个问题就越严重。那么,一词多义现象究竟有多普遍、多严重呢?结果超乎你想象:
对于英语这样的语言,一词多义主要怪罪于同一个单词反复被赋予新的含义。就拿 air 这个再普通不过的单词(就像“空气”一样普通)来说吧,它本是指“空气”;19 世纪下半叶无线电发明后又被赋予了“无线电播送”的含义,如 airing a show(播送一个电视剧)、you're on the air(你已经打进了本台的广播节目中);20 世纪初飞机发明后又被赋予了“航空”的含义,如 air hostess(空中小姐)、go by air(坐飞机前往)。事实上,《韦氏英语词典》对 air 光是作为名词时就有 10 大类意思并进一步细分为 23 个具体词义。而像 air 这种随着时间的演变被赋予很多新含义的例子,在英语常用词汇中十分普遍,因为英语不太喜欢造专门的新词,而是借用一个旧词来指代新的含义。
对于汉语这样的语言,一词多义主要发生在“一个汉语单词对应多个外语近义词”上。现代汉语的很多单词其实是由日本人人为制造的,在制造的过程中就已经注意尽量做到“一词一义”,因此许多汉语单词看似是只有一个意思的;但当我们把一个汉语单词翻译到英语这样一种近义词发达的外语时,原来的“一个意思”往往就要分化成“多个意思”。如,《新时代汉英大词典(第二版)》对“看(kàn)”这个字列出了 9 个意思:① 用视觉去感受(如“看电视”);② 认为(如“我看这样吧”);③ 看望(如“去看朋友”);④ 看待(如“把你当客人看”);⑤ 看病(如“看急诊”);⑥ 照看(如“看小孩”);⑦ 当心(如“看车!”);⑧ 尝试(如“等等看”、“想想看”);⑨ 依赖(如“就看你的了”)。其中的第一个意思(① 用视觉去感受),从汉语本身的角度来说是一个意思,但翻译到英语时就要分成 look、see、watch 等情况,即“近义词”。这些英语近义词常常是不能互相代换的,因此在英语中实际上就是一些各自独立的词义:⒜ 看过去(look);⒝ 看到(see);⒞ 持续观看(watch)。也就是说,汉语中的“一个意思”——“① 用视觉去感受”,在翻译到英语时,就必须分裂成至少“三个意思”——“①⒜ 看过去;①⒝ 看到;①⒞ 持续观看”。许多汉语单词,就因为这个原因,从原本的单义词,变成了多义词。如,“船”这个单词一般必须分出“小船”和“大船”这两个词义来分别对应英语中的 boat 和 ship(虽然英语中也有概括 boat 和 ship 的“船舶”一词 vessel,但这个词是书面语,多出现在海事法律条文中,日常生活中少见;如汉语“看,船来了!”翻译到英语,就必须在 boat 和 ship 之间选择其一,而不能用书面语 vessel,因为这就好像“看,船舶来了!”一样可笑)。再比如,汉语单词“物质”看似一个单义词,但翻译到英语时,就分“物理上的物质”(matter)、“化学上的物质”(substance)和“社会科学上的物质”(material,如“物质女孩——material girl”)。
除了上述的两大造成一词多义的原因外,尚有其它一些原因:“比喻义”(如汉语单词“空气”,可以有“消息”这个比喻义——“放出空气来”是“放出消息”的意思),“词性变化”(如上文提到英语单词“air”可以指广播电视的播送,而这个意思本身又因为词性的变化而分成动词义“播送”——“airing a show”和名词义“播送”——“you're on the air”这两个更细分的词义),等等。所有这些原因都可能造成一个单词的词义数量成倍增长。
第十四回:Burling 自动化的第三代模型:人力打造的智能
(This chapter is incomplete.)
第十五回:Burling 自动化的第四代模型:自然力打造的智能
(This chapter is incomplete.)
“人力打造的智能”改为“形式系统”。(也可能改为“人力打造智能系统”。)
第十四回:Burling 自动化的第三代模型:人力打造智能系统
第十五回:Burling 自动化的第四代模型:让现成数据出力
第十五回:Burling 自动化的第四代模型:用现成数据办事
上回我们讨论了 Burling 自动化的第一代模型——机器翻译,也就是把网页中选出的母语单词(如“同志”)喂给一个机器翻译系统,翻译成用户想学的外语语种(如英语),然后把这个机器翻译结果显示在网页上的小框里,作为外语教学内容。我们也指出了这种方法的致命缺点:机器翻译的结果是不可靠的,用户学习了错误的翻译结果却茫然不知。比如,上回我们说过,“同志”可以有三种意思(① 革命同志;② 同性恋;③ 某些年代对陌生人的一种称呼),而机器翻译无法像人一样准确地根据上下文判断“同志”是哪个意思,从而也就无法针对那个意思来教外语。
于是有些人会说,既然计算机无法准确判断一个母语单词的意思,何不把所有可能的意思都列出来,并且在每个意思后面分别显示相应的外语教学内容?如,对于“同志”,可以在框中显示如下教学内容:
① 革命同志:comrade;② 同性恋:homosexual;③ 某些年代对陌生人的一种称呼:comrade。
我们把这种想法叫做 Burling 自动化的第二代模型:词典式翻译,因为这种方法就像一部汉英词典,把一个母语单词的所有词义都列出来,并提供每个词义对应的外语说法,让用户自己找出符合上下文的那个词义,并学习对应的外语。
聪明的读者不难发现,“词典式翻译”虽然避免了第一代模型“机器翻译”的固有问题——计算机无法准确判断词义,却带来了属于自己的新问题:
第一,让用户从多个词义中选择符合上下文的那个词义,这道手续在客观上会耗费用户额外的时间和精力,并且降低了总体学习效率。假设用户花在“选择词义”上的时间精力为 X,然后花在“学习该词义的外语”上的时间精力为 Y,那么用户真正用于学外语的“有效功率”其实只有 Y / (X + Y),因为他“选择词义”时并不在学外语,属于“无用功”。另外,用户从阅读母语网页的过程中抽空来关注框中的内容,他的这种注意力的持续时间(attention span)或者说“耐心”其实是非常短暂的;如果这种宝贵的“耐心”还要分出一部分去“选择词义”,对于学习效率无疑是可惜的。
第二,用户面对一串候选词义,有如面对一道多选题;在本来轻松愉快的母语网页阅读活动中竟要做“多选题”,无疑会伤害用户感情、打击学习热情。如果由于计算机的无能而迫使用户必须代替计算机来做“选择词义”这一枯燥无味的工作,用户会感到自己反而成了机器的奴隶,或者说成了一套机械化大系统中的一个零件,而非一个人性化的学习活动的主导者。
而且,显然,一个单词的可能词义越多,以上两个问题就越严重。那么,一词多义现象究竟有多普遍、多严重呢?结果超乎你想象:
对于英语这样的语言,一词多义主要怪罪于同一个单词反复被赋予新的含义。就拿 air 这个再普通不过的单词(就像“空气”一样普通)来说吧,它本是指“空气”;19 世纪下半叶无线电发明后又被赋予了“无线电播送”的含义,如 airing a show(播送一个电视剧)、you're on the air(你已经打进了本台的广播节目中);20 世纪初飞机发明后又被赋予了“航空”的含义,如 air hostess(空中小姐)、go by air(坐飞机前往)。事实上,《韦氏英语词典》对 air 光是作为名词时就有 10 大类意思并进一步细分为 23 个具体词义。而像 air 这种随着时间的演变被赋予很多新含义的例子,在英语常用词汇中十分普遍,因为英语不太喜欢造专门的新词,而是借用一个旧词来指代新的含义。
对于汉语这样的语言,一词多义主要发生在“一个汉语单词对应多个外语近义词”上。现代汉语的很多单词其实是由日本人人为制造的,在制造的过程中就已经注意尽量做到“一词一义”,因此许多汉语单词看似是只有一个意思的;但当我们把一个汉语单词翻译到英语这样一种近义词发达的外语时,原来的“一个意思”往往就要进一步细分成“多个意思”来对应英语中的多个近义词。就以“看”这个字为例吧。我们都知道它最基本的意思是“用眼睛看”(为了方便起见,接下来我们就假定“看”只有这一种意思)。这个意思翻译到英文时,需要在至少三个近义词中做出选择:look、see 和 watch;也就是说,原本在中文中只算“一个意思”的“用眼睛看”,在即将翻译成英文时却需要进一步细分成了三个意思:① “看过去”(对应 look);② “看到”(对应 see);② “持续观看”(对应 watch)。这就是说,“看”这个“单义词”在英语教学中变成了至少有 3 个意思的“多义词”,而前面我们说过,多义词不利于 Burling 自动化的第二代模型——“词典式翻译”的实施。还有更复杂的情况呢!有时我们看到一个汉语单词似乎只对应 2 个英语近义词(如“学习”对应 study 和 learn),但实际上处理起来远没有“把‘学习’细分成 2 个意思”那么简单。首先,study 和 learn 虽然只是 2 个近义词,但它们各自都有多个“用法”,如:① “学习理论知识”可以用 study 或 learn(如 study physics 或 learn physics);② “学习经验性的技能”应该用 learn(如 learn to swim);③ “做‘学习’的尝试”应该用 study(如 I studied but didn't learn anything);④ “学到”应该用 learn(如 ③ 中的例子);⑤ “在学校正式就读”应该用 study(如 I studied at Harvard);⑥ “学习某人/某事的榜样/经验/教训”应该用 learn(如 learn from his success)。于是这些“用法”中的每一个,其实都是“学习”这个汉语单词即将翻译到英语时需要细分出来的一个意思——“学习”一下子变成了至少具有 6 个意思的多义词!这 6 个用法还只是 study 和 learn 这两个近义词自身意思上的种种特色;除了自身意思上的种种特色(nuances in meaning),两个近义词还可能有单词搭配习惯上的种种区别(collocational preferences),如说到“远程学习”时我们习惯说“distance learning”而不是“distance study”。如果把“单词搭配上的种种区别”也考虑进来,“学习”的英文译法就更加不止上面的 6 种情况了,因为像“远程学习”这样的单词搭配可能有很多、很多。
除了上述的两大造成一词多义的原因外,尚有其它一些原因。一个原因是“比喻义”,如汉语单词“钓鱼”,既可以指“钓水里的鱼”(to fish)这个本义,也可以指“设局诈骗”(to phish)这个比喻义。另一个原因是“词性变化”,如刚才说的“钓鱼”,本义和比喻义又都可以进一步分成“动词义”和“名词义”,最终产生 2 × 2 = 4 个词义:①【动】钓水里的鱼:to fish;②【名】钓水里的鱼:fishing;③【动】 设局诈骗:to phish;④【名】 设局诈骗:phishing)。所有这些诸如此类的原因都可能造成一个单词的词义数量成倍增长。
上回我们讨论了 Burling 自动化的第一代模型——机器翻译,也就是把网页中选出的母语单词(如“同志”)喂给一个机器翻译系统,翻译成用户想学的外语语种(如英语),然后把这个机器翻译结果显示在网页上的小框里,作为外语教学内容。我们也指出了这种方法的致命缺点:机器翻译的结果是不可靠的,用户学习了错误的翻译结果却茫然不知。比如,上回我们说过,“同志”可以有三种意思(① 革命同志;② 同性恋;③ 某些年代对陌生人的一种称呼),而机器翻译无法像人一样准确地根据上下文判断“同志”是哪个意思,从而也就无法针对那个意思来教外语。
于是有些人会说,既然计算机无法准确判断一个母语单词的意思,何不把所有可能的意思都列出来,并且在每个意思后面分别显示相应的外语教学内容?如,对于“同志”,可以在框中显示如下教学内容:
① 革命同志:comrade;② 同性恋:homosexual;③ 某些年代对陌生人的一种称呼:comrade。
我们把这种想法叫做 Burling 自动化的第二代模型:词典式翻译,因为这种方法就像一部汉英词典,把一个母语单词的所有词义都列出来,并提供每个词义对应的外语说法,让用户自己找出符合上下文的那个词义,并学习对应的外语。
聪明的读者不难发现,“词典式翻译”虽然避免了第一代模型“机器翻译”的固有问题——计算机无法准确判断词义,却带来了属于自己的新问题:
第一,让用户从多个词义中选择符合上下文的那个词义,这道手续在客观上会耗费用户额外的时间和精力,并且降低了总体学习效率。假设用户花在“选择词义”上的时间精力为 X,然后花在“学习该词义的外语”上的时间精力为 Y,那么用户真正用于学外语的“有效功率”其实只有 Y / (X + Y),因为他“选择词义”时并不在学外语,属于“无用功”。另外,用户从阅读母语网页的过程中抽空来关注框中的内容,他的这种注意力的持续时间(attention span)或者说“耐心”其实是非常短暂的;如果这种宝贵的“耐心”还要分出一部分去“选择词义”,对于学习效率无疑是可惜的。
第二,用户面对一串候选词义,有如面对一道多选题;在本来轻松愉快的母语网页阅读活动中竟要做“多选题”,无疑会伤害用户感情、打击学习热情。如果由于计算机的无能而迫使用户必须代替计算机来做“选择词义”这一枯燥无味的工作,用户会感到自己反而成了机器的奴隶,或者说成了一套机械化大系统中的一个零件,而非一个人性化的学习活动的主导者。
而且,显然,一个单词的可能词义越多,以上两个问题就越严重。那么,一词多义现象究竟有多普遍、多严重呢?结果超乎你想象:
对于英语这样的语言,一词多义主要怪罪于同一个单词反复被赋予新的含义。就拿 air 这个再普通不过的单词(就像“空气”一样普通)来说吧,它本是指“空气”;19 世纪下半叶无线电发明后又被赋予了“无线电播送”的含义,如 airing a show(播送一个电视剧)、you're on the air(你已经打进了本台的广播节目中);20 世纪初飞机发明后又被赋予了“航空”的含义,如 air hostess(空中小姐)、go by air(坐飞机前往)。事实上,《韦氏英语词典》对 air 光是作为名词时就有 10 大类意思并进一步细分为 23 个具体词义。而像 air 这种随着时间的演变被赋予很多新含义的例子,在英语常用词汇中十分普遍,因为英语不太喜欢造专门的新词,而是借用一个旧词来指代新的含义。
对于汉语这样的语言,一词多义主要发生在“一个汉语单词对应多个外语近义词”上。现代汉语的很多单词其实是由日本人人为制造的,在制造的过程中就已经注意尽量做到“一词一义”,因此许多汉语单词看似是只有一个意思的;但当我们把一个汉语单词翻译到英语这样一种近义词发达的外语时,原来的“一个意思”往往就要进一步细分成“多个意思”来对应英语中的多个近义词。就以“看”这个字为例吧。我们都知道它最基本的意思是“用眼睛看”(为了方便起见,接下来我们就假定“看”只有这一种意思)。这个意思翻译到英文时,需要在至少三个近义词中做出选择:look、see 和 watch;也就是说,原本在中文中只算“一个意思”的“用眼睛看”,在即将翻译成英文时却需要进一步细分成了三个意思:① “看过去”(对应 look);② “看到”(对应 see);② “持续观看”(对应 watch)。这就是说,“看”这个“单义词”在英语教学中变成了至少有 3 个意思的“多义词”,而前面我们说过,多义词不利于 Burling 自动化的第二代模型——“词典式翻译”的实施。还有更复杂的情况呢!有时我们看到一个汉语单词似乎只对应 2 个英语近义词(如“学习”对应 study 和 learn),但实际上处理起来远没有“把‘学习’细分成 2 个意思”那么简单。首先,study 和 learn 虽然只是 2 个近义词,但它们各自都有多个“用法”,如:① “学习理论知识”可以用 study 或 learn(如 study physics 或 learn physics);② “学习经验性的技能”应该用 learn(如 learn to swim);③ “做‘学习’的尝试”应该用 study(如 I studied but didn't learn anything);④ “学到”应该用 learn(如 ③ 中的例子);⑤ “在学校正式就读”应该用 study(如 I studied at Harvard);⑥ “学习某人/某事的榜样/经验/教训”应该用 learn(如 learn from his success)。于是这些“用法”中的每一个,其实都是“学习”这个汉语单词即将翻译到英语时需要细分出来的一个意思——“学习”一下子变成了至少具有 6 个意思的多义词!这 6 个用法主要是 study 和 learn 这两个近义词在自身意思上的种种区别;除了自身意思上的种种区别(nuances in meaning),两个近义词还可能有单词搭配习惯上的种种区别(collocational preferences),如说到“远程学习”时我们习惯说“distance learning”而不是“distance study”。如果把“单词搭配上的种种区别”也考虑进来,“学习”的英文译法就更加不止上面的 6 种情况了,因为像“远程学习”这样的单词搭配可能有很多、很多。
除了上述的两大造成一词多义的原因外,尚有其它一些原因。一个原因是“比喻义”,如汉语单词“钓鱼”,既可以指“钓水里的鱼”(to fish)这个本义,也可以指“设局诈骗”(to phish)这个比喻义。另一个原因是“词性变化”,如刚才说的“钓鱼”,本义和比喻义又都可以进一步分成“动词义”和“名词义”,最终产生 2 × 2 = 4 个词义(①【动】钓水里的鱼:to fish;②【名】钓水里的鱼:fishing;③【动】 设局诈骗:to phish;④【名】 设局诈骗:phishing)。所有这些诸如此类的原因都可能造成一个单词的词义数量成倍增长。
了解了一词多义现象的普遍性、复杂性、严重性,你就可以理解“词典式翻译”这种 Burling 自动化模型亦非理想——前面分析了这种模型有两个自身的新问题,而且这两个问题随着词义数量的增加而越发严重。
那么,Burling 自动化还有没有更好的发展方向?请看下回分解。
上回我们讨论了 Burling 自动化的第一代模型——机器翻译,也就是把网页中选出的母语单词(如“同志”)喂给一个机器翻译系统,翻译成用户想学的外语语种(如英语),然后把这个机器翻译结果显示在网页上的小框里,作为外语教学内容。我们也指出了这种方法的致命缺点:机器翻译的结果是不可靠的,用户学习了错误的翻译结果却茫然不知。比如,上回我们说过,“同志”可以有三种意思(① 革命同志;② 同性恋;③ 某些年代对陌生人的一种称呼),而机器翻译无法像人一样准确地根据上下文判断“同志”是哪个意思,从而也就无法针对那个意思来教外语。
于是有些人会说,既然计算机无法准确判断一个母语单词的意思,何不把所有可能的意思都列出来,并且在每个意思后面分别显示相应的外语教学内容?如,对于“同志”,可以在框中显示如下教学内容:
① 革命同志:comrade;② 同性恋:homosexual;③ 某些年代对陌生人的一种称呼:comrade。
我们把这种想法叫做 Burling 自动化的第二代模型:词典式翻译,因为这种方法就像一部汉英词典,把一个母语单词的所有词义都列出来,并提供每个词义对应的外语说法,让用户自己找出符合上下文的那个词义,并学习对应的外语。
聪明的读者不难发现,“词典式翻译”虽然避免了第一代模型“机器翻译”的固有问题——计算机无法准确判断词义,却带来了属于自己的新问题:
第一,让用户从多个词义中选择符合上下文的那个词义,这道手续在客观上会耗费用户额外的时间和精力,并且降低了总体学习效率。假设用户花在“选择词义”上的时间精力为 X,然后花在“学习该词义的外语”上的时间精力为 Y,那么用户真正用于学外语的“有效功率”其实只有 Y / (X + Y),因为他“选择词义”时并不在学外语,属于“无用功”。另外,用户从阅读母语网页的过程中抽空来关注框中的内容,他的这种注意力的持续时间(attention span)或者说“耐心”其实是非常短暂的;如果这种宝贵的“耐心”还要分出一部分去“选择词义”,对于学习效率无疑是可惜的。
第二,用户面对一串候选词义,有如面对一道多选题;在本来轻松愉快的母语网页阅读活动中竟要做“多选题”,无疑会伤害用户感情、打击学习热情。如果由于计算机的无能而迫使用户必须代替计算机来做“选择词义”这一枯燥无味的工作,用户会感到自己反而成了机器的奴隶,或者说成了一套机械化大系统中的一个零件,而非一个人性化的学习活动的主导者。
而且,显然,一个单词的可能词义越多,以上两个问题就越严重。那么,一词多义现象究竟有多普遍、多严重呢?结果超乎你想象:
对于英语这样的语言,一词多义主要怪罪于同一个单词反复被赋予新的含义。就拿 air 这个再普通不过的单词(就像“空气”一样普通)来说吧,它本是指“空气”;19 世纪下半叶无线电发明后又被赋予了“无线电播送”的含义,如 airing a show(播送一个电视剧)、you're on the air(你已经打进了本台的广播节目中);20 世纪初飞机发明后又被赋予了“航空”的含义,如 air hostess(空中小姐)、go by air(坐飞机前往)。事实上,《韦氏英语词典》对 air 光是作为名词时就有 10 大类意思并进一步细分为 23 个具体词义。而像 air 这种随着时间的演变被赋予很多新含义的例子,在英语常用词汇中十分普遍,因为英语不太喜欢造专门的新词,而是借用一个旧词来指代新的含义。
对于汉语这样的语言,一词多义主要发生在“一个汉语单词对应多个外语近义词”时。现代汉语的很多单词其实是由日本人人为制造的,在制造的过程中就已经注意尽量做到“一词一义”,因此许多汉语单词看似是只有一个意思的;但当我们把一个汉语单词翻译到英语这样一种近义词发达的外语时,原来的“一个意思”往往就要进一步细分成“多个意思”来对应英语中的多个近义词。就以“看”这个字为例吧。我们都知道它最基本的意思是“用眼睛看”(为了方便起见,接下来我们就假定“看”只有这一种意思)。这个意思翻译到英文时,需要在至少三个近义词中做出选择:look、see 和 watch;也就是说,原本在中文中只算“一个意思”的“用眼睛看”,在即将翻译成英文时却需要进一步细分成了三个意思:① “看过去”(对应 look);② “看到”(对应 see);② “持续观看”(对应 watch)。这就是说,“看”这个“单义词”在英语教学中变成了至少有 3 个意思的“多义词”,而前面我们说过,多义词不利于 Burling 自动化的第二代模型——“词典式翻译”的实施。还有更复杂的情况呢!有时我们看到一个汉语单词似乎只对应 2 个英语近义词(如“学习”对应 study 和 learn),但实际上处理起来远没有“把‘学习’细分成 2 个意思”那么简单。首先,study 和 learn 虽然只是 2 个近义词,但它们各自都有多个“用法”,如:① “学习理论知识”可以用 study 或 learn(如 study physics 或 learn physics);② “学习经验性的技能”应该用 learn(如 learn to swim);③ “做‘学习’的尝试”应该用 study(如 I studied but didn't learn anything);④ “学到”应该用 learn(如 ③ 中的例子);⑤ “在学校正式就读”应该用 study(如 I studied at Harvard);⑥ “学习某人/某事的榜样/经验/教训”应该用 learn(如 learn from his success)。于是这些“用法”中的每一个,其实都是“学习”这个汉语单词即将翻译到英语时需要细分出来的一个意思——“学习”一下子变成了至少具有 6 个意思的多义词!这 6 个用法主要是 study 和 learn 这两个近义词在自身意思上的种种区别;除了自身意思上的种种区别(nuances in meaning),两个近义词还可能有单词搭配习惯上的种种区别(collocational preferences),如说到“远程学习”时我们习惯说“distance learning”而不是“distance study”。如果把“单词搭配上的种种区别”也考虑进来,“学习”的英文译法就更加不止上面的 6 种情况了,因为像“远程学习”这样的单词搭配可能有很多、很多。
除了上述的两大造成一词多义的原因外,尚有其它一些原因。一个原因是“比喻义”,如汉语单词“钓鱼”,既可以指“钓水里的鱼”(to fish)这个本义,也可以指“设局诈骗”(to phish)这个比喻义。另一个原因是“词性变化”,如刚才说的“钓鱼”,本义和比喻义又都可以进一步分成“动词义”和“名词义”,最终产生 2 × 2 = 4 个词义(①【动】钓水里的鱼:to fish;②【名】钓水里的鱼:fishing;③【动】 设局诈骗:to phish;④【名】 设局诈骗:phishing)。所有这些诸如此类的原因都可能造成一个单词的词义数量成倍增长。
了解了一词多义现象的普遍性、复杂性、严重性,你就可以理解“词典式翻译”这种 Burling 自动化模型亦非理想——前面分析了这种模型有两个自身的新问题,而且这两个问题随着词义数量的增加而越发严重。
那么,Burling 自动化还有没有更好的发展方向?请看下回分解。
前两回我们讨论了 Burling 自动化的第一代模型“机器翻译”和第二代模型“词典式翻译”,以及它们各自的问题。为了避免这两个模型的缺点,我们可以认识到,一个“比较好”的模型,应该符合以下两个原则:
智能:一个“比较好”的模型,应该具有一定的智能来根据上下文推测一个单词的词义(比如根据上下文推测“同志”这个单词的词义是“革命同志”),然后教这个词义对应的外语,而不是像第二代模型“词典式翻译”那样把一个单词的所有词义都列出来。
负责:其实理论上,任何方法都不能让计算机 100% 准确地判断一个单词的词义(除非像人脑那么发达的人工智能实现了);因此为了对学习者负责,计算机必须告诉学习者,计算机判断出来的词义是哪个(也就是正在教的是哪个词义)。比如,如果计算机把“同志”判断成“革命同志”,那么就把外语教学内容写成:“同志(革命同志)的英语是 comrade。”这样,即使这个“同志”在网页上的真正意思是“同性恋”,学习者也能知道计算机判断错了,并姑且顺着计算机判断的意思(“革命同志”)来学计算机提供的外语教学内容(“comrade”)。
本回即将介绍的 Burling 自动化的第三代模型——“人力打造智能系统”,就是一个符合以上两个原则的模型。
首先,让我们来看这个模型是怎么“智能”地根据上下文推测一个单词的词义。以“同志”这个词为例,如果上下文中出现了“主义”、“革命”、“马克思”之类的词,那么直觉告诉我们,这个“同志”很可能就是“革命同志”的意思。也就是说,上下文中出现某些特定的“提示词”,往往能暗示一个单词是哪个词义。又比如,假如一个美国人想用 Burling 式的方法学中文,在他浏览一篇母语(即英文)网页时,计算机发现网页上有“bass”一词,想趁机教他“bass”的中文,而“bass”至少有两个意思:“鲈鱼”和“低音”;那么我们可以想象,如果“bass”周围出现了“sea”(海)、“fish”(鱼)、“water”(水)、“fishing”(钓鱼)之类跟鱼相关的词,那么这个“bass”可能就是“鲈鱼”的意思;如果“bass”周围出现了“music”(音乐)、“song”(歌曲)、“instrument”(乐器)、“player”(乐手)之类跟音乐相关的词,那么这个“bass”可能就是“低音”的意思。
本回所说的模型正是要用“提示词”来大致推测一个单词是哪个词义。因此,该模型需要掌握如下数据:
用户的母语中有哪些单词:因为计算机要从用户正在浏览的母语网页中选取母语单词来进行相关的外语教学,因此计算机首先必须知道“母语单词”有哪些,比如一个中国人的母语单词就是一本汉语词典中包含的汉语词汇,包括上面提及的“同志”。
每个母语单词有哪些词义:因为计算机要智能地判断一个母语单词的词义,然后教授该词义的外语,因此计算机首先要知道一个母语单词所有可能的词义有那些,比如“同志”的词义就至少有“革命同志”、“同性恋”等等,又比如“bass”的词义至少有“鲈鱼”、“低音”等等。
每个词义有哪些提示词:因为计算机要根据上下文来智能地判断一个单词的词义,那么按照上面说的“提示词”的方法,计算机就需要知道每个词义有哪些提示词,比如“同志”的“革命同志”词义有“主义”、“革命”、“马克思”等提示词,而“bass”的“鲈鱼”词义则有“sea”、“fish”、“water”、 “fishing”等提示词。
每个词义的外语教学内容:当计算机根据上下文中的提示词推测出一个单词的词义后,即可显示该词义对应的外语教学内容,例如当计算机推测出“同志”这个单词的词义是“革命同志”后,显示的外语教学内容可以是:“同志(革命同志)的英语是 comrade。”另外注意“教学内容”不仅可以是类似这样一句话的“微课程”,也可以是一系列的“微课程”,每次显示该系列中的一个微课程。
以上便是该模型如何实现本回开头提到的“智能”原则——智能地根据上下文判断一个单词的词义;至于本回开头提到的“负责”原则——告诉学习者“计算机判断出来的词义是哪个”(也就是正在教的是哪个词义),实现的方法也正是在外语教学内容中注明正在教的是哪个词义,如“同志(革命同志)的英语是 comrade。”
聪明的读者也许已经看出了这个模型的一个重大缺点:它所需要的四种数据(上文已列出)中,后三种(“每个母语单词有哪些词义”、“每个词义有哪些提示词”、“每个词义的外语教学内容”)都是需要人工去建设的,而且工程浩大。这也就是为什么这个模型的名字叫作“人力打造智能系统”。
这个重大缺点,就令到实现这样一个模型在实际上是不大可能的。那么,有没有办法克服这个缺点呢?请看下回分解。
前两回我们讨论了 Burling 自动化的第一代模型“机器翻译”和第二代模型“词典式翻译”,以及它们各自的问题。为了避免这两个模型的问题,我们可以认识到,一个比较好的模型,应该符合以下两个原则:
智能:计算机从用户正在浏览的母语网页选出一个母语单词(如“同志”)后,应该比较“智能”地根据上下文判断这个单词的词义是什么,然后教这个词义对应的外语,而不是像第二代模型“词典式翻译”那样把一个单词的所有词义都列出来。
负责:但其实在真正的人工智能实现以前,计算机总是有可能错误判断一个单词的词义的,然后教的外语其实是错误词义的外语(比如网页上有句话:“同志们在认真学习劳动模范的先进事迹。”,计算机把这里的“同志”错判为“同性恋”,然后按这个错误的词义,显示一条外语教学内容:“同志的英语是 homosexual。”显然,这就让用户学到了错误的外语);因此为了避免这种误人子弟,计算机在教外语的时候必须说清楚,自己在教哪个词义的外语。比如,在上面的例子里,把外语教学内容改写成:“同志(同性恋)的英语是 homosexual。”这样,用户一看就知道这个词义不是网页上所指的词义;但另一方面,用户可以不妨就按这个词义来学习这条外语教学内容。
本回即将介绍的 Burling 自动化的第三代模型——“人力打造智能系统”,就是一个符合以上两个原则的模型。
首先,让我们来看这个模型是怎么“智能”地根据上下文判断一个单词的词义的。以“同志”这个词为例,如果上下文中出现了“主义”、“革命”、“马克思”、“学习”、“榜样”、“先进”之类的词,那么直觉告诉我们,这个“同志”很可能就是“革命同志”的意思。也就是说,上下文中出现某些特定的“提示词”,往往能暗示一个单词是哪个词义。又比如,假如一个美国人想用 Burling 式的方法学中文,在他浏览一篇母语(即英文)网页时,计算机发现网页上有“bass”一词,想趁机教他“bass”的中文,而“bass”至少有两个意思:“鲈鱼”和“音乐中的低音”;那么我们可以想象,如果“bass”周围出现了“sea”(海)、“fish”(鱼)、“water”(水)、“fishing”(钓鱼)之类跟鱼相关的词,那么这个“bass”可能就是“鲈鱼”的意思;如果“bass”周围出现了“music”(音乐)、“song”(歌曲)、“instrument”(乐器)、“player”(乐手)之类跟音乐相关的词,那么这个“bass”可能就是“低音”的意思。
本回所说的模型正是要用“提示词”来大致推测一个单词是哪个词义。因此,该模型需要掌握如下数据:
用户的母语中有哪些单词:因为计算机要从用户正在浏览的母语网页中选取母语单词来进行相关的外语教学,因此计算机首先必须知道“母语单词”有哪些,比如一个中国人的母语单词就是一本汉语词典中包含的汉语词汇,包括上面提及的“同志”。
每个母语单词有哪些词义:因为计算机要智能地判断一个母语单词的词义,然后教授该词义的外语,因此计算机首先要知道一个母语单词所有可能的词义有哪些,比如“同志”的词义就至少有“革命同志”、“同性恋”等等,又比如“bass”的词义至少有“鲈鱼”、“低音”等等。
每个词义有哪些提示词:因为计算机要根据上下文来智能地判断一个单词的词义,那么按照上面说的“提示词”的方法,计算机就需要知道每个词义有哪些提示词,比如“同志”的“革命同志”词义有“主义”、“革命”、“马克思”等提示词。
每个词义的外语教学内容:当计算机根据上下文中的提示词推测出一个单词的词义后,即可显示该词义对应的外语教学内容,例如当计算机推测出“同志”这个单词的词义是“革命同志”后,显示的外语教学内容可以是:“同志(革命同志)的英语是 comrade。”另外注意“教学内容”不仅可以是这样通常只有一句话的“微课程”,也可以是一系列的“微课程”,每次显示该系列中的一个微课程。
以上便是该模型如何实现本回开头提到的“智能”原则——智能地根据上下文判断一个单词的词义;至于本回开头提到的“负责”原则——计算机在教外语的时候必须说清楚自己在教哪个词义的外语,实现的方法也正是在外语教学内容中注明正在教的是哪个词义,如“同志(革命同志)的英语是 comrade。”
聪明的读者也许已经看出了这个模型的一个重大缺点:它所需要的四种数据(上文已列出)中,后三种(“每个母语单词有哪些词义”、“每个词义有哪些提示词”、“每个词义的外语教学内容”)都是需要人工去编写的,而且工程浩大。这也就是为什么这个模型的名字叫作“人力打造智能系统”。
聪明的读者也许已经看出了这个模型的一个重大缺点:它所需要的四种数据(上文已列出)中,后三种(“每个母语单词有哪些词义”、“每个词义有哪些提示词”、“每个词义的外语教学内容”)都需要大量的人力物力来编写,才能有完善的效果。这也就是为什么这个模型的名字叫作“人力打造智能系统”。
聪明的读者也许已经看出了这个模型的一个重大缺点:它所需要的四种数据(上文已列出)中,后三种(“每个母语单词有哪些词义”、“每个词义有哪些提示词”、“每个词义的外语教学内容”)都需要大量的人力物力来编写,才能有比较完善的效果。这也就是为什么这个模型的名字叫作“人力打造智能系统”。
聪明的读者也许已经看出了这个模型的一个重大缺点:它所需要的四种数据(上文已列出)中,后三种(“每个母语单词有哪些词义”、“每个词义有哪些提示词”、“每个词义的外语教学内容”)都需要大量的人力物力来制作,才能有比较完善的效果。这也就是为什么这个模型的名字叫作“人力打造智能系统”。
前两回我们讨论了 Burling 自动化的第一代模型“机器翻译”和第二代模型“词典式翻译”,以及它们各自的问题——对于一个母语单词(如“同志”),“机器翻译”能给出一个翻译,但这个翻译可能是错的;而“词典式翻译”能列出这个母语单词所有可能的词义及其翻译,让用户自己去选择符合上下文的那个词义并学习其翻译,但这个选择词义的过程可能是繁重的。为了避免这些问题,我们可以认识到,一个比较好的模型,应该符合以下两个原则:
智能:计算机从用户正在浏览的母语网页选出一个母语单词(如“同志”)后,应该比较“智能”地根据上下文判断这个单词的词义是什么,然后教这个词义对应的外语,而不是像第二代模型“词典式翻译”那样把一个单词的所有词义都列出来、让用户自己去选择。
负责:但其实在真正的人工智能实现以前,计算机总是有可能错误判断一个单词的词义的,然后教的外语其实是错误词义的外语(比如网页上有句话:“同志们在认真学习劳动模范的先进事迹。”,计算机把这里的“同志”错判为“同性恋”,然后按这个错误的词义,显示一条外语教学内容:“同志的英语是 homosexual。”显然,这就让用户学到了错误的外语);因此为了避免这种误人子弟,计算机在教外语的时候必须说清楚,自己在教哪个词义的外语。比如,在上面的例子里,把外语教学内容改写成:“同志(同性恋)的英语是 homosexual。”这样,用户一看就知道这个词义不是网页上所指的词义;但另一方面,用户可以不妨就按这个词义来学习这条外语教学内容。
本回即将介绍的 Burling 自动化的第三代模型——“人力打造智能系统”,就是一个符合以上两个原则的模型。
首先,让我们来看这个模型是怎么“智能”地根据上下文判断一个单词的词义的。以“同志”这个词为例,如果上下文中出现了“主义”、“革命”、“马克思”、“学习”、“榜样”、“先进”之类的词,那么直觉告诉我们,这个“同志”很可能就是“革命同志”的意思。也就是说,上下文中出现某些特定的“提示词”,往往能暗示一个单词是哪个词义。又比如,假如一个美国人想用 Burling 式的方法学中文,在他浏览一篇母语(即英文)网页时,计算机发现网页上有“bass”一词,想趁机教他“bass”的中文,而“bass”至少有两个意思:“鲈鱼”和“音乐中的低音”;那么我们可以想象,如果“bass”周围出现了“sea”(海)、“fish”(鱼)、“water”(水)、“fishing”(钓鱼)之类跟鱼相关的词,那么这个“bass”可能就是“鲈鱼”的意思;如果“bass”周围出现了“music”(音乐)、“song”(歌曲)、“instrument”(乐器)、“player”(乐手)之类跟音乐相关的词,那么这个“bass”可能就是“低音”的意思。
本回所说的模型正是要用“提示词”来大致推测一个单词是哪个词义。因此,该模型需要掌握如下数据:
用户的母语中有哪些单词:因为计算机要从用户正在浏览的母语网页中选取母语单词来进行相关的外语教学,因此计算机首先必须知道“母语单词”有哪些,比如一个中国人的母语单词就是一本汉语词典中包含的汉语词汇,包括上面提及的“同志”。
每个母语单词有哪些词义:因为计算机要智能地判断一个母语单词的词义,然后教授该词义的外语,因此计算机首先要知道一个母语单词所有可能的词义有哪些,比如“同志”的词义就至少有“革命同志”、“同性恋”等等,又比如“bass”的词义至少有“鲈鱼”、“低音”等等。
每个词义有哪些提示词:因为计算机要根据上下文来智能地判断一个单词的词义,那么按照上面说的“提示词”的方法,计算机就需要知道每个词义有哪些提示词,比如“同志”的“革命同志”词义有“主义”、“革命”、“马克思”等提示词。
每个词义的外语教学内容:当计算机根据上下文中的提示词推测出一个单词的词义后,即可显示该词义对应的外语教学内容,例如当计算机推测出“同志”这个单词的词义是“革命同志”后,显示的外语教学内容可以是:“同志(革命同志)的英语是 comrade。”另外注意“教学内容”不仅可以是这样通常只有一句话的“微课程”,也可以是一系列的“微课程”,每次显示该系列中的一个微课程。
以上便是该模型如何实现本回开头提到的“智能”原则——智能地根据上下文判断一个单词的词义;至于本回开头提到的“负责”原则——计算机在教外语的时候必须说清楚自己在教哪个词义的外语,实现的方法也正是在外语教学内容中注明正在教的是哪个词义,如“同志(革命同志)的英语是 comrade。”
聪明的读者也许已经看出了这个模型的一个重大缺点:它所需要的四种数据(“用户的母语中有哪些单词”、“每个母语单词有哪些词义”、“每个词义有哪些提示词”、“每个词义的外语教学内容”),总体规模很大,需要大量的人力物力才能制作完成。这也就是为什么这个模型的名字叫作“人力打造智能系统”。
这个重大缺点,就令到实现这样一个模型在实际上是不大可能的——工程太浩大了。那么,有没有办法克服这个缺点呢?请看下回分解。
前两回我们讨论了 Burling 自动化的第一代模型“机器翻译”和第二代模型“词典式翻译”。它们本质上的优缺点可以概括如下:
“机器翻译”的特点是“智能但不负责”:机器翻译其实有一定的智能,去根据上下文推测一个母语单词(如“同志”)的词义,然后教授这个词义对应的外语;但如果机器翻译推测的词义是错的,那么教给用户的也就是错误的外语(比如网页上有句话:“同志们在认真学习劳动模范的先进事迹。”,计算机如果把这里的“同志”错判为“同性恋”,然后按这个错误的词义,显示一条外语教学内容:“同志的英语是 homosexual。”显然,这就让用户学到了错误的外语)。也就是说,机器翻译是不负责任的。
“词典式翻译”的特点是“负责但不智能”: 词典式翻译并不妄加猜测一个母语单词(如“同志”)的词义,而是把它所有可能的词义都列出来,每个词义后面都提供对应的外语教学内容,让用户自己去选择符合上下文的那个词义然后学习对应的外语。因此,词典式翻译不会造成机器翻译那种“教错外语”的情况,因此是“负责”的;但它不够“智能”——不能智能地自动选一个可能符合上下文的词义,而让用户去做“选择词义”这个往往是枯燥繁重的工作,大大打击了用户的学习热情。
于是我们可以认识到:
一个比较好的模型,应该“既智能又负责”:“智能”是指,计算机从用户正在浏览的母语网页选出一个母语单词(如“同志”)后,应该用某种方法,根据上下文推测这个单词的词义是什么(但不要求每次都能推测正确),然后教这个词义对应的外语,而不是像第二代模型“词典式翻译”那样把一个单词的所有词义都列出来、让用户自己去选择。“负责”是指,由于计算机推测词义时可能会出错、造成前面说的“教错外语”的问题,因此计算机在教外语的时候必须说清楚,自己在教哪个词义的外语。比如前面那个例子,网页上有句话:“同志们在认真学习劳动模范的先进事迹。”,如果计算机把这里的“同志”错判为“同性恋”,然后按这个错误的词义,显示一条外语教学内容:“同志的英语是 homosexual。”那么用户就学到了错误的外语;但如果计算机在外语教学内容中注明,教的是“同性恋”这个词义的外语,也就是把外语教学内容改写成:“同志(同性恋)的英语是 homosexual。”那么用户一看就知道这个词义不是网页上所指的词义,不会把两者的外语混为一谈;同时,用户也可以不妨就按照括号里的词义(即“同性恋”)来学习这条外语教学内容。
本回即将介绍的 Burling 自动化的第三代模型——“人力打造智能系统”,就是一个“既智能又负责”的模型。
首先,让我们来看这个模型怎么做到“智能”这一点——智能地根据上下文判断一个单词的词义。以“同志”这个词为例,如果上下文中出现了“主义”、“革命”、“马克思”、“学习”、“榜样”、“先进”之类的词,那么直觉告诉我们,这个“同志”很可能就是“革命同志”的意思。也就是说,上下文中出现某些特定的“提示词”,往往能暗示一个单词是哪个词义。又比如,假如一个美国人想用 Burling 式的方法学中文,在他浏览一篇母语(即英文)网页时,计算机发现网页上有“bass”一词,想趁机教他“bass”的中文,而“bass”至少有两个意思:“鲈鱼”和“音乐中的低音”;那么我们可以想象,如果“bass”周围出现了“sea”(海)、“fish”(鱼)、“water”(水)、“fishing”(钓鱼)之类跟鱼相关的词,那么这个“bass”可能就是“鲈鱼”的意思;如果“bass”周围出现了“music”(音乐)、“song”(歌曲)、“instrument”(乐器)、“player”(乐手)之类跟音乐相关的词,那么这个“bass”可能就是“低音”的意思。
本回所说的模型正是要用“提示词”来大致推测一个单词是哪个词义。因此,该模型需要掌握如下数据:
用户的母语中有哪些单词:因为计算机要从用户正在浏览的母语网页中选取母语单词来进行相关的外语教学,因此计算机首先必须知道“母语单词”有哪些,比如一个中国人的母语单词就是一本汉语词典中包含的汉语词汇,包括上面提及的“同志”。
每个母语单词有哪些词义:因为计算机要智能地判断一个母语单词的词义,然后教授该词义的外语,因此计算机首先要知道一个母语单词所有可能的词义有哪些,比如“同志”的词义就至少有“革命同志”、“同性恋”等等,又比如“bass”的词义至少有“鲈鱼”、“低音”等等。
每个词义有哪些提示词:因为计算机要根据上下文来智能地判断一个单词的词义,那么按照上面说的“提示词”的方法,计算机就需要知道每个词义有哪些提示词,比如“同志”的“革命同志”词义有“主义”、“革命”、“马克思”等提示词。
每个词义的外语教学内容:当计算机根据上下文中的提示词推测出一个单词的词义后,即可显示该词义对应的外语教学内容,例如当计算机推测出“同志”这个单词的词义是“革命同志”后,显示的外语教学内容可以是:“同志(革命同志)的英语是 comrade。”另外注意“教学内容”不仅可以是这样通常只有一句话的“微课程”,也可以是一系列的“微课程”,每次显示该系列中的一个微课程。
现在,我们再来看这个模型怎么做到“负责”这一点——计算机在教外语的时候必须说清楚,自己在教哪个词义的外语。我们的方法就是前面提到的方法:在外语教学内容中注明正在教的是哪个词义,如“同志(革命同志)的英语是 comrade。”括号中即注明了这条外语教学内容所教的是“革命同志”这个词义的外语。
聪明的读者也许已经看出了这个模型的一个重大缺点:它所需要的四种数据(“用户的母语中有哪些单词”、“每个母语单词有哪些词义”、“每个词义有哪些提示词”、“每个词义的外语教学内容”),总体规模很大,需要大量的人力物力才能制作完成。首先,用户的母语词汇中像“同志”这样的母语单词是数以万计的;其次,每个母语单词又可能分出很多词义(前一回里我们讨论过一词多义的复杂性和严重性);再次,每个词义的提示词又可能多如牛毛;最后,要为每个词义设计一系列外语教学“微课程”,从各种角度教授外语知识(如外语单词拼写、发音、用法、例句、相关词组等等),又是一项艰巨的工程。
这就是为什么这个模型的名字叫作“人力打造智能系统”——智能,但需要大量人力物力去建设。要实现这样一个模型在实际上是不大可能的——工程太浩大了。那么,有没有办法化解这个难题呢?请看下回分解。
前两回我们讨论了 Burling 自动化的第一代模型“机器翻译”和第二代模型“词典式翻译”。它们本质上的优缺点可以概括如下:
“机器翻译”的特点是“智能但不负责”:机器翻译其实有一定的智能,去根据上下文推测一个母语单词(如“同志”)的词义,然后教授这个词义对应的外语;但如果机器翻译推测的词义是错的,那么教给用户的也就是错误的外语(比如网页上有句话:“同志们在认真学习劳动模范的先进事迹。”,计算机如果把这里的“同志”错判为“同性恋”,然后按这个错误的词义,显示一条外语教学内容:“同志的英语是 homosexual。”显然,这就让用户学到了错误的外语)。也就是说,机器翻译是不负责任的。
“词典式翻译”的特点是“负责但不智能”: 词典式翻译并不妄加猜测一个母语单词(如“同志”)的词义,而是把它所有可能的词义都列出来,每个词义后面都提供对应的外语教学内容,让用户自己去选择符合上下文的那个词义并学习对应的外语。因此,词典式翻译不会造成机器翻译那种“教错外语”的情况,因此是“负责”的;但它不够“智能”——不能智能地自动选一个可能符合上下文的词义,而让用户去做“选择词义”这个往往是枯燥繁重的工作,大大打击了用户的学习热情。
于是我们可以认识到,一个比较好的模型,应该同时符合“智能”和“负责”这两大原则。具体来讲:
智能原则:计算机从用户正在浏览的母语网页选出一个母语单词(如“同志”)后,应该用某种方法,根据上下文推测这个单词的词义是什么(虽然未必总是推测正确),然后教这个词义对应的外语,而不是像第二代模型“词典式翻译”那样把一个单词的所有词义都列出来、让用户自己去选择。
负责原则:由于计算机推测词义时可能会出错、造成前面说的“教错外语”的问题,因此计算机在教外语的时候必须说清楚,自己在教哪个词义的外语,以免造成误会。比如前面那个例子,网页上有句话:“同志们在认真学习劳动模范的先进事迹。”,如果计算机把这里的“同志”错判为“同性恋”,然后按这个错误的词义,显示一条外语教学内容:“同志的英语是 homosexual。”那么用户就学到了错误的外语;但如果计算机在外语教学内容中注明,教的是“同性恋”这个词义的外语,也就是把外语教学内容改写成:“同志(同性恋)的英语是 homosexual。”那么用户一看就知道教的词义不是网页上所指的词义,不会把两者的外语混为一谈;同时,用户可以不妨就按照括号里的词义(“同性恋”)来学习这条外语教学内容。
本回即将介绍的 Burling 自动化的第三代模型——“人力打造智能系统”,就是一个“既智能又负责”的模型。
首先,让我们来看这个模型怎么做到“智能原则”——智能地根据上下文判断一个单词的词义。以“同志”这个词为例,如果上下文中出现了“主义”、“革命”、“马克思”、“学习”、“榜样”、“先进”之类的词,那么直觉告诉我们,这个“同志”很可能就是“革命同志”的意思。也就是说,上下文中出现某些特定的“提示词”,往往能暗示一个单词是哪个词义。又比如,假如一个美国人想用 Burling 式的方法学中文,在他浏览一篇母语(即英文)网页时,计算机发现网页上有“bass”一词,想趁机教他“bass”的中文,而“bass”至少有两个意思:“鲈鱼”和“音乐中的低音”;那么我们可以想象,如果“bass”周围出现了“sea”(海)、“fish”(鱼)、“water”(水)、“fishing”(钓鱼)之类跟鱼相关的词,那么这个“bass”可能就是“鲈鱼”的意思;如果“bass”周围出现了“music”(音乐)、“song”(歌曲)、“instrument”(乐器)、“player”(乐手)之类跟音乐相关的词,那么这个“bass”可能就是“低音”的意思。
本回所说的模型正是要用“提示词”来大致推测一个单词是哪个词义。因此,该模型需要掌握如下数据:
用户的母语中有哪些单词:因为计算机要从用户正在浏览的母语网页中选取母语单词来进行相关的外语教学,因此计算机首先必须知道“母语单词”有哪些,比如一个中国人的母语单词就是一本汉语词典中包含的汉语词汇,包括上面提及的“同志”。
每个母语单词有哪些词义:因为计算机要智能地判断一个母语单词的词义,然后教授该词义的外语,因此计算机首先要知道一个母语单词所有可能的词义有哪些,比如“同志”的词义就至少有“革命同志”、“同性恋”等等,又比如“bass”的词义至少有“鲈鱼”、“低音”等等。
每个词义有哪些提示词:因为计算机要根据上下文来智能地判断一个单词的词义,那么按照上面说的“提示词”的方法,计算机就需要知道每个词义有哪些提示词,比如“同志”的“革命同志”词义有“主义”、“革命”、“马克思”等提示词。
每个词义的外语教学内容:当计算机根据上下文中的提示词推测出一个单词的词义后,即可显示该词义对应的外语教学内容,例如当计算机推测出“同志”这个单词的词义是“革命同志”后,显示的外语教学内容可以是:“同志(革命同志)的英语是 comrade。”另外注意“教学内容”不仅可以是这样通常只有一句话的“微课程”,也可以是一系列的“微课程”,每次显示该系列中的一个微课程。
现在,我们再来看这个模型怎么做到“负责原则”——计算机在教外语的时候必须说清楚,自己在教哪个词义的外语。我们的方法就是前面提到的方法:在外语教学内容中注明正在教的是哪个词义,如:“同志(革命同志)的英语是 comrade。”——括号中即注明了这条外语教学内容所教的是“革命同志”这个词义的外语。
前两回我们讨论了 Burling 自动化的第一代模型“机器翻译”和第二代模型“词典式翻译”。它们本质上的优缺点可以概括如下:
“机器翻译”的特点是“智能但不负责”:机器翻译其实有一定的智能,去根据上下文推测一个母语单词(如“同志”)的词义,然后教授这个词义对应的外语;但如果机器翻译推测的词义是错的,那么教给用户的也就是错误的外语(比如网页上有句话:“同志们在认真学习劳动模范的先进事迹。”,计算机如果把这里的“同志”错判为“同性恋”,然后按这个错误的词义,显示一条外语教学内容:“同志的英语是 homosexual。”显然,这就让用户学到了错误的外语)。也就是说,机器翻译是不负责任的。
“词典式翻译”的特点是“负责但不智能”: 词典式翻译并不妄加猜测一个母语单词(如“同志”)的词义,而是把它所有可能的词义都列出来,每个词义后面都提供对应的外语教学内容,让用户自己去选择符合上下文的那个词义并学习对应的外语。因此,词典式翻译不会造成机器翻译那种“教错外语”的情况,因此是“负责”的;但它不够“智能”——不能智能地自动选一个可能符合上下文的词义,而让用户去做“选择词义”这个往往是枯燥繁重的工作,大大打击了用户的学习热情。
于是我们可以认识到,一个比较好的模型,应该同时符合“智能”和“负责”这两大原则。具体来讲:
智能原则:计算机从用户正在浏览的母语网页选出一个母语单词(如“同志”)后,应该用某种方法,根据上下文推测这个单词的词义是什么(虽然未必总是推测正确),然后教这个词义对应的外语,而不是像第二代模型“词典式翻译”那样把一个单词的所有词义都列出来、让用户自己去选择。
负责原则:由于计算机推测词义时可能会出错、造成前面说的“教错外语”的问题,因此计算机在教外语的时候必须说清楚,自己在教哪个词义的外语,以免造成误会。比如前面那个例子,网页上有句话:“同志们在认真学习劳动模范的先进事迹。”,如果计算机把这里的“同志”错判为“同性恋”,然后按这个错误的词义,显示一条外语教学内容:“同志的英语是 homosexual。”那么用户就学到了错误的外语;但如果计算机在外语教学内容中注明,教的是“同性恋”这个词义的外语,也就是把外语教学内容改写成:“同志(同性恋)的英语是 homosexual。”那么用户一看就知道教的词义不是网页上所指的词义,不会把两者的外语混为一谈;同时,用户可以不妨就按照括号里的词义(“同性恋”)来学习这条外语教学内容。
本回即将介绍的 Burling 自动化的第三代模型——“人力打造智能系统”,就是一个“既智能又负责”的模型。
首先,让我们来看这个模型怎么做到“智能原则”——智能地根据上下文判断一个单词的词义。以“同志”这个词为例,如果上下文中出现了“主义”、“革命”、“马克思”、“学习”、“榜样”、“先进”之类的词,那么直觉告诉我们,这个“同志”很可能就是“革命同志”的意思。也就是说,上下文中出现某些特定的“提示词”,往往能暗示一个单词是哪个词义。又比如,假如一个美国人想用 Burling 式的方法学中文,在他浏览一篇母语(即英文)网页时,计算机发现网页上有“bass”一词,想趁机教他“bass”的中文,而“bass”至少有两个意思:“鲈鱼”和“音乐中的低音”;那么我们可以想象,如果“bass”周围出现了“sea”(海)、“fish”(鱼)、“water”(水)、“fishing”(钓鱼)之类跟鱼相关的词,那么这个“bass”可能就是“鲈鱼”的意思;如果“bass”周围出现了“music”(音乐)、“song”(歌曲)、“instrument”(乐器)、“player”(乐手)之类跟音乐相关的词,那么这个“bass”可能就是“低音”的意思。
本回所说的模型正是要用“提示词”来大致推测一个单词是哪个词义。因此,该模型需要掌握如下数据:
用户的母语中有哪些单词:因为计算机要从用户正在浏览的母语网页中选取母语单词来进行相关的外语教学,因此计算机首先必须知道“母语单词”有哪些,比如一个中国人的母语单词就是一本汉语词典中包含的汉语词汇,包括上面提及的“同志”。
每个母语单词有哪些词义:因为计算机要智能地判断一个母语单词的词义,然后教授该词义的外语,因此计算机首先要知道一个母语单词所有可能的词义有哪些,比如“同志”的词义就至少有“革命同志”、“同性恋”等等,又比如“bass”的词义至少有“鲈鱼”、“低音”等等。
每个词义有哪些提示词:因为计算机要根据上下文来智能地判断一个单词的词义,那么按照上面说的“提示词”的方法,计算机就需要知道每个词义有哪些提示词,比如“同志”的“革命同志”词义有“主义”、“革命”、“马克思”等提示词。
每个词义的外语教学内容:当计算机根据上下文中的提示词推测出一个单词的词义后,即可显示该词义对应的外语教学内容,例如当计算机推测出“同志”这个单词的词义是“革命同志”后,显示的外语教学内容可以是:“同志(革命同志)的英语是 comrade。”另外注意“教学内容”不仅可以是这样通常只有一句话的“微课程”,也可以是一系列的“微课程”,每次显示该系列中的一个微课程。
现在,我们再来看这个模型怎么做到前面说的“负责原则”——计算机在教外语的时候必须说清楚,自己在教哪个词义的外语,以免造成误会。我们的方法就是前面提到的方法:在外语教学内容中注明正在教的是哪个词义,如:“同志(革命同志)的英语是 comrade。”——括号中即注明了这条外语教学内容所教的是“革命同志”这个词义的外语。
前两回我们讨论了 Burling 自动化的第一代模型“机器翻译”和第二代模型“词典式翻译”。它们本质上的优缺点可以概括如下:
“机器翻译”的特点是“智能但不负责”:机器翻译其实有一定的智能,去根据上下文推测一个母语单词(如“同志”)的词义,然后教授这个词义对应的外语;但如果机器翻译推测的词义是错的,那么教给用户的也就是错误的外语(比如网页上有句话:“同志们在认真学习劳动模范的先进事迹。”,计算机如果把这里的“同志”错判为“同性恋”,然后按这个错误的词义,显示一条外语教学内容:“同志的英语是 homosexual。”显然,这就让用户学到了错误的外语)。也就是说,机器翻译是不负责任的。
“词典式翻译”的特点是“负责但不智能”: 词典式翻译并不妄加猜测一个母语单词(如“同志”)的词义,而是把它所有可能的词义都列出来,每个词义后面都提供对应的外语教学内容,让用户自己去选择符合上下文的那个词义并学习对应的外语。因此,词典式翻译不会造成机器翻译那种“教错外语”的情况,因此是“负责”的;但它不够“智能”——不能智能地自动选一个可能符合上下文的词义,而让用户去做“选择词义”这个往往是枯燥繁重的工作,大大打击了用户的学习热情。
于是我们可以认识到,一个比较好的模型,应该同时符合“智能”和“负责”这两大原则:
智能原则:计算机从用户正在浏览的母语网页选出一个母语单词(如“同志”)后,应该用某种方法,根据上下文推测这个单词的词义是什么(虽然未必总是推测正确),然后教这个词义对应的外语,而不是像第二代模型“词典式翻译”那样把一个单词的所有词义都列出来、让用户自己去选择。
负责原则:由于计算机推测词义时可能会出错、造成前面说的“教错外语”的问题,因此计算机在教外语的时候必须说清楚,自己在教哪个词义的外语,以免造成误会。比如前面那个例子,网页上有句话:“同志们在认真学习劳动模范的先进事迹。”,如果计算机把这里的“同志”错判为“同性恋”,然后按这个错误的词义,显示一条外语教学内容:“同志的英语是 homosexual。”那么用户就学到了错误的外语;但如果计算机在外语教学内容中注明,教的是“同性恋”这个词义的外语,也就是把外语教学内容改写成:“同志(同性恋)的英语是 homosexual。”那么用户一看就知道教的词义不是网页上所指的词义,不会把两者的外语混为一谈;同时,用户可以不妨就按照括号里的词义(“同性恋”)来学习这条外语教学内容。
本回即将介绍的 Burling 自动化的第三代模型——“人力打造智能系统”,就是一个“既智能又负责”的模型。
首先,让我们来看这个模型怎么做到“智能原则”——智能地根据上下文判断一个单词的词义。以“同志”这个词为例,如果上下文中出现了“主义”、“革命”、“马克思”、“学习”、“榜样”、“先进”之类的词,那么直觉告诉我们,这个“同志”很可能就是“革命同志”的意思。也就是说,上下文中出现某些特定的“提示词”,往往能暗示一个单词是哪个词义。又比如,假如一个美国人想用 Burling 式的方法学中文,在他浏览一篇母语(即英文)网页时,计算机发现网页上有“bass”一词,想趁机教他“bass”的中文,而“bass”至少有两个意思:“鲈鱼”和“音乐中的低音”;那么我们可以想象,如果“bass”周围出现了“sea”(海)、“fish”(鱼)、“water”(水)、“fishing”(钓鱼)之类跟鱼相关的词,那么这个“bass”可能就是“鲈鱼”的意思;如果“bass”周围出现了“music”(音乐)、“song”(歌曲)、“instrument”(乐器)、“player”(乐手)之类跟音乐相关的词,那么这个“bass”可能就是“低音”的意思。总之,本回所说的模型正是要用“提示词”来大致推测一个单词是哪个词义。
然后,我们再来看这个模型怎么做到“负责原则”——计算机在教外语的时候必须说清楚,自己在教哪个词义的外语(以免发生前面说的“教错外语”的问题)。我们的方法就是前面提到的方法:在外语教学内容中注明正在教的是哪个词义,如:“同志(革命同志)的英语是 comrade。”——括号中即注明了这条外语教学内容教的是“革命同志”这个词义的外语。
那么,这个模型需要掌握哪些数据呢?总结起来有以下这些:
用户的母语中有哪些单词:因为计算机要从用户正在浏览的母语网页中选取母语单词来进行相关的外语教学,因此计算机首先必须知道“母语单词”有哪些,比如一个中国人的母语单词就是一本汉语词典中包含的汉语词汇,包括上面提及的“同志”。
每个母语单词有哪些词义:因为计算机要智能地判断一个母语单词的词义,然后教授该词义的外语,因此计算机首先要知道一个母语单词所有可能的词义有哪些,比如“同志”的词义就至少有“革命同志”、“同性恋”等等,又比如“bass”的词义至少有“鲈鱼”、“低音”等等。
每个词义有哪些提示词:因为计算机要根据上下文来智能地判断一个单词的词义,那么按照上面说的“提示词”的方法,计算机就需要知道每个词义有哪些提示词,比如“同志”的“革命同志”词义有“主义”、“革命”、“马克思”等提示词。
每个词义的外语教学内容:当计算机根据上下文中的提示词推测出一个单词的词义后,即可显示该词义对应的外语教学内容,例如当计算机推测出“同志”这个单词的词义是“革命同志”后,显示的外语教学内容可以是:“同志(革命同志)的英语是 comrade。”另外注意“教学内容”不仅可以是这样通常只有一句话的“微课程”,也可以是一系列的“微课程”,每次显示该系列中的一个微课程。
聪明的读者也许已经看出了这个模型的一个重大缺点:它所需要的四种数据(“用户的母语中有哪些单词”、“每个母语单词有哪些词义”、“每个词义有哪些提示词”、“每个词义的外语教学内容”),总体规模很大,需要大量的人力物力才能制作完成。首先,用户的母语词汇中像“同志”这样的母语单词是数以万计的;其次,每个母语单词又可能分出很多词义(前一回里我们讨论过一词多义的复杂性和严重性);再次,每个词义的提示词又可能多如牛毛;最后,要为每个词义设计一系列外语教学“微课程”,从各种角度教授外语知识(如外语单词拼写、发音、用法、例句、相关词组等等),又是一项艰巨的工程。
前两回我们讨论了 Burling 自动化的第一代模型“机器翻译”和第二代模型“词典式翻译”。它们本质上的优缺点可以概括如下:
“机器翻译”的特点是“智能但不负责”:机器翻译其实有一定的智能,去根据上下文推测一个母语单词(如“同志”)的词义,然后教授这个词义对应的外语;但如果机器翻译推测的词义是错的,那么教给用户的也就是错误的外语(比如网页上有句话:“同志们在认真学习劳动模范的先进事迹。”,计算机如果把这里的“同志”错判为“同性恋”,然后按这个错误的词义,显示一条外语教学内容:“同志的英语是 homosexual。”显然,这就让用户学到了错误的外语)。也就是说,机器翻译是不负责任的。
“词典式翻译”的特点是“负责但不智能”:词典式翻译并不妄加猜测一个母语单词(如“同志”)的词义,而是把它所有可能的词义都列出来,每个词义后面都提供对应的外语教学内容,让用户自己去选择符合上下文的那个词义并学习对应的外语。因此,词典式翻译不会造成机器翻译那种“教错外语”的情况,因此是“负责”的;但它不够“智能”——不能智能地自动选一个可能符合上下文的词义,而让用户去做“选择词义”这个往往是枯燥繁重的工作,大大打击了用户的学习热情。
于是我们可以认识到,一个比较好的模型,应该同时符合“智能”和“负责”这两大原则:
智能原则:计算机从用户正在浏览的母语网页选出一个母语单词(如“同志”)后,应该用某种方法,根据上下文推测这个单词的词义是什么(虽然未必总是推测正确),然后教这个词义对应的外语,而不是像第二代模型“词典式翻译”那样把一个单词的所有词义都列出来、让用户自己去选择。
负责原则:由于计算机推测词义时可能会出错、造成前面说的“教错外语”的问题,因此计算机在教外语的时候必须说清楚,自己在教哪个词义的外语,以免造成误会。比如前面那个例子,网页上有句话:“同志们在认真学习劳动模范的先进事迹。”,如果计算机把这里的“同志”错判为“同性恋”,然后按这个错误的词义,显示一条外语教学内容:“同志的英语是 homosexual。”那么用户就学到了错误的外语;但如果计算机在外语教学内容中注明,教的是“同性恋”这个词义的外语,也就是把外语教学内容改写成:“同志(同性恋)的英语是 homosexual。”那么用户一看就知道教的词义不是网页上所指的词义,不会把两者的外语混为一谈;同时,用户可以不妨就按照括号里的词义(“同性恋”)来学习这条外语教学内容。
本回即将介绍的 Burling 自动化的第三代模型——“人力打造智能系统”,就是一个“既智能又负责”的模型。
首先,让我们来看这个模型怎么做到“智能原则”——智能地根据上下文判断一个单词的词义。以“同志”这个词为例,如果上下文中出现了“主义”、“革命”、“马克思”、“学习”、“榜样”、“先进”之类的词,那么直觉告诉我们,这个“同志”很可能就是“革命同志”的意思。也就是说,上下文中出现某些特定的“提示词”,往往能暗示一个单词是哪个词义。又比如,假如一个美国人想用 Burling 式的方法学中文,在他浏览一篇母语(即英文)网页时,计算机发现网页上有“bass”一词,想趁机教他“bass”的中文,而“bass”至少有两个意思:“鲈鱼”和“音乐中的低音”;那么我们可以想象,如果“bass”周围出现了“sea”(海)、“fish”(鱼)、“water”(水)、“fishing”(钓鱼)之类跟鱼相关的词,那么这个“bass”可能就是“鲈鱼”的意思;如果“bass”周围出现了“music”(音乐)、“song”(歌曲)、“instrument”(乐器)、“player”(乐手)之类跟音乐相关的词,那么这个“bass”可能就是“低音”的意思。总之,本回所说的模型正是要用“提示词”来大致推测一个单词是哪个词义。
然后,我们再来看这个模型怎么做到“负责原则”——计算机在教外语的时候必须说清楚,自己在教哪个词义的外语(以免发生前面说的“教错外语”的问题)。我们的方法就是前面提到的方法:在外语教学内容中注明正在教的是哪个词义,如:“同志(革命同志)的英语是 comrade。”——括号中即注明了这条外语教学内容教的是“革命同志”这个词义的外语。
那么,这个模型需要掌握哪些数据呢?总结起来有以下这些:
用户的母语中有哪些单词:因为计算机要从用户正在浏览的母语网页中选取母语单词来进行相关的外语教学,因此计算机首先必须知道“母语单词”有哪些,比如一个中国人的母语单词就是一本汉语词典中包含的汉语词汇,包括上面提及的“同志”。
每个母语单词有哪些词义:因为计算机要智能地判断一个母语单词的词义,然后教授该词义的外语,因此计算机首先要知道一个母语单词所有可能的词义有哪些,比如“同志”的词义就至少有“革命同志”、“同性恋”等等,又比如“bass”的词义至少有“鲈鱼”、“低音”等等。
每个词义有哪些提示词:因为计算机要根据上下文来智能地判断一个单词的词义,那么按照上面说的“提示词”的方法,计算机就需要知道每个词义有哪些提示词,比如“同志”的“革命同志”词义有“主义”、“革命”、“马克思”等提示词。
每个词义的外语教学内容:当计算机根据上下文中的提示词推测出一个单词的词义后,即可显示该词义对应的外语教学内容,例如当计算机推测出“同志”这个单词的词义是“革命同志”后,显示的外语教学内容可以是:“同志(革命同志)的英语是 comrade。”另外注意“教学内容”不仅可以是这样通常只有一句话的“微课程”,也可以是一系列的“微课程”,每次显示该系列中的一个微课程。
聪明的读者也许已经看出了这个模型的一个重大缺点:它所需要的四种数据(见上),总体规模很大,总的来说需要大量的人力物力才能制作完成。首先,用户的母语词汇中像“同志”这样的母语单词是数以万计的;其次,每个母语单词又可能分出很多词义(前一回里我们讨论过一词多义的复杂性和严重性);再次,每个词义的提示词又可能多如牛毛;最后,要为每个词义设计一系列外语教学“微课程”,从各种角度教授外语知识(如外语单词拼写、发音、用法、例句、相关词组等等),又是一项艰巨的工程。
上回我们讨论了 Burling 自动化的第二代模型——“词典式翻译”。它试图把一个母语单词的所有词义都列出来,在每个词义后面都提供相应的外语教学内容。但我们也发现,种种原因使得一个单词的词义数量可能有很多,让用户从中寻找符合上下文的那个词义并非一种轻松愉快的体验。
于是我们可以得到一个启示:一个比较好的模型,一定不是把一个母语单词的所有词义都列出来,而是能“智能”地根据上下文推测一个词义,来进行外语教学。比如,假设网页上有句话:
同志们在认真学习劳动模范的先进事迹。
假设计算机打算教“同志”的外语,并用某种方法,推测出“同志”在这里的词义是“革命同志”,然后展示如下外语教学内容:
同志(革命同志)的英语是 comrade。
我们看到,计算机把这个“同志”的词义推测对了,因此实行了一次正确的外语教学。但是我们也知道,计算机并不能像人那样每次都正确判断一个单词的词义,因为完善的人工智能还没有实现;那么假如计算机把这个“同志”错判成“同性恋”这个词义,会发生什么情况呢?假设计算机按照这个错误的词义,展示了一条外语教学内容:
同志(同性恋)的英语是 homosexual。
我们发现,尽管计算机就一个错误的词义展开了一次外语教学,但却没有给用户带来错误的影响:一方面,用户显然能意识到这里教的词义(同性恋)不是网页上所指的词义(革命同志),因此不会误以为 homosexual 这个外语是“革命同志”的外语;另一方面,尽管这里教的词义跟网页上所指的词义无关,但用户仍然能不妨就按照这里教的词义来学习这条外语教学内容,也就是学习“同性恋”的外语说法。
于是,我们可以总结出,任何好的模型,一定都符合两个要求:
智能:能“智能”地根据上下文推测一个词义,来进行外语教学,如上面这个例子。
负责:在外语教学内容中注明,教的是哪个词义;这样即使教的是一个错误的词义,也不会给用户带来错误的影响,如上面这个例子。
本回即将介绍的 Burling 自动化的第三代模型——“人力打造智能系统”,就是一个“既智能又负责”的模型。
首先,让我们来看这个模型怎么做到“智能”这个要求——“智能”地根据上下文推测一个词义。以“同志”这个词为例,如果上下文中出现了“主义”、“革命”、“马克思”、“学习”、“榜样”、“先进”之类的词,那么直觉告诉我们,这个“同志”很可能就是“革命同志”的意思。也就是说,上下文中出现某些特定的“提示词”,往往能暗示一个单词是哪个词义。又比如,假如一个美国人想用 Burling 式的方法学中文,在他浏览一篇母语(即英文)网页时,计算机发现网页上有“bass”一词,想趁机教他“bass”的中文,而“bass”至少有两个意思:“鲈鱼”和“音乐中的低音”;那么我们可以想象,如果“bass”周围出现了“sea”(海)、“fish”(鱼)、“water”(水)、“fishing”(钓鱼)之类跟鱼相关的词,那么这个“bass”可能就是“鲈鱼”的意思;如果“bass”周围出现了“music”(音乐)、“song”(歌曲)、“instrument”(乐器)、“player”(乐手)之类跟音乐相关的词,那么这个“bass”可能就是“低音”的意思。总之,本回所说的模型正是要用“提示词”这个办法来大致推测一个单词是哪个词义。
然后, 让我们来看这个模型怎么做到“负责”这个要求——在外语教学内容中注明,教的是哪个词义。这个要求本身已经告诉我们该怎么做了,就是“在外语教学内容中注明,教的是哪个词义”,如前面举过的一个例子:
同志(革命同志)的英语是 comrade。
现在我们再来看,这个模型需要掌握哪些数据呢?总结起来有以下这些:
上回我们讨论了 Burling 自动化的第三代模型——“人力打造智能系统”。它是一种智能、负责但需要大量人力物力来实现的模型,因此不够现实。那么,有没有成本低廉、“四两拨千斤”的方法呢?
2012 年 5 月,信息产业巨头谷歌(Google)的一个举动,启发笔者想到了一个更好的模型。当时一家叫 Use All Five Inc. 的小公司,发布了一个叫 Language Immersion for Chrome 的软件;这个软件运行在谷歌的 Chrome 浏览器里,能把你正在浏览的母语网页上的某些母语单词用谷歌的机器翻译系统(Google Translate)翻译成一门外语,目的是让你在阅读母语网页时顺便就学到一些外语。这个软件事实上是 Google 委托 Use All Five Inc. 开发的,而且 Google 的各种宣传渠道也对这个软件做了铺天盖地的宣传。
读者不难看出,这个软件用的就是本书第十二回所说的“Burling 自动化的第一代模型:机器翻译”。在那一回里我们也讨论过这个模型的缺点——可能教错外语,而且用户学错了外语还浑然不自知。虽然机器翻译并不是一种理想的 Burling 自动化模型,但 Language Immersion for Chrome 的新闻里的一句话还是引起了笔者的注意,就是该软件能让你学习 Google Translate 所支持的 64 种语言中的任何一种(Google Translate 当时支持 64 种语言,而在笔者写本回时,Google Translate 已经支持 103 种语言了)。这个软件本身开发起来并不复杂(主要只是直接去调用 Google Translate 来翻译母语网页上的某些单词罢了),但能一下子支持 64 种外语的学习,这当然是因为它站在了 Google Translate 这个巨人的肩上。当时笔者对 Burling 自动化的思想停留在第三代模型上;如同上回所说,第三代模型需要耗费大量人力物力来建设该模型所需的数据;因此 Language Immersion for Chrome 这种“充分利用现成资源(指 Google Translate)来立即达到一个巨大的效果”的策略,深深地震撼了笔者。
于是笔者就想,我们能不能用某种现成资源(但不是机器翻译系统,因为机器翻译的结果并不可靠),来很好地实现 Burling 自动化呢?
然后笔者真的想到了这样一种现成资源!它就是“双语句对”(bilingual sentence pairs)。什么叫“双语句对”?我们来看一个例子:
(中文)他是一个好学生。
(英文)He is a good student.
没错,就是同一句话分别用两种语言表达一次。在美剧、美国电影里,屏幕底部往往有双语字幕,那其实就是一种双语句对。那么,“双语句对”这种数据资源如何能实现 Burling 自动化呢?我们来看一个例子。
假如一个中国人想学英语,而他此时正在浏览一篇中文网页,网页上出现了“学生”这个词;假设计算机打算趁此机会,教他“学生”的英语怎么说,那么计算机只要从一个双语句库(即包含了很多双语句对的数据库)里找到一个含有“学生”的双语句对(比如上面提到的那个句对),把它作为外语教学内容投放到网页上即可。这样,这个中国人不仅能学到“学生”对应的英语单词“student”,还能在一句真实的句子中学习“student”的各种深层次的语言学特征,比如它是可数名词还是不可数名词,习惯跟什么单词搭配,跟别的近义词有什么意思上的区别,等等等等。至于发音方面,计算机可以提供一个按钮,点击后能用语音朗读技术(text to speech)自动把双语句对中的英文句子朗读出来。
以上就是基本的设想。当然我们还可以进一步改进这个设想。比如,如果计算机在双语句库中发现有多个双语句对都包含了“学生”,那么计算机可以从中选一个“最有可能跟网页上的原句相关”的双语句对,也就是一个不仅包含了“学生”、最好还包含网页原句中出现的其它单词(即“上下文单词”)的句对,因为这种句对更有可能能跟网页原句有相同或者相近的话题背景。如果“学生”是一个多义词,那么用这种方法找出来的双语句对的“学生”就更有可能跟网页上的“学生”在词义上相同。也就是说,这种方法能比较智能地选择一条外语教学内容,使教学内容尽量教网页上所指的词义的外语,也就是说,这种模型能满足上回所说的“智能”要求。
另一方面,读者可能要问,如果计算机找出的双语句对中的“学生”的意思跟网页上的“学生”并不相同呢(假设“学生”是个多义词)?其实也没问题,因为用户可以根据双语句对的上下文知道句对中的“学生”是什么意思、根据网页上下文知道网页上的“学生”是什么意思,如果这两个意思不同,用户就姑且按照双语句对中所指的意思来学习这个双语句对所教的外语。也就是说,这种模型能满足上回所说的“负责”要求。
以上就是 Burling 自动化的第四代模型——“用现成数据来办事”。这种模型用“双语句对”这种“现成数据”,一方面作为“外语教学内容”,另一方面也作为一种手段,来智能地选择跟网页内容尽可能相关的教学内容。
有的读者可能会有疑问:光用双语句对就能教好外语?在下一回里,我们将进一步提供这种方法背后的科学依据。
上回我们讨论了 Burling 自动化的第三代模型——“人力打造智能系统”。它是一种智能、负责但需要大量人力物力来实现的模型,因此不够现实。那么,有没有成本低廉、“四两拨千斤”的方法呢?
2012 年 5 月,信息产业巨头谷歌(Google)的一个举动,启发笔者想到了一个更好的模型。当时一家叫 Use All Five Inc. 的小公司,发布了一个叫 Language Immersion for Chrome 的软件;这个软件运行在谷歌的 Chrome 浏览器里,能把你正在浏览的母语网页上的某些母语单词用谷歌的机器翻译系统(Google Translate)翻译成一门外语,目的是让你在阅读母语网页时顺便就学到一些外语。这个软件事实上是 Google 委托 Use All Five Inc. 开发的,而且 Google 的各种宣传渠道也对这个软件做了铺天盖地的宣传。
读者不难看出,这个软件用的就是本书第十二回所说的“Burling 自动化的第一代模型:机器翻译”。在那一回里我们也讨论过这个模型的缺点——可能教错外语,而且用户学错了外语还浑然不自知。虽然机器翻译并不是一种理想的 Burling 自动化模型,但 Language Immersion for Chrome 的新闻里的一句话还是引起了笔者的注意,就是该软件能让你学习 Google Translate 所支持的 64 种语言中的任何一种(Google Translate 当时支持 64 种语言,而在笔者写本回时,Google Translate 已经支持 103 种语言了)。这个软件本身开发起来并不复杂——主要只是去调用一个现成的机器翻译系统,但能一下子支持 64 种外语的学习,这当然是因为它站在了 Google Translate 这个巨人的肩上。当时笔者对 Burling 自动化的思想停留在第三代模型上;如同上回所说,第三代模型需要耗费大量人力物力来建设该模型所需的数据;因此 Language Immersion for Chrome 这种“充分利用现成资源(指 Google Translate)来办事”的策略,深深地震撼了笔者。
于是笔者就想,我们能不能用某种现成资源(但不是机器翻译系统,因为机器翻译的结果并不可靠),来很好地实现 Burling 自动化呢?
然后笔者真的想到了这样一种现成资源!它就是“双语句对”(bilingual sentence pairs)。什么叫“双语句对”?我们来看一个例子:
(中文)他是一个好学生。
(英文)He is a good student.
没错,就是同一句话分别用两种语言表达一次。在美剧、美国电影里,屏幕底部往往有双语字幕,那其实就是一种双语句对。那么,“双语句对”这种数据资源如何能实现 Burling 自动化呢?我们来看一个例子。
假如一个中国人想学英语,而他此时正在浏览一篇中文网页,网页上出现了“学生”这个词;假设计算机打算趁此机会,教他“学生”的英语怎么说,那么计算机只要从数据库里找一个含有“学生”的双语句对(比如上面提到的那个句对),把它作为外语教学内容投放到网页上即可。这样,这个中国人不仅能学到“学生”对应的英语单词“student”,还能在一句真实的句子中学习“student”的各种深层次的语言学特征,比如它是可数名词还是不可数名词,习惯跟什么单词搭配,跟别的近义词有什么意思上的区别,等等等等。至于发音方面,计算机可以提供一个按钮,点击后用语音朗读技术(text to speech)自动把双语句对中的英文句子朗读出来。
以上就是基本的设想。当然我们还可以进一步改进这个设想。比如,如果计算机在数据库中发现有多个双语句对都包含了“学生”,那么计算机可以从中选一个“最有可能跟网页上的原句相关”的双语句对,也就是一个不仅包含了“学生”、最好还包含网页原句中出现的其它单词(即“上下文单词”)的句对,因为这种句对更有可能跟网页原句有相同或相近的话题背景。如果“学生”是一个多义词,那么用这种方法找出来的双语句对里的“学生”就更有可能跟网页上的“学生”在词义上相同。也就是说,这种方法能比较智能地选择一条外语教学内容,使教学内容尽量教网页上所指的词义的外语;或者说,这种模型能满足上回所说的“智能”要求。
另一方面,读者可能要问,如果计算机找出的双语句对中的“学生”的意思跟网页上的“学生”并不相同呢(假设“学生”是个多义词)?其实也没问题,因为用户可以根据双语句对里的上下文知道句对中的“学生”是什么意思、根据网页上下文知道网页上的“学生”是什么意思,如果这两个意思不同,用户就姑且按照双语句对中所指的意思来学习这个双语句对。也就是说,这种模型能满足上回所说的“负责”要求。
以上就是 Burling 自动化的第四代模型——“用现成数据来办事”。这种模型用“双语句对”这种“现成数据”,一方面作为“外语教学内容”,另一方面也作为一种手段,来智能地选择跟网页内容尽可能相关的教学内容,可谓一举两得。
有的读者可能会有疑问:光用双语句对就能教好外语?在下一回里,我们将进一步提供这种方法背后的科学依据。
上回我们讨论了 Burling 自动化的第四代模型——“用现成数据办事”。该模型提出用“双语句对”这种广泛存在的现成数据来实现外语教学,从而无需耗费大量人工去专门编写外语教学内容和和一个智能系统所需的其它数据,大大降低了系统开发成本。我们可以把它比作科幻小说《海底两万里》中的虚构潜艇“鹦鹉螺号”——该潜艇自动从海水中提取钠作为前进动力、提取淡水作为饮用水并捕捉海洋生物作为船员的食物,而在 Burling 自动化的第四代模型里,“双语句对”就是驱动我们的“外语教学潜艇”的丰富的“自然资源”。双语句对来源广泛——影视作品的多语言字幕文件、世界名著的多国译本、全世界的翻译社每天产生的大量翻译结果、某些国家(如加拿大和新加坡)政府发表的双语/多语公文,都有可能提取出双语句对。双语句对的这种大量存在,已经使它成为一些领域所倚赖的重要数据资源:统计式机器翻译系统(statistical machine translation,如谷歌的 Google Translate 和微软的 Bing Translator)依靠双语句对来教计算机如何翻译用户提交的句子;计算机辅助翻译系统(computer-assisted translation)在一个人类翻译员开始翻译一个新的句子前,自动从一个双语句对库中寻找最接近该句子的现成双语句对,于是人类翻译员往往只要在这个现成翻译结果的基础上做少量修改,就能完成对新句子的翻译;我们熟知的双语词典(如《牛津高阶英汉双解词典》)和其它类型的外语参考书,更是以双语例句来演示一个单词的用法。
很多读者可能要问笔者:“你用双语句对来做 Burling 自动化的第四代模型,最初的出发点固然是因为这种数据在世界上大量存在、来得容易,但如果仅用双语句对来做外语教学内容,而不教授语法等知识,你的这种外语教学方法是不是有失偏颇呢?”——问得好!本回接下来就是要解释这其中的奥妙,并颠覆你对外语教学的传统认知。
(To be continued.)
上回我们讨论了 Burling 自动化的第三代模型——“人力打造智能系统”。它是一种智能、负责但需要大量人力物力来实现的模型,因此不够现实。那么,有没有成本低廉、“四两拨千斤”的方法呢?
2012 年 5 月,信息产业巨头谷歌(Google)的一个举动,启发笔者想到了一个更好的模型。当时一家叫 Use All Five Inc. 的小公司,发布了一个叫 Language Immersion for Chrome 的软件;这个软件运行在谷歌的 Chrome 浏览器里,能把你正在浏览的母语网页上的某些母语单词用谷歌的机器翻译系统(Google Translate)翻译成一门外语,目的是让你在阅读母语网页时顺便就学到一些外语。这个软件事实上是 Google 委托 Use All Five Inc. 开发的,而且 Google 的各种宣传渠道也对这个软件做了铺天盖地的宣传。
读者不难看出,这个软件用的就是本书第十二回所说的“Burling 自动化的第一代模型:机器翻译”。在那一回里我们也讨论过这个模型的缺点——可能教错外语,而且用户学错了外语还浑然不自知。虽然机器翻译并不是一种理想的 Burling 自动化模型,但 Language Immersion for Chrome 的新闻里的一句话还是引起了笔者的注意,就是该软件能让你学习 Google Translate 所支持的 64 种语言中的任何一种(Google Translate 当时支持 64 种语言,而在笔者写本回时,Google Translate 已经支持 103 种语言了)。这个软件本身开发起来并不复杂——主要只是去调用一个现成的机器翻译系统,但能一下子支持 64 种外语的学习,这当然是因为它站在了 Google Translate 这个巨人的肩上。当时笔者对 Burling 自动化的思想停留在第三代模型上;如同上回所说,第三代模型需要耗费大量人力物力来建设该模型所需的数据;因此 Language Immersion for Chrome 这种“充分利用现成资源(指 Google Translate)来办事”的策略,深深地震撼了笔者。
于是笔者就想,我们能不能用某种现成资源(但不是机器翻译系统,因为机器翻译的结果并不可靠),来很好地实现 Burling 自动化呢?
然后笔者真的想到了这样一种现成资源!它就是“双语句对”(bilingual sentence pairs)。什么叫“双语句对”?我们来看一个例子:
(中文)他是一个好学生。
(英文)He is a good student.
没错,就是同一句话分别用两种语言表达一次。在美剧、美国电影里,屏幕底部往往有双语字幕,那其实就是一种双语句对。双语句对是一种在世界上广泛存在的数据资源——影视作品的多语言字幕文件、世界名著的多国译本、全世界的翻译社每天产生的大量翻译结果、某些国家(如加拿大和新加坡)政府发表的双语/多语公文,都可以提取出双语句对。那么,“双语句对”这种数据资源如何能实现 Burling 自动化呢?我们来看一个例子。
假如一个中国人想学英语,而他此时正在浏览一篇中文网页,网页上出现了“学生”这个词;假设计算机打算趁此机会,教他“学生”的英语怎么说,那么计算机只要从数据库里找一个含有“学生”的双语句对(比如上面提到的那个句对),把它作为外语教学内容投放到网页上即可。这样,这个中国人不仅能学到“学生”对应的英语单词“student”,还能在一句真实的句子中学习“student”的各种深层次的语言学特征,比如它是可数名词还是不可数名词,习惯跟什么单词搭配,跟别的近义词有什么意思上的区别,等等等等。至于发音方面,计算机可以提供一个按钮,点击后用语音朗读技术(text to speech)自动把双语句对中的英文句子朗读出来。
以上就是基本的设想。当然我们还可以进一步改进这个设想。比如,如果计算机在数据库中发现有多个双语句对都包含了“学生”,那么计算机可以从中选一个“最有可能跟网页上的原句相关”的双语句对,也就是一个不仅包含了“学生”、最好还包含网页原句中出现的其它单词(即“上下文单词”)的句对,因为这种句对更有可能跟网页原句有相同或相近的话题背景。如果“学生”是一个多义词,那么用这种方法找出来的双语句对里的“学生”就更有可能跟网页上的“学生”在词义上相同。也就是说,这种方法能比较智能地选择一条外语教学内容,使教学内容尽量教网页上所指的词义的外语;或者说,这种模型能满足上回所说的“智能”要求。
另一方面,读者可能要问,如果计算机找出的双语句对中的“学生”的意思跟网页上的“学生”并不相同呢(假设“学生”是个多义词)?其实也没问题,因为用户可以根据双语句对里的上下文知道句对中的“学生”是什么意思、根据网页上下文知道网页上的“学生”是什么意思,如果这两个意思不同,用户就姑且按照双语句对中所指的意思来学习这个双语句对。也就是说,这种模型能满足上回所说的“负责”要求。
以上就是 Burling 自动化的第四代模型——“用现成数据来办事”。这种模型用“双语句对”这种“现成数据”,一方面作为“外语教学内容”,另一方面也作为一种手段,来智能地选择跟网页内容尽可能相关的教学内容,可谓一举两得。
顺便提一下,由于双语句对是一种在世界上大量存在的数据资源,一些领域早已开始了对它的利用:统计式机器翻译系统(statistical machine translation,如谷歌的 Google Translate 和微软的 Bing Translator)依靠双语句对来教计算机如何翻译用户提交的句子;计算机辅助翻译系统(computer-assisted translation)在一个人类翻译员开始翻译一个新的句子前,自动从一个双语句对库中寻找最接近该句子的现成双语句对,于是人类翻译员往往只要在这个现成翻译结果的基础上做少量修改,就能完成对新句子的翻译;我们熟知的双语词典(如《牛津高阶英汉双解词典》)和其它类型的外语参考书,更是以双语例句来演示一个单词的用法。
但有的读者可能会有疑问:光用双语句对就能教好外语?在下一回里,我们将进一步提供这种方法背后的科学依据。
上回我们讨论了 Burling 自动化的第四代模型——“用现成数据办事”。该模型提出用“双语句对”这种广泛存在的数据资源来实现外语教学,从而无需耗费大量人工去专门编写外语教学内容和和一个智能系统所需的其它数据,大大降低了系统开发成本。我们可以把第四代模型比作科幻小说《海底两万里》中的虚构潜艇“鹦鹉螺号”——该潜艇自动从海水中提取钠作为前进动力、提取淡水作为饮用水并捕捉海洋生物作为船员的食物,而在 Burling 自动化的第四代模型里,“双语句对”就是驱动我们的“外语教学潜艇”的丰富的“自然资源”。
很多读者可能要问笔者:“你用双语句对来做 Burling 自动化的第四代模型,最初的出发点固然是因为这种数据在世界上大量存在、来得容易,但如果仅用双语句对来做外语教学内容,而不教授语法等知识,你的这种外语教学方法是不是有失偏颇呢?”——问得好!本回接下来就是要解释这其中的奥妙,并颠覆你对外语教学的传统认知。
首先我们要知道,要教任何一个知识、道理,基本上都有两种教法,一种叫“规则教学”,一种叫“实例教学”。比如如果我们要教“buy”这个动词怎么造句(也就是 buy 的“句法”——syntax),我们可以把 buy 的造句规则总结成一个“公式”教给学习者:
<买家> buy <商品> [for <价格>] [from <卖家>]
方括号表示其中的内容可有可无,尖括号表示其中是一个实际造句时需要填写的内容;但我们也可以直接造一个例句来向学习者展示 buy 的造句方法:
I bought an iPhone for RMB 5588 from Tmall.(我花 5588 元从天猫买了个 iPhone。)
以上第一种教法就是一种“规则教学”——你直接把语言的规则展示给学习者,而第二种教法则是一种“实例教学”——你通过举例说明的方式把 buy 的造句方法展示给学习者。就外语教学而言,“规则教学”意味着把语法等等语言规则作为教学的重点,注重对一个句子的语法结构分析,等等;而“实例教学”则意味着让学习者看、听大量真实的外语句子,让学习者在外语句子和母语句子的对照中自然掌握其中的语言规律。“规则教学”是很多地方(包括中国大陆)传统上奉行的外语教学观念,而我们上回介绍的“Burling 自动化的第四代模型”则显然是一种“实例教学”方案,看上去与传统教学观念大相径庭。
然而事实上,当代认知科学和外语教学的主流理论,以及美国等先进国家几十年来的教学实践,却都指出“实例教学”才是真正一流的教学理念。在介绍这些科学理论之前,我们不妨来做一个小小的观察。
如果我问你,“我有一位叔叔”是不是一个正确的汉语表达,你会说“当然啦。”
——那么“我有一位舅舅”呢?你会说“正确啊。”
——那么“我有一位儿子”呢?你会皱眉说:“一位儿子?听起来有点别扭啊,应该不对。”
——那么“我有一位孙子”呢?你会大笑:“胡说八道,孙子怎么能用‘一位’?!”
——那么我再问你,“这说明‘位’这个字的用法有什么规则?”你可能总结出:“长辈可以用‘位’,晚辈不能。”
——那我再问你:“‘我有一位哥哥’这种说法对不对?”你可能会说:“如果这个‘哥哥’只比‘我’年长一两岁,用‘位’可能不够格,除非是比‘我’年长一辈或以上的‘大哥’才行吧。”
——我说:“看来‘位’的的使用条件要修正为:‘用于长辈,而且要年长至少一辈或以上’。”你说:“对。”
——那我再问:“那么‘一位朋友’、‘一位同学’、‘一位医生’这些说法对不对?”你会说:“当然对呀。”
——我问:“这说明‘位’这个量词又多了什么使用规则?”你会说:“除了用于年长至少一辈或以上的长辈,还可以用于亲戚以外的人际关系如朋友、同学,以及从事某种职业的人如医生。”
——我说:“你看,小小的一个‘位’字居然背后有这么多使用规则,你以前学习过这些规则吗?”你会说:“没有呀。”
——我问:“那你是怎么掌握‘位’这个量词的用法的?”你可能就被我问住了:“这……”
事实上,我们之所以能不学规则就掌握我们母语中“位”这个量词的用法,正是因为我们看过、听过很多关于“位”的实例:“一位叔叔”、“一位舅舅”、“一位老爷爷”、“一位同学”、“一位朋友”、“一位民警”等等等等;我们之所以对“一位儿子”和“一位孙子”感觉不对劲,是因为我们从来没听说过这种说法(或者至少是类似的说法)。也就是说,我们判断“一位ㄨㄨ”是否正确,靠的不是规则(我们并没有学过或者研究过有关规则),而是我们听说过的实例——如果我们听说过“一位老爷爷”,那么“一位老奶奶”大概也是正确的;如果我们从来没听说过“一位儿子”、“一位孙子”,那么这些很可能就是不正确的。由此可见,我们对母语的掌握,靠的就是接触大量的“实例”,而非系统地学习母语的规则——事实上我们根本没学母语的语法就已经会说话、写字了。
我们学我们的母语时用的是“实例教学”的方法,那么外国人学他们的母语(对我们来说就是外语)时,当然也是用“实例教学”的方法。就以英语中的 study 和 learn 这对近义词的用法为例,我们是通过在外语课堂上听老师做这两个词的“近义词辨析”来学它们的用法区别的——在第十三回里,我们提到至少有 6 条规则来区分 study 和 learn 的用法:
1. “学习理论知识”可以用 study 或 learn(如 study physics 或 learn physics);
2. “学习经验性的技能”应该用 learn(如 learn to swim);
3. “做(理论)学习的尝试”应该用 study(如 I studied math last week but didn't learn anything.——上周我学了数学但没学会任何东西。);
4. “学到”应该用 learn(如 3 中的例子);
5. “在学校正式就读”应该用 study(如 I studied at Harvard);
6. “学习某人/某事的榜样/经验/教训”应该用 learn(如 learn from his success)。
但一个英美儿童却不是靠学习这些规则来学会 study 和 learn 的用法的,而恰恰是靠类似我们前说的汉语里的“位”的学法——“实例教学”来学会的。比如,一个英美儿童会听过/看过很多诸如“study math”、“study history”、“study English”、“study biology”、“study geography”之类的实例,但从来没听过/看过“study swimming”、“study cooking”、“study driving”之类的实例,于是他的潜意识里就会产生一种印象:study 这个词是跟坐在课堂里正儿八经拿着书学的那些东西(如数学、历史)联系在一起的,而从来不跟那些需要实践的东西(如游泳、烧菜、开车)联系在一起。注意这只是一种“潜意识”中的印象,而非“意识”中明确意识到的规则,就好像我们在用前面说的“位”这个量词时也从来没有明确意识到什么规则一样——仅凭接触过的实例就能判断一个说法是否“地道”。
有了以上的观察和分析,我们就不难理解美国著名语言学家和认知科学家诺姆·乔姆斯基(Noam Chomsky)关于人类如何学习语言的论断——他认为幼儿的头脑中天生就有一种学习语言的能力,他称之为“语言习得机制”(language acquisition device: LAD);有了这种机制,再加上幼儿在后天观察到大量的语言实例(如中国幼儿观察到大量关于“位”这个量词的实例,以及英美儿童观察到大量关于“study”和“learn”的实例),那么这种机制就能自动将这些语言实例转化为幼儿运用该语言的能力。换句话说,幼儿头脑中天生有一种设备,这设备观测到外界大量的语言实例后,自动培养出幼儿的语言能力,就像牛马羊的胃能自动把吃进去的干草转化成能量。
到现在为止,我们恐怕都不会否认,人类学母语的确是通过“实例教学”来实现的;那么,我们学外语,是应该用类似学母语的“实例教学”呢,还是用传统上的外语教学观念——“规则教学”呢?当代主流的外语教学理论以及数十年来的实践都认为,“实例教学”才是正道。这种理论的代表人物是当代外语教学之父、美国著名语言学家和外语教学研究者史蒂芬·克拉申(Stephen Krashen)。他认为,一个人学好外语的必要条件是“让头脑吸收足够数量的、可理解的外语信息(a sufficient amount of comprehensible L2 input)”。这就是说,首先你必须看到、听到大量的外语句子,其次这些外语句子必须是“可理解的”——你必须能明白它们的意思。要能理解一个外语句子的意思,一个好办法就是同时为这个外语句子配上母语对照。回想到我们的 Burling 自动化第四代模型,正是用外语和母语对照的“双语句对”——而且是大量的双语句对——来实现外语教学,因此是十分符合克拉申的理论的。
现在我们已经论证完了为什么在外语教学中“实例教学”远优于“规则教学”。笔者想补充的一点是,虽然我们已经明白了“实例教学”应该作为外语教学的主体,但对于“规则教学”也不必完全禁止。例如,虽然第四代模型原则上纯粹用大量双语句对来做外语教学内容,但如果有人自愿在一些双语句对后面追加“语法结构分析”、“近义词辨析”等“规则教学”内容,系统也应该允许这些人工追加的内容跟双语句对一起展示给学习者。
在下一回里,我们将介绍一个实现第四代模型的计划。
上回我们讨论了 Burling 自动化的第四代模型——“用现成数据办事”。该模型提出用“双语句对”这种广泛存在的数据资源来实现外语教学,从而无需耗费大量人工去专门编写外语教学内容和和一个智能系统所需的其它数据,大大降低了系统开发成本。我们可以把第四代模型比作科幻小说《海底两万里》中的虚构潜艇“鹦鹉螺号”——该潜艇自动从海水中提取钠作为前进动力、提取淡水作为饮用水并捕捉海洋生物作为船员的食物,而在 Burling 自动化的第四代模型里,“双语句对”就是驱动我们的“外语教学潜艇”的丰富的“自然资源”。
很多读者可能要问笔者:“你用双语句对来做第四代模型,最初的出发点固然是因为这种数据在世界上大量存在、来得容易,但如果仅用双语句对来做外语教学内容,而不教授语法等知识,你的这种外语教学方法是不是有失偏颇呢?”——问得好!本回接下来就是要解释这其中的奥妙,并颠覆你对外语教学的传统认知。
首先我们要知道,要教任何一个知识、道理,基本上都有两种教法,一种叫“规则教学”,一种叫“实例教学”。比如如果我们要教“buy”这个动词怎么造句,我们可以给出一条“公式”:
<买家> buy <商品> [for <价格>] [from <卖家>]
方括号表示其中的内容可有可无,尖括号表示其中是一个实际造句时需要填写的内容;但我们也可以直接造一个例句来向学习者展示 buy 的造句方法:
I bought an iPhone for RMB 5588 from Tmall.(我花 5588 元从天猫买了个 iPhone。)
以上第一种教法就是一种“规则教学”——你直接把语言的规则展示给学习者,而第二种教法则是一种“实例教学”——你通过举例说明的方式把 buy 的造句方法展示给学习者。就外语教学而言,“规则教学”意味着把语法等等语言规则作为教学的重点,注重对一个句子的语法结构分析,等等;而“实例教学”则意味着让学习者看、听大量真实的外语句子,让学习者在外语句子和母语句子的对照中自然掌握其中的语言规律。“规则教学”是很多地方(包括中国大陆)传统上奉行的外语教学观念,而我们上回介绍的“Burling 自动化的第四代模型”则显然是一种“实例教学”方案,看上去与传统教学观念大相径庭。
然而事实上,当代认知科学和外语教学的主流理论,以及美国等先进国家几十年来的教学实践,却都指出“实例教学”才是真正一流的教学理念。在介绍这些科学理论之前,我们不妨来做一个小小的观察。
如果我问你,“我有一位叔叔”是不是一个正确的汉语表达,你会说“当然啦。”
——那么“我有一位舅舅”呢?你会说“正确啊。”
——那么“我有一位儿子”呢?你会皱眉说:“一位儿子?听起来有点别扭啊,应该不对。”
——那么“我有一位孙子”呢?你会大笑:“胡说八道,孙子怎么能用‘一位’?!”
——那么我再问你,“这说明‘位’这个字的用法有什么规则?”你可能总结出:“长辈可以用‘位’,晚辈不能。”
——那我再问你:“‘我有一位哥哥’这种说法对不对?”你可能会说:“如果这个‘哥哥’只比‘我’年长一两岁,用‘位’可能不够格,除非是比‘我’年长一辈或以上的‘大哥’才行吧。”
——我说:“看来‘位’的的使用条件要修正为:‘用于长辈,而且要年长至少一辈或以上’。”你说:“对。”
——那我再问:“那么‘一位朋友’、‘一位同学’、‘一位医生’这些说法对不对?”你会说:“当然对呀。”
——我问:“这说明‘位’这个量词又多了什么使用规则?”你会说:“除了用于年长至少一辈或以上的长辈,还可以用于亲戚以外的人际关系如朋友、同学,以及从事某种职业的人如医生。”
——我说:“你看,小小的一个‘位’字居然背后有这么多使用规则,你以前学习过这些规则吗?”你会说:“没有呀。”
——我问:“那你是怎么掌握‘位’这个量词的用法的?”你可能就被我问住了:“这……”
事实上,我们之所以能不学规则就掌握我们母语中“位”这个量词的用法,正是因为我们看过、听过很多关于“位”的实例:“一位叔叔”、“一位舅舅”、“一位老爷爷”、“一位同学”、“一位朋友”、“一位民警”等等等等;我们之所以对“一位儿子”和“一位孙子”感觉不对劲,是因为我们从来没听说过这种说法(或者至少是类似的说法)。也就是说,我们判断“一位ㄨㄨ”是否正确,靠的不是规则(我们并没有学过或者研究过有关规则),而是我们听说过的实例——如果我们听说过“一位老爷爷”,那么“一位老奶奶”大概也是正确的;如果我们从来没听说过“一位儿子”、“一位孙子”,那么这些很可能就是不正确的。由此可见,我们对母语的掌握,靠的就是接触大量的“实例”,而非系统地学习母语的规则——事实上我们根本没学母语的语法就已经会说话、写字了。
我们学我们的母语时用的是“实例教学”的方法,那么外国人学他们的母语(对我们来说就是外语)时,当然也是用“实例教学”的方法。就以英语中的 study 和 learn 这对近义词的用法为例,我们是通过在外语课堂上听老师做这两个词的“近义词辨析”来学它们的用法区别的——在第十三回里,我们提到至少有 6 条规则来区分 study 和 learn 的用法:
1. “学习理论知识”可以用 study 或 learn(如 study physics 或 learn physics);
2. “学习经验性的技能”应该用 learn(如 learn to swim);
3. “做(理论)学习的尝试”应该用 study(如 I studied math last week but didn't learn anything——上周我学了数学但没学会任何东西);
4. “学到”应该用 learn(如 3 中的例子);
5. “在学校正式就读”应该用 study(如 I studied at Harvard);
6. “学习某人/某事的榜样/经验/教训”应该用 learn(如 learn from his success)。
但一个英美儿童却不是靠学习这些规则来学会 study 和 learn 的用法的,而恰恰是靠类似我们前说的汉语里的“位”的学法——“实例教学”来学会的。比如,一个英美儿童会听过/看过很多诸如“study math”、“study history”、“study English”、“study biology”、“study geography”之类的实例,但从来没听过/看过“study swimming”、“study cooking”、“study driving”之类的实例,于是他的潜意识里就会产生一种印象:study 这个词是跟坐在课堂里正儿八经拿着书学的那些东西(如数学、历史)联系在一起的,而从来不跟那些需要实践的东西(如游泳、烧菜、开车)联系在一起。注意这只是一种“潜意识”中的印象,而非“意识”中明确意识到的规则,就好像我们在用前面说的“位”这个量词时也从来没有明确意识到什么规则一样——仅凭接触过的实例就能判断一个说法是否“地道”。
有了以上的观察和分析,我们就不难理解美国著名语言学家和认知科学家诺姆·乔姆斯基(Noam Chomsky)关于人类如何学习语言的论断——他认为幼儿的头脑中天生就有一种学习语言的能力,他称之为“语言习得机制”(language acquisition device: LAD);有了这种机制,再加上幼儿在后天观察到大量的语言实例(如中国幼儿观察到大量关于“位”这个量词的实例,以及英美儿童观察到大量关于“study”和“learn”的实例),那么这种机制就能自动将这些语言实例转化为幼儿运用该语言的能力。换句话说,幼儿头脑中天生有一种设备,这设备观测到外界大量的语言实例后,自动培养出幼儿的语言能力,就像牛马羊的胃能自动把吃进去的干草转化成能量一样。
到现在为止,我们恐怕都不会否认,人类学母语的确是通过“实例教学”来实现的;那么,我们学外语,是应该用类似学母语的“实例教学”呢,还是用传统上的外语教学观念——“规则教学”呢?当代主流的外语教学理论以及数十年来的实践都认为,“实例教学”才是正道。这种理论的代表人物是当代外语教学之父、美国著名语言学家和外语教学研究者史蒂芬·克拉申(Stephen Krashen)。他认为,一个人学好外语的必要条件是“让头脑吸收足够数量的、可理解的外语信息(a sufficient amount of comprehensible L2 input)”。这就是说,首先你必须看到、听到大量的外语句子,其次这些外语句子必须是“可理解的”——你必须有办法得知它们的意思,否则你不过是在看/听“天书”而已。要知道一个外语句子的意思,一个好办法就是同时为这个外语句子配上母语对照。回想到我们的 Burling 自动化第四代模型,正是用外语和母语对照的“双语句对”——而且是大量的双语句对——来实现外语教学,因此是十分符合克拉申的理论的。
另外值得注意的是,克拉申理论强调对外语信息的大量看、听(也就是“输入”),但不主张学习者过早地说、写(也就是“输出”);这其中的一个原因是,学习者早期对一个外语用法的掌握是不完备的,此时说、写出来的外语句子可能是有错的(如一个中国人刚学到“study math”就造出“study swimming”这样的错误说法),他浑然没有意识到有错,还可能自以为是地把这种错误的外语句子记到脑子里,成为脑中“语言实例库”的一部分,影响到他日后判断一个外语说法是否正确的能力——我们前面关于“位”和“study/learn”的例子都指出,一个人的脑子只有输入大量正确的实例(比如我们小时候听到许多关于“位”的正确例子),才能有效判断一个新的说法是否正确(比如我们可以判断出“一位孙子”的说法是错误的)。
现在我们已经论证完了为什么在外语教学中“实例教学”远胜于“规则教学”。笔者想补充的一点是,虽然我们已经明白了“实例教学”应该作为外语教学的主体,但对于“规则教学”也不必完全禁止。例如,虽然第四代模型原则上纯粹用大量双语句对来做外语教学内容,但如果有人自愿在一些双语句对后面追加“语法结构分析”、“近义词辨析”等“规则教学”内容,系统也应该允许这些人工追加的内容跟双语句对一起展示给学习者。
在下一回里,我们将介绍一个实现第四代模型的计划。
上回我们讨论了 Burling 自动化的第一代模型——机器翻译,也就是把网页中选出的母语单词(如“同志”)喂给一个机器翻译系统,翻译成用户想学的外语语种(如英语),然后把这个机器翻译结果显示在网页上的小框里,作为外语教学内容。我们也指出了这种方法的致命缺点:机器翻译的结果是不可靠的,用户学习了错误的翻译结果却茫然不知。比如,上回我们说过,“同志”可以有三种意思(① 革命同志;② 同性恋;③ 某些年代对陌生人的一种称呼),而机器翻译无法像人一样准确地根据上下文判断“同志”是哪个意思,从而也就无法针对那个意思来教外语。
于是有些人会说,既然计算机无法准确判断一个母语单词的意思,何不把所有可能的意思都列出来,并且在每个意思后面分别显示相应的外语教学内容?如,对于“同志”,可以在框中显示如下教学内容:
① 革命同志:comrade;② 同性恋:homosexual;③ 某些年代对陌生人的一种称呼:comrade。
我们把这种想法叫做 Burling 自动化的第二代模型:词典式翻译,因为这种方法就像一部汉英词典,把一个母语单词的所有词义都列出来,并提供每个词义对应的外语说法,让用户自己找出符合上下文的那个词义,并学习对应的外语。
聪明的读者不难发现,“词典式翻译”虽然避免了第一代模型“机器翻译”的固有问题——计算机无法准确判断词义,却带来了属于自己的新问题:
第一,让用户从多个词义中选择符合上下文的那个词义,这道手续在客观上会耗费用户额外的时间和精力,并且降低了总体学习效率。假设用户花在“选择词义”上的时间精力为 X,然后花在“学习该词义的外语”上的时间精力为 Y,那么用户真正用于学外语的“有效功率”其实只有 Y / (X + Y),因为他“选择词义”时并不在学外语,属于“无用功”。另外,用户从阅读母语网页的过程中抽空来关注框中的内容,他的这种注意力的持续时间(attention span)或者说“耐心”其实是非常短暂的;如果这种宝贵的“耐心”还要分出一部分去“选择词义”,对于学习效率无疑是可惜的。
第二,用户面对一串候选词义,有如面对一道多选题;在本来轻松愉快的母语网页阅读活动中竟要做“多选题”,无疑会伤害用户感情、打击学习热情。如果由于计算机的无能而迫使用户必须代替计算机来做“选择词义”这一枯燥无味的工作,用户会感到自己反而成了机器的奴隶,或者说成了一套机械化大系统中的一个零件,而非一个人性化的学习活动的主导者。
而且,显然,一个单词的可能词义越多,以上两个问题就越严重。那么,一词多义现象究竟有多普遍、多严重呢?结果超乎你想象:
对于英语这样的语言,一词多义主要怪罪于同一个单词反复被赋予新的含义。就拿 air 这个再普通不过的单词(就像“空气”一样普通)来说吧,它本是指“空气”;19 世纪下半叶无线电发明后又被赋予了“无线电播送”的含义,如 airing a show(播送一个电视剧)、you're on the air(你已经打进了本台的广播节目中);20 世纪初飞机发明后又被赋予了“航空”的含义,如 air hostess(空中小姐)、go by air(坐飞机前往)。事实上,《韦氏英语词典》对 air 光是作为名词时就有 10 大类意思并进一步细分为 23 个具体词义。而像 air 这种随着时间的演变被赋予很多新含义的例子,在英语常用词汇中十分普遍,因为英语不太喜欢造专门的新词,而是借用一个旧词来指代新的含义。
对于汉语这样的语言,一词多义主要发生在“一个汉语单词对应多个外语近义词”时。现代汉语的很多单词其实是由日本人人为制造的,在制造的过程中就已经注意尽量做到“一词一义”,因此许多汉语单词看似是只有一个意思的;但当我们把一个汉语单词翻译到英语这样一种近义词发达的外语时,原来的“一个意思”往往就要进一步细分成“多个意思”来对应英语中的多个近义词。就以“看”这个字为例吧。我们都知道它最基本的意思是“用眼睛看”(为了方便起见,接下来我们就假定“看”只有这一种意思)。这个意思翻译到英文时,需要在至少三个近义词中做出选择:look、see 和 watch;也就是说,原本在中文中只算“一个意思”的“用眼睛看”,在即将翻译成英文时却需要进一步细分成了三个意思:① “看过去”(对应 look);② “看到”(对应 see);② “持续观看”(对应 watch)。这就是说,“看”这个“单义词”在英语教学中变成了至少有 3 个意思的“多义词”,而前面我们说过,多义词不利于 Burling 自动化的第二代模型——“词典式翻译”的实施。还有更复杂的情况呢!有时我们看到一个汉语单词似乎只对应 2 个英语近义词(如“学习”对应 study 和 learn),但实际上处理起来远没有“把‘学习’细分成 2 个意思”那么简单。首先,study 和 learn 虽然只是 2 个近义词,但它们各自都有多个“用法”,如:① “学习理论知识”可以用 study 或 learn(如 study physics 或 learn physics);② “学习经验性的技能”应该用 learn(如 learn to swim);③ “做(理论)学习的尝试”应该用 study(如 I studied math last week but didn't learn anything——上周我学了数学但没学会任何东西);④ “学到”应该用 learn(如 ③ 中的例子);⑤ “在学校正式就读”应该用 study(如 I studied at Harvard);⑥ “学习某人/某事的榜样/经验/教训”应该用 learn(如 learn from his success)。于是这些“用法”中的每一个,其实都是“学习”这个汉语单词即将翻译到英语时需要细分出来的一个意思——“学习”一下子变成了至少具有 6 个意思的多义词!这 6 个用法主要是 study 和 learn 这两个近义词在自身意思上的种种区别;除了自身意思上的种种区别(nuances in meaning),两个近义词还可能有单词搭配习惯上的种种区别(collocational preferences),如说到“远程学习”时我们习惯说“distance learning”而不是“distance study”。如果把“单词搭配上的种种区别”也考虑进来,“学习”的英文译法就更加不止上面的 6 种情况了,因为像“远程学习”这样的单词搭配可能有很多、很多。
上回我们讨论了 Burling 自动化的第四代模型——“用现成数据办事”。该模型提出用“双语句对”这种广泛存在的数据资源来实现外语教学,从而无需耗费大量人工去专门编写外语教学内容和和一个智能系统所需的其它数据,大大降低了系统开发成本。我们可以把第四代模型比作科幻小说《海底两万里》中的虚构潜艇“鹦鹉螺号”——该潜艇自动从海水中提取钠作为前进动力、提取淡水作为饮用水并让船员捕猎海洋生物为食,而在 Burling 自动化的第四代模型里,“双语句对”就是驱动我们的“外语教学潜艇”的丰富的“自然资源”。
很多读者可能要问笔者:“你用双语句对来做第四代模型,最初的出发点固然是因为这种数据在世界上大量存在、来得容易,但如果仅用双语句对来做外语教学内容,而不教授语法等知识,你的这种外语教学方法是不是有失偏颇呢?”——问得好!本回接下来就是要解释这其中的奥妙,并颠覆你对外语教学的传统认知。
首先我们要知道,要教任何一个知识、道理,基本上都有两种教法,一种叫“规则教学”,一种叫“实例教学”。比如如果我们要教“buy”这个动词怎么造句,我们可以给出一条“公式”:
<买家> buy <商品> [for <价格>] [from <卖家>]
方括号表示其中的内容可有可无,尖括号表示其中是实际造句时需要填写的一项;但我们也可以直接造一个例句来向学习者展示 buy 的造句方法:
I bought an iPhone for RMB 5588 from Tmall.(我花 5588 元从天猫买了个 iPhone。)
以上第一种教法就是一种“规则教学”——你直接把语言的规则展示给学习者,而第二种教法则是一种“实例教学”——你通过举例说明的方式把 buy 的造句方法展示给学习者。就外语教学而言,“规则教学”意味着把语法等等语言规则作为教学的重点,注重对一个句子的语法结构分析,等等;而“实例教学”则意味着让学习者看、听大量真实的外语句子并理解它们的含义(比如配上母语对照),让学习者自然掌握其中的语言规律。“规则教学”是很多地方(包括中国大陆)传统上奉行的外语教学观念,而我们上回介绍的“Burling 自动化的第四代模型”则显然是一种“实例教学”方案,看上去与传统教学观念大相径庭。
然而事实上,当代认知科学和外语教学的主流理论,以及美国等先进国家几十年来的教学实践,却都指出“实例教学”才是真正一流的语言教学理念。在介绍这些科学理论之前,我们不妨来做一个小小的观察。
如果我问你,“我有一位叔叔”是不是一个正确的汉语表达,你会说:“当然啦。”
——那么“我有一位舅舅”呢?你会说:“正确啊。”
——那么“我有一位儿子”呢?你会皱眉说:“一位儿子?听起来有点别扭啊,应该不对。”
——那么“我有一位孙子”呢?你会大笑:“胡说八道,孙子怎么能用‘一位’?!”
——那么我再问你,“这说明‘位’这个字的用法有什么规则?”你可能总结出:“长辈可以用‘位’,晚辈不能。”
——那我再问你:“‘我有一位哥哥’这种说法对不对?”你可能会说:“如果这个‘哥哥’只比‘我’年长一两岁,用‘位’可能不够格,除非是比‘我’年长一辈或以上的‘大哥’才行吧。”
——我说:“看来‘位’的的使用条件要修正为:‘用于长辈,而且要年长至少一辈或以上’。”你说:“对。”
——那我再问:“那么‘一位朋友’、‘一位同学’、‘一位医生’这些说法对不对?”你会说:“当然对呀。”
——我问:“这说明‘位’这个量词又多了什么使用规则?”你会说:“除了用于年长至少一辈或以上的长辈,还可以用于亲戚以外的人际关系如朋友、同学,以及从事某种职业的人如医生。”
——我说:“你看,小小的一个‘位’字居然背后有这么多使用规则,你以前学习过这些规则吗?”你会说:“没有呀。”
——我问:“那你是怎么掌握‘位’这个量词的用法的?”你可能就被我问住了:“这……”
事实上,我们之所以能不学规则就掌握我们母语中“位”这个量词的用法,正是因为我们看过、听过很多关于“位”的实例:“一位叔叔”、“一位舅舅”、“一位老爷爷”、“一位同学”、“一位朋友”、“一位民警”等等等等;我们之所以对“一位儿子”和“一位孙子”感觉不对劲,是因为我们从来没听说过这种说法(或者至少是类似的说法)。也就是说,我们判断“一位ㄨㄨ”是否正确,靠的不是规则(我们并没有学过或者研究过有关规则),而是我们听说过的实例——如果我们听说过“一位老爷爷”,那么“一位老奶奶”大概也是正确的;如果我们从来没听说过“一位儿子”、“一位孙子”,那么这些很可能就是不正确的。由此可见,我们对母语的掌握,靠的就是接触大量的“实例”,而非系统地学习母语的规则——事实上我们根本没学母语的语法就已经会说话、写字了。
我们学我们的母语时用的是“实例教学”的方法,那么外国人学他们的母语(对我们来说就是外语)时,当然也是用“实例教学”的方法。就以英语中的 study 和 learn 这对近义词的用法为例,我们是通过在外语课堂上听老师做这两个词的“近义词辨析”来学它们的用法区别的——在第十三回里,我们提到至少有 6 条规则来区分 study 和 learn 的用法:
1. “学习理论知识”可以用 study 或 learn(如 study physics 或 learn physics);
2. “学习经验性的技能”应该用 learn(如 learn to swim);
3. “做(理论)学习的尝试”应该用 study(如 I studied math last week but didn't learn anything——上周我学了数学但没学会任何东西);
4. “学到”应该用 learn(如 3 中的例子);
5. “在学校正式就读”应该用 study(如 I studied at Harvard);
6. “学习某人/某事的榜样/经验/教训”应该用 learn(如 learn from his success)。
但一个英美儿童却不是靠学习这些规则来学会 study 和 learn 的用法的,而恰恰是靠类似我们前说的汉语里的“位”的学法——“实例教学”来学会的。比如,一个英美儿童会听过/看过很多诸如“study math”、“study history”、“study English”、“study biology”、“study geography”之类的实例,但从来没听过/看过“study swimming”、“study cooking”、“study driving”之类的实例,于是他的潜意识里就会产生一种印象:study 这个词是跟坐在课堂里正儿八经拿着书学的那些东西(如数学、历史)联系在一起的,而从来不跟那些需要实践的东西(如游泳、烧菜、开车)联系在一起。注意这只是一种“潜意识”中的印象,而非“意识”中明确意识到的规则,就好像我们在用前面说的“位”这个量词时也从来没有明确意识到什么规则一样——仅凭接触过的实例就能判断一个说法是否“地道”。
有了以上的观察和分析,我们就不难理解美国著名语言学家和认知科学家诺姆·乔姆斯基(Noam Chomsky)关于人类如何学习语言的论断——他认为幼儿的头脑中天生就有一种学习语言的能力,他称之为“语言习得机制”(language acquisition device: LAD);有了这种机制,再加上幼儿在后天观察到大量的语言实例(如中国幼儿观察到大量关于“位”这个量词的实例,以及英美儿童观察到大量关于“study”和“learn”的实例),那么这种机制就能自动将这些语言实例转化为幼儿运用该语言的能力。换句话说,幼儿头脑中天生有一种设备,这设备观测到外界大量的语言实例后,自动培养出幼儿的语言能力,就像我们的胃能自动把吃下去的食物转化成能量一样。