第67章 你们能比我更懂机器翻译(5k) (2/6)
本站域名 【m.64sw.com
如果遇到没有章节内容的情况,请尝试换个浏览器阅读
换源:
节点二二 ↓

更加重要。

    你们需要做到,引进常见的高频句型。

    对上下文进行依赖处理。使词汇翻译考虑前后词,通过有限的上下文窗口来减少歧义。

    比如свет同时有光和世界的意思。

    这个完全可以根据前词判断是光还是世界。”

    沃森弱弱提醒道:“教授,你还会俄语啊?”

    林燃一副理所当然的样子:“当然,我都和科罗廖夫见了两面,我不会俄语怎么和他交流的?

    我同时会俄语、德语、英语和汉语。”

    多语言大师的身份,给林燃的理论增添了几分可信度。

    在这个时代,科学家们会几门语言并不奇怪。

    当然一些敏感部门会提高对你的怀疑。

    以前面提到的约翰·麦卡锡为例,他就精通俄语,从小接受俄语教育长大,尽管他出生在阿美莉卡。

    “另外翻译过程,应该是模块化设计,而不是简单的映射关系。

    它应该分成预处理、翻译、后处理三部分。

    预处理包括了分词和词形还原,翻译才是词典的映射,后处理是对语序进行调整。

    这样来降低单次计算的复杂度,提高规则的复用率!”

    林燃的话给了在座研究团队的成员们非常多的灵感。

    就好像之前一直陷在百越的丛林里找不到出路,而现在天上出现一道光指引他们怎么样才能走出丛林迷宫。

    大家都有点迫不及待去尝试了。

    所有研究人员都疯狂在笔记本上记录下林燃所说的。

    虽然不确定教授的方法是否管用,但有路总比之前没有好。

    再者,如果你不好好记下来,到时候被开除只是教授一句话的事。

    “好了刚才我们讲了一些简单的内容,现在才是最难的。

    因为IBM的机器不是那么强大,我们只能引入一些比较简单的统计学方法来提高我们翻译的准确度。

    我把它叫做基于频率的词对齐。

    这也是我们引入统计模型的核。

    我们先要手动分析平行句子,标注俄语词或短语与英语翻译的对应关系。

    俄语句子Мыговоримомире

    英语翻译:“We speak about peace

    对齐结果:“мы”对应“we”

    “говорим”对应“speak”

    “о”对应“about”

    “мире”对应“peace”

    然后我们需要对这种对齐的频率

本章未完,请点击下一页继续阅读

科技入侵现代最新章节 http://m.64sw.com/xiaoshuo/kejiruqinxiandai/read/97/462.html !64书屋,有求必应!