晋江小鱼网

晋江 [切换城市]
  • 368阅读
  • 0回复
蔚自 在线

级别: 晋江精灵王

  • 会员卡暂无,点击获取
  • UID452662
  • 精华 0
  • 发帖1057
  • 金钱1951 RMB
  • 魅力0 点
  • 贡献值0 点
  • 交易币0
  • 好评度0 点
  • 在线时间7403(时)
  • 每日签到未签到
  • 注册时间2015-11-02
  • 最后登录2018-08-16
倒序阅读   只看楼主      0 发表于: 08-12
更多操作

[分享] 媒婆说了几个特征,你爱上那姑娘

  从前民风太纯朴,相亲全都靠媒婆。媒婆说:这姑娘年方二八、肤白眼大、温声细语、善作羹汤。听完这几个特征,男方虽然没见到真人,也能想象出她大概的模样,然后怦然心动。

  年方二八、肤白眼大,这些就是特征。媒婆,简直是一个很好地把具象转变为抽象、又让你在抽象中还原具象的——人肉翻译工具。

  还有什么翻译工具可以与之媲美吗?

  当然有!这就是新译科技的在线智能翻译。

  从今天开始,你不需要具有机器翻译专业背景,只需要懂得术语(特征)的导入,就可以“训练”这个翻译系统,让它智能生长,长成具有你个人特色的翻译神器。这就是新译科技的限定性神经网络机器翻译。

  自2016年,神经网络机器翻译(NeuralMachineTranslation,NMT),在Google手中横空出世后,锋芒无人能及。(机器翻译从上世纪四十年代开始至今,经历a.基于规则的、b.基于实例的、c.统计的和d.神经网络算法几个过程。)

  神经网络机器翻译,能够训练一张从一个序列映射到另一个序列的神经网络,输出一个变长的序列,这在翻译、对话、文字概括方面有非常好的表现。

  这里就需要专业人员设计并找出一些“特征值”,描述并转换成目标语言。

  这个过程很像媒婆说亲。想象媒婆在给A介绍对象B的场景,A(原文)虽然没有见过B(译文),但是只要媒婆能够大致的描述B的特征(包括身高、长相、身材、年龄等),A就能根据这些描述大致勾勒出这个目标恋人B(译文)的样子。

  但是!神经网络翻译机器,有时候会“发神经”!会出现漏译、过译、缺少语义信息等问题。它就像个“黑盒子”,丢一个东西进去,它会给你丢出来另一个东西,丢出和丢进的东西有联系。但如果你丢进去一个苹果,有时候它丢出来一杯果汁,这就挺尴尬了……

  所以,想要它不“发神经”,必须给它一个“限制”,把它“稳定”住。“限定性神经网络”应运而生。

  这也是新译科技的机器翻译的重大突破和灵魂所在。

  限定性神经网络的初衷就是通过干预输入的句子,然后让底层神经网络的模型参数进行调整,并准确无误地还原干预部分的译文表达。

  限定性神经网络,翻译原理是这样的:

  译员希望把关键的一些短语、术语优先翻译,然后翻译整句话;从机器翻译算法技术的角度,它们会根据限定性神经网络的逻辑,先分成需要翻译的部分和不需要翻译的部分。而这个过程是通过命名实体识别来实现的。

  这个方式,会充分把原有的规则系统、实例系统和统计机器翻译做一个配合。最终形成以神经网络为主、其他模型为辅的混合神经网络策略。

  新译翻译实际操作步骤:

  上传优质术语->等待一秒自适应训练->译文输出->前端查看。

  1.1登陆注册

  点击网址

  https://fanyi.newtranx.com/

  1.2上传术语和记忆库

  如果需要更加精准的翻译需求(比如专业译员和组织机构),只需要把准备好的术语库和记忆库导入到“我的语料库”即可。支持单句(短语)导入,也支持批量导入。

  1.2.1建立一个语料库,如“政治常用术语库”。

  1.2.2往新建立的术语库中,导入搜集校验过的术语。

  这里的“术语”并不一定都是语言学意义上的术语,对于一些常用的固定表达,仍然归属于我们“术语”的范畴。这里可以批量添加UTF-8编码的txt文件,也可以导入常用的记忆库tmx文件。如我们想添加“‘一带一路’倡议”,那么我们可以选择库名,添加即可。

  1.2.3实时训练体验翻译结果

  导入术语后的翻译系统,会在后台实时训练,用户输入包含这方面的句子,即可以得到想要的译文结果。

  最后,我们来回顾一下新译科技这个翻译神器的拉风/严肃/高逼格原理和优势——

  神经网络相对于传统技术是一种革命性的改变。基于短语的统计机器翻译是拼图过程,整个决策过程是离散的,支持这个决策的信息也都是局部的。

  神经网络机器学习则反其道而行之,每一步翻译过程中可以利用原语言与目标语言所有信息,决策过程既是连续的也是全局的。

  “全局”策略,让神经网络机器翻译可以很好兼顾上下文以及从句子整体考虑译文。

  而限定性神经网络,可以更好地为全局译文服务。在一句话的翻译中,固定表达、时间、数字、日期、专有名词等对一句话的翻译传达非常明显,如果把这几类问题翻译清楚将会把翻译工作进行了一大半。

  赶紧来体验一下吧。

  
描述
快速回复

 回复后跳转到最后一页