将本站设为首页
收藏武夷官网,记住:www.51dzk.net
账号:
密码:

武夷小说:看啥都有、更新最快

武夷小说:www.51dzk.net

如果你觉得好,恳请收藏

您当前的位置:武夷小说 -> 学霸的黑科技时代 -> 第60章 给词语一个向量

第60章 给词语一个向量

温馨提示:如果本章属于内容错误等情况,请点击下面的按钮发送报告,我们会在一分钟内纠正,谢谢

里就是程序的具体书写。

萧铭英语词汇量不足,但是语法没有问题。

萧铭归纳,现今市面上的翻译软件和翻译机最大的缺陷有两个。

一个是词不达意。无论是英语还是汉语,通常会有多种意思,在不同的语境中有不同的解释,但是机器翻译并不能完全了解人类表达的意思。很多时候单词的词语意思准确,但是放在句子中笑话百出。

还一个是无法识别人类的语音。这主要出现在翻译机上,每个人有很多种口音,生活中的对话有很多的俚语,人和人之间对话时绝对不可能像央视主播那样每句话都是语言要素齐全,语音标准。

机器翻译在很多时候都会捡着听得懂的翻译,听不懂的乱翻译。这也是很多品牌的翻译机拿到国外去应用的时候让顾客感到并不顺心,翻译机更不能作为会议同声翻译的原因。

为了处理上面两个主要问题,萧铭按照说明书的建议项,编辑着。

萧铭采用数学的思维,将每个词语设定为向量,并且分类为名词、动词等等。

将词语设定为向量的好处就是讲长难句进行肢解,翻译软件处理时会将每个词语准确的翻译。

接下来就是按照语言的语境筛选组合,将不同的词语按照翻译对象需要的语法和含义进行组合,并对缺少的语法要素进行补足。

在盘古编程语言的提示下,萧铭知道自己编程的逻辑是正确的。

但是逻辑正确只是第一步,怎么让拥有向量的词语按照语法组合为新的语句,这个很难,这也是现代翻译软件和机器最大的难点。

没有关系,这是盘古最擅长的。

盘古给了萧铭几个接入入了口。

萧铭将导入大量的中英文资料,资料不仅有名著更有口水话表达的网路小说、贴吧问答、微博、推特文章等等。

未来这些资料会可以由用户们自己上传,优化程序的准确性。

盘古的数据库能将整合这些资料,熟悉每一个句子的语境,然后整理出数据模型(模拟出汉语和英语等人类思维表达方式的模型)。

这些数据会帮助“词向量”在不同的语境和语法中出现在合适的位置,如此翻译会更加准确。

这项工作最大的难点就是编译量非常大!

所以现今市面上现存的翻译软件都是采用语言学家总结的语法库,即便有少部分软件有自我学习功能,也不能做到了解和统计当今所有的语言习惯并对其作出分析。这也


  本章未完,请点击下一页继续阅读!

看了《学霸的黑科技时代》的书友还喜欢看

我的低保,每天到账1000万
作者:报李
简介: 神豪+商战+幽默+生活【搬砖致富系统:1、低保日结:系统按日给予低保补贴,补贴金额=...
更新时间:2026-03-04 21:18:00
最新章节:第740章 简直是黑店
超魔术士:开局魔网又崩了
作者:幼稚的空想家
简介: 【DND】【费伦】【超魔法】【冒险】安瑟意外穿越托瑞尔,魔法女神又双叒叕出事了!
更新时间:2026-03-04 21:14:00
最新章节:第417章 你的灵魂灿如星河
婴儿的我,获得大器晚成逆袭系统
作者:语成
简介: 大周太子杨承重生到一岁婴儿时期,大器晚成逆袭系统早到了五百年。

...
更新时间:2026-03-04 20:33:43
最新章节:第一卷 第930章 混乱污染
流放岭南,世子妃养崽开荒带飞全家
作者:竹枝欢
简介: 穿越就碰上原主难产而亡,程七七拼命生下女儿,吃饱穿暖在侯府躺平三年,谁知碰上抄家流放...
更新时间:2026-03-04 21:26:14
最新章节:第一卷 第110章 不懂就别说话
在火影教书,系统说我是鸣人同学
作者:宝石对影
简介: 北泽,三无穿越者,平平无奇的中忍,为了活到大结局,苟在木叶忍者学校教书。
<...
更新时间:2026-03-04 21:08:50
最新章节:第四百六十章 雏田的踩背,井野的吻(二合一更)
从趋吉避凶开始顺势成神
作者:叮叮小石头
简介: 【我叫陈盛,当你看到这句话时,我已经死了……】……一朝穿越,命如草芥,睁眼便是两军对...
更新时间:2026-03-04 21:11:25
最新章节:第311章 反击瀚海宗!聂湘君心虚!