- 博客(9)
- 资源 (1)
- 收藏
- 关注
原创 WMT2020-生物医学-华为
Huawei’s Submissions to the WMT20 Biomedical Translation TaskAbstract1.除了在特定领域的文本上进行微调实验外,我们还探讨了领域内字典对提高跨领域神经机器翻译性能的影响。2.利用了预训练机器翻译模型做迁移学习。在英–法,英->德 英->意大利 SOTA。Introduction领域术语被认为是提高机器翻译质量的关键资源,以缓解领域内文本的稀缺影响。Findings of the WMT 2019 Biomed.
2021-09-14 19:11:56
455
原创 WMT2021-新闻-wechat
WeChat Neural Machine Translation Systems for WMT21Abstract英中,英日,日英,英德 方向,以Transformer为基础。做了数据过滤,大规模合成数据生成(回译,知识蒸馏,前向翻译,迭代领域知识迁移),微调(作者说是先进的微调),模型集成(boosted Self-BLEU based model ensemble),Introduction主要通过增加模型体系结构和合成数据多样性来提高模型性能。# 模型架构Pre-Norm Tra.
2021-09-14 19:10:24
778
1
原创 基于字典的跨域神经机器翻译数据增强
主要目标是使用平行领域字典I_d和OOD非领域平行语料O_c去创建伪领域平行语料G_c。步骤包括短语句子embedding,匹配,对齐,替换。思路比较简单。从OOD非领域平行语料库中选择句子作为主模板,根据相似单词,从领域词典中在特定位置植入领域术语。
2021-09-14 19:09:48
462
原创 使用SMT特征提高NMT-2016 AAAI 百度
nmt常见存在OOV问题(需要确定的词表),并且在decoder阶段缺乏翻译所有source words的机制,模型更倾向于短的翻译,虽然流利但是不充分。作者在log-linear 框架下组合了n-gram语言模型和翻译模型特征。在NIST 测试集中英方向提升了2.33 BLEU score
2021-09-14 19:08:01
192
原创 概率分布的一些特性
样本个体偏离平均值的程度。方差计算的是每个样本与均值之差的平方的算数平均值。概率分布的均值称为期望。概率越大,事件发生的不确定性越小,熵越小。模型中我们通常获取更多的信息来增加确定性(减小熵)。
2021-09-14 19:06:37
476
原创 centos7静态ip配置
linux静态路由配置首先选择NAT模式,然后打开虚拟机配置虚拟机网关ip物理机cmd中使用命令ipconfig查看网关信息:虚拟机界面 点击 编辑 -> 虚拟网络编辑器,根据本机网关配置VMnet8相关参数。网关各个主机各有不同,大家可以根据下面配置的区别来做适当修改。(一般只修改主机位,也就是网关的最后一位。)修改centos下配置文件修改 /etc...
2020-02-25 22:35:27
172
原创 ubuntu18.04双系统安装和配置
ubuntu18.04双系统进行之前首先需要一个U盘,制作U盘启动。在ubuntu官网下载18.04镜像文件。网盘分享下载rufus用于制作U盘启动。网盘分享,提取码:1tup详细制作过程 开始菜单右击 **磁盘管理** ,选中空白盘符,右击“压缩卷“,调整”输入压缩空间量“,(根据自己需要的ubuntu系统大小进行调整),结果为图中所示,一个未分配的空间。制作启动U...
2019-09-03 07:53:45
471
原创 @@tx_isloation 异常问题解决
@@tx_isloation 异常问题解决mysql版本升级 5.7.20mysql把默认事务隔离机制调整Transaction Isolation Level ( mysql 5.7.20 对分布式事务的支持更完美)需要更改sqlalchemy代码 /site-packages/sqlalchemy/dialects/mysql/base.py 中**get_isolation_leve...
2018-11-18 18:47:47
501
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人