t'zone-CSDN博客

原创 WMT2020-生物医学-华为

Huawei’s Submissions to the WMT20 Biomedical Translation TaskAbstract1.除了在特定领域的文本上进行微调实验外，我们还探讨了领域内字典对提高跨领域神经机器翻译性能的影响。2.利用了预训练机器翻译模型做迁移学习。在英–法，英->德英->意大利 SOTA。Introduction领域术语被认为是提高机器翻译质量的关键资源，以缓解领域内文本的稀缺影响。Findings of the WMT 2019 Biomed.

2021-09-14 19:11:56 455

原创 WMT2021-新闻-wechat

WeChat Neural Machine Translation Systems for WMT21Abstract英中，英日，日英，英德方向，以Transformer为基础。做了数据过滤，大规模合成数据生成（回译，知识蒸馏，前向翻译，迭代领域知识迁移），微调(作者说是先进的微调)，模型集成(boosted Self-BLEU based model ensemble)，Introduction主要通过增加模型体系结构和合成数据多样性来提高模型性能。# 模型架构Pre-Norm Tra.

2021-09-14 19:10:24 778 1

原创基于字典的跨域神经机器翻译数据增强

主要目标是使用平行领域字典I_d和OOD非领域平行语料O_c去创建伪领域平行语料G_c。步骤包括短语句子embedding，匹配，对齐，替换。思路比较简单。从OOD非领域平行语料库中选择句子作为主模板，根据相似单词，从领域词典中在特定位置植入领域术语。

2021-09-14 19:09:48 462

原创使用SMT特征提高NMT-2016 AAAI 百度

nmt常见存在OOV问题（需要确定的词表），并且在decoder阶段缺乏翻译所有source words的机制，模型更倾向于短的翻译，虽然流利但是不充分。作者在log-linear 框架下组合了n-gram语言模型和翻译模型特征。在NIST 测试集中英方向提升了2.33 BLEU score

2021-09-14 19:08:01 192

原创概率分布的一些特性

样本个体偏离平均值的程度。方差计算的是每个样本与均值之差的平方的算数平均值。概率分布的均值称为期望。概率越大，事件发生的不确定性越小，熵越小。模型中我们通常获取更多的信息来增加确定性（减小熵）。

2021-09-14 19:06:37 476

原创理解EM算法

迭代一定会收敛，但不一定会收敛到真实的参数值，因为可能会陷入局部最优。所以 EM 算法的结果很受初始值的影响。

2021-09-14 19:03:54 168

原创 centos7静态ip配置

linux静态路由配置首先选择NAT模式，然后打开虚拟机配置虚拟机网关ip物理机cmd中使用命令ipconfig查看网关信息：虚拟机界面点击编辑 -> 虚拟网络编辑器，根据本机网关配置VMnet8相关参数。网关各个主机各有不同，大家可以根据下面配置的区别来做适当修改。（一般只修改主机位，也就是网关的最后一位。）修改centos下配置文件修改 /etc...

2020-02-25 22:35:27 172

原创 ubuntu18.04双系统安装和配置

ubuntu18.04双系统进行之前首先需要一个U盘，制作U盘启动。在ubuntu官网下载18.04镜像文件。网盘分享下载rufus用于制作U盘启动。网盘分享，提取码：1tup详细制作过程开始菜单右击 **磁盘管理** ，选中空白盘符，右击“压缩卷“，调整”输入压缩空间量“，（根据自己需要的ubuntu系统大小进行调整），结果为图中所示，一个未分配的空间。制作启动U...

2019-09-03 07:53:45 471

原创 @@tx_isloation 异常问题解决

@@tx_isloation 异常问题解决mysql版本升级 5.7.20mysql把默认事务隔离机制调整Transaction Isolation Level （ mysql 5.7.20 对分布式事务的支持更完美）需要更改sqlalchemy代码 /site-packages/sqlalchemy/dialects/mysql/base.py 中**get_isolation_leve...

2018-11-18 18:47:47 501

static.tar.gz

visdom中的static文件。亲测可用。免费下载。可以下载下来直接替换visdom目录下的static文件。

2020-02-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人