【mT5多语言翻译】之六——推理：多语言翻译与第三方接口设计

征途黯然.

已于 2024-04-11 01:25:11 修改

阅读量6k

点赞数 47

CC 4.0 BY-SA版权

分类专栏： # 文本生成 # mT5多语言翻译实战文章标签：翻译多语言翻译 mT5翻译

于 2024-04-11 01:18:57 首次发布

原创博客归本人所有，禁止任何人、组织、公司转载或采集！

本文链接：https://blog.csdn.net/qq_43592352/article/details/137617516

文本生成同时被 2 个专栏收录

17 篇文章

订阅专栏

mT5多语言翻译实战

6 篇文章

订阅专栏

文章介绍了如何使用mT5模型进行多语言翻译，包括全量参数微调和PEFT微调后的模型测试，以及将模型推理设计为一个GET请求的Flask接口，以便于在浏览器中测试和使用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

·请参考本系列目录：【mT5多语言翻译】之一——实战项目总览

[1] 模型翻译推理

在分别使用全量参数微调和PEFT微调训练完模型之后，我们来测试模型的翻译效果。推理代码如下：

# 导入模型
if conf.is_peft:
    model = AutoModelForSeq2SeqLM.from_pretrained(conf.peft_save)
else:
    model = AutoModelForSeq2SeqLM.from_pretrained(conf.pretrained_path)
    model.load_state_dict(torch.load(conf.save_path))
model.to(conf.device)
model.eval()
sentences = [
    "kor:我要去健身了",
    "jpn:我要去健身了",
    "kor:他说他会爱我一辈子",
    "jpn:他说他会爱我一辈子",
]

tokenizer = AutoTokenizer.from_pretrained(conf.pretrained_path)

ids = tokenizer.batch_encode_plus(
    batch_text_or_text_pairs=sentences,
    return_tensors='pt',
    padding='max_length',
    truncation=True,
    max_length=conf.max_seq_len,
    return_attention_mask=False
)
input_ids = ids['input_ids'].to(conf.device)


output_tokens = model.generate(input_ids, num_beams=10, num_return_sequences=3)

for token_set in output_tokens:
    print(tokenizer.decode(token_set, skip_special_tokens=True))

因为训练方式有全量参数微调和PEFT微调两种，不同方式保存的模型不同。前者是全量参数，后者是PEFT添加的少量参数。

【注】直接加载PEFT保存的少量参数，也可以加载到mT5模型本身的预训练参数。这是因为在peft模型保存的文件夹中有一个adapter_config.json文件，里面保存了基座模型的地址。

最终，可以观察到上述代码的输出为：

나는 피트니스에 가고 싶
나는 피트니스 클럽에 가
나는 피트니스 센터에 가
ジムに行きます。
ジムに行きたいです。
ジムに行くわ
그는 평생을 나를 사랑할
그는 평생 나를 사랑할 것
그는 평생 나를 사랑할 거
彼は私を愛してくれると言っていた。
彼は私を愛してくれると言った。
彼は私を愛してくれると言っていました。

[2] 第三方接口设计

我们把模型推理简单地设计成一个GET请求的接口，代码如下：

# coding: UTF-8
import torch
from transformers import AutoModelForSeq2SeqLM, AutoTokenizer, BertModel, T5Model
from conf import conf
from flask import Flask, request, jsonify

app = Flask(__name__)

# 导入模型
if conf.is_peft:
    model = AutoModelForSeq2SeqLM.from_pretrained(conf.peft_save)
else:
    model = AutoModelForSeq2SeqLM.from_pretrained(conf.pretrained_path)
    model.load_state_dict(torch.load(conf.save_path))
model.to(conf.device)
model.eval()
tokenizer = AutoTokenizer.from_pretrained(conf.pretrained_path)


@app.route('/translate', methods=['GET'])
def translate():
    # 从GET请求中获取参数
    sentences = request.args.getlist('sentence')
    if not sentences:
        return jsonify({"error": "No sentences provided."}), 400

    # 对句子进行编码
    ids = tokenizer.batch_encode_plus(
        batch_text_or_text_pairs=sentences,
        return_tensors='pt',
        padding='max_length',
        truncation=True,
        max_length=conf.max_seq_len,
        return_attention_mask=False
    )
    input_ids = ids['input_ids'].to(conf.device)

    # 生成翻译结果
    output_tokens = model.generate(input_ids, num_beams=10, num_return_sequences=3)

    # 解码翻译结果
    translations = [tokenizer.decode(token_set, skip_special_tokens=True) for token_set in output_tokens]

    # 返回结果
    return jsonify({"translations": translations})


if __name__ == '__main__':
    app.run(host='0.0.0.0', port=5000)