Skip to content

Latest commit

 

History

History
154 lines (106 loc) · 5.18 KB

File metadata and controls

154 lines (106 loc) · 5.18 KB

transformer_zh-en

模型名称 transformer_zh-en
类别 文本-机器翻译
网络 Transformer
数据集 CWMT2021
是否支持Fine-tuning
模型大小 614MB
最新更新日期 2021-07-21
数据指标 -

一、模型基本信息

  • 模型介绍

    • 2017 年,Google机器翻译团队在其发表的论文Attention Is All You Need中,提出了用于完成机器翻译(Machine Translation)等序列到序列(Seq2Seq)学习任务的一种全新网络结构——Transformer。Tranformer网络完全使用注意力(Attention)机制来实现序列到序列的建模,并且取得了很好的效果。

    • transformer_zh-en包含6层的transformer结构,头数为8,隐藏层参数为512,参数量为64M。该模型在CWMT2021的数据集进行了预训练,加载后可直接用于预测, 提供了中文翻译为英文的能力。

    • 关于机器翻译的Transformer模型训练方式和详情,可查看Machine Translation using Transformer

二、安装

三、模型API预测

  • 1、预测代码示例

    • import paddlehub as hub
      
      model = hub.Module(name='transformer_zh-en', beam_size=5)
      src_texts = [
          '今天天气怎么样?',
          '我们一起去吃饭吧。',
      ]
      
      n_best = 3  # 每个输入样本的输出候选句子数量
      trg_texts = model.predict(src_texts, n_best=n_best)
      for idx, st in enumerate(src_texts):
          print('-'*30)
          print(f'src: {st}')
          for i in range(n_best):
              print(f'trg[{i+1}]: {trg_texts[idx*n_best+i]}')  
  • 2、API

    • def __init__(max_length: int = 256,
                  max_out_len: int = 256,
                  beam_size: int = 5):  
      • 初始化module,可配置模型的输入输出文本的最大长度和解码时beam search的宽度。

      • 参数

        • max_length(int): 输入文本的最大长度,默认值为256。
        • max_out_len(int): 输出文本的最大解码长度,默认值为256。
        • beam_size(int): beam search方式解码的beam宽度,默认为5。
    • def predict(data: List[str],
                  batch_size: int = 1,
                  n_best: int = 1,
                  use_gpu: bool = False):
      • 预测API,输入源语言的文本句子,解码后输出翻译后的目标语言的文本候选句子。

      • 参数

        • data(List[str]): 源语言的文本列表,数据类型为List[str]
        • batch_size(int): 进行预测的batch_size,默认为1
        • n_best(int): 每个输入文本经过模型解码后,输出的得分最高的候选句子的数量,必须小于beam_size,默认为1
        • use_gpu(bool): 是否使用gpu执行预测,默认为False
      • 返回

        • results(List[str]): 翻译后的目标语言的候选句子,长度为len(data)*n_best

四、服务部署

  • 通过启动PaddleHub Serving,可以加载模型部署在线翻译服务。

  • 第一步: 启动PaddleHub Serving

    • 运行启动命令:

    • $ hub serving start -m transformer_zh-en
    • 通过以上命令可完成一个中英机器翻译API的部署,默认端口号为8866。

    • NOTE: 如使用GPU预测,则需要在启动服务之前,请设置CUDA_VISIBLE_DEVICES环境变量,否则不用设置。

  • 第二步: 发送预测请求

    • 配置好服务端,以下数行代码即可实现发送预测请求,获取预测结果

    • import requests
      import json
      
      texts = [
          '今天天气怎么样啊?',
          '我们一起去吃饭吧。',
      ]
      data = {"data": texts}
      # 发送post请求,content-type类型应指定json方式,url中的ip地址需改为对应机器的ip
      url = "http://127.0.0.1:8866/predict/transformer_zh-en"
      # 指定post请求的headers为application/json方式
      headers = {"Content-Type": "application/json"}
      
      r = requests.post(url=url, headers=headers, data=json.dumps(data))
      print(r.json())
  • 关于PaddleHub Serving更多信息参考:服务部署

  • Gradio APP 支持

    从 PaddleHub 2.3.1 开始支持使用链接 http://127.0.0.1:8866/gradio/transformer_zh-en 在浏览器中访问 transformer_zh-en 的 Gradio APP。

五、更新历史

  • 1.0.0

    初始发布

  • 1.0.1

    修复模型初始化的兼容性问题

  • 1.1.0

    添加 Gradio APP 支持

    • $ hub install transformer_zh-en==1.1.0