Pytorch使用全局编码(Global-Encoding)生成文本摘要(北大开源)

Song • 1363 次浏览 • 0 个回复 • 2019年03月14日

Global-Encoding

此项目主要是为了实现论文Global Encoding for Abstractive Summarization

一、要求

  • Ubuntu 16.0.4
  • Python 3.5
  • Pytorch 0.4.1(更新)
  • pyrouge 要使用pyrouge,请使用以下行设置rouge路径:
pyrouge_set_rouge_path RELEASE-1.5.5/

似乎有些用户遇到了pyrouge的问题,所以我更新了脚本,用户可以将目录RELEASE-1.5.5放在你的主目录中并设置路由路径(或运行命令chmod 777 RELEASE-1.5.5获得系统权限)。

二、预处理

python3 preprocess.py -load_data path_to_data -save_data path_to_store_data 

记得将数据放入一个文件夹,并将它们命名为train.srctrain.tgtvalid.srcvalid.tgttest.srctest.tgt,并在其中创建一个名为data的新文件夹

三、训练

python3 train.py -log log_name -config config_yaml -gpus id

为超参数设置创建自己的yaml文件。

四、评估

python3 train.py -log log_name -config config_yaml -gpus id -restore checkpoint -mode eval

五、引文

如果您将此代码用于研究,请引用我们的论文:

@inproceedings{globalencoding,
  title     = {Global Encoding for Abstractive Summarization},
  author    = {Junyang Lin and Xu Sun and Shuming Ma and Qi Su},
  booktitle = {{ACL} 2018},
  year      = {2018}
}

项目地址:lancopku/Global-Encoding


原创文章,转载请注明 :Pytorch使用全局编码(Global-Encoding)生成文本摘要(北大开源) - pytorch中文网
原文出处: https://ptorch.com/news/239.html
问题交流群 :168117787
提交评论
要回复文章请先登录注册
用户评论
  • 没有评论
Pytorch是什么?关于Pytorch! pytorch使用SGM进行多标签分类的序列生成模型