Skip to content

Latest commit

 

History

History

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
 
 

LEAD-3

返回测试集样本原文的前N句话(原版N=3)。暂不支持自动分句功能,要求原文中即含分句token。

直接调用lead3.py即可运行。

入参:
--dataset_folder_path  内含test.src的数据集文件夹(如果selected_num小于等于0,则还需要有train.tgt)(支持绝对和相对路径)
--result_folder_path  输出值将打印在该文件夹下的result_file_name文本文件中(支持绝对和相对路径)
--result_file_name  输出文件名
--selected_num  选择几句话作为输出。如果该值大于0,将选择该值数目;反之,则以训练集样本摘要平均句子数目为该值数目

工作计划和项目日志:

  • 增加对自动分句功能的支持
  • 增加输出结果示例
  • 增加对dataset_folder_path和result_folder_path使用不严格文件夹路径写法的容错支持
  • 增加对selected_num超出原文句数情况的考虑