Story Generation On Fandom Dev
评估指标
BLEU
Perplexity
ROUGE-1
ROUGE-2
ROUGE-L
评测结果
各个模型在此基准测试上的表现结果
比较表格
模型名称 | BLEU | Perplexity | ROUGE-1 | ROUGE-2 | ROUGE-L |
---|---|---|---|---|---|
tvrecap-a-dataset-for-generating-stories-with | 28.4 | 17.9 | 63.0 | 32.8 | 61.2 |
各个模型在此基准测试上的表现结果
模型名称 | BLEU | Perplexity | ROUGE-1 | ROUGE-2 | ROUGE-L |
---|---|---|---|---|---|
tvrecap-a-dataset-for-generating-stories-with | 28.4 | 17.9 | 63.0 | 32.8 | 61.2 |