HyperAI超神经

Question Answering On Qasper

评估指标

Token F1

评测结果

各个模型在此基准测试上的表现结果

比较表格
模型名称Token F1
a-dataset-of-information-seeking-questions33.63