HyperAI超神经

Question Answering On Casehold

评估指标

Macro F1 (10-fold)

评测结果

各个模型在此基准测试上的表现结果

比较表格
模型名称Macro F1 (10-fold)
when-does-pretraining-help-assessing-self61.3
when-does-pretraining-help-assessing-self68.0
when-does-pretraining-help-assessing-self69.5