HyperAI超神经

Natural Language Inference On Rcb

评估指标

Accuracy
Average F1

评测结果

各个模型在此基准测试上的表现结果

比较表格
模型名称AccuracyAverage F1
模型 10.4180.302
模型 20.5180.357
模型 30.5460.406
模型 40.4630.367
模型 50.4980.306
russiansuperglue-a-russian-language0.7020.68
模型 70.5090.333
模型 8 0.4840.417
模型 90.4730.356
模型 100.4470.408
模型 110.4520.371
模型 120.4450.367
mt5-a-massively-multilingual-pre-trained-text0.4540.366
模型 140.50.356
模型 150.4860.351
模型 160.4680.307
unreasonable-effectiveness-of-rule-based0.4380.4
unreasonable-effectiveness-of-rule-based0.3740.319
模型 190.4610.372
模型 200.4840.452
russiansuperglue-a-russian-language0.4410.301
unreasonable-effectiveness-of-rule-based0.4840.217