Slot Filling On Kilt T Rex
评估指标
Accuracy
F1
KILT-AC
KILT-F1
R-Prec
Recall@5
评测结果
各个模型在此基准测试上的表现结果
比较表格
模型名称 | Accuracy | F1 | KILT-AC | KILT-F1 | R-Prec | Recall@5 |
---|---|---|---|---|---|---|
模型 1 | 19.3 | 25.81 | 0.0 | 0.0 | 0.0 | 0.0 |
模型 2 | 0.0 | 0.0 | 0.0 | 0.0 | 69.46 | 83.88 |
模型 3 | 84.36 | 87.24 | 69.14 | 70.58 | 74.36 | 83.14 |
模型 4 | 45.06 | 49.24 | 0.0 | 0.0 | 0.0 | 0.0 |
模型 5 | 59.2 | 62.96 | 23.12 | 23.94 | 28.68 | 33.04 |
模型 6 | 78.66 | 81.71 | 61.88 | 63.09 | 66.36 | 76.24 |
模型 7 | 0.1 | 7.67 | 0.04 | 6.66 | 79.42 | 85.33 |
模型 8 | 0.0 | 0.0 | 0.0 | 0.0 | 81.9 | 89.36 |
模型 9 | 57.02 | 61.46 | 0.0 | 0.0 | 0.0 | 0.0 |
模型 10 | 83.72 | 86.53 | 60.08 | 61.72 | 67.8 | 81.52 |
模型 11 | 0.02 | 2.04 | 0.0 | 0.0 | 0.0 | 0.0 |
re2g-retrieve-rerank-generate-2 | 87.68 | 89.93 | 75.84 | 77.05 | 80.7 | 89.0 |
模型 13 | 77.9 | 81.31 | 55.54 | 56.79 | 59.7 | 70.38 |
模型 14 | 0.0 | 0.0 | 0.0 | 0.0 | 79.98 | 85.75 |
模型 15 | 49.04 | 54.62 | 36.68 | 39.57 | 48.08 | 51.86 |
kilt-a-benchmark-for-knowledge-intensive | 43.56 | 50.61 | 0.0 | 0.0 | 0.0 | 0.0 |
模型 17 | 59.16 | 62.76 | 11.12 | 11.41 | 13.26 | 17.04 |
模型 18 | 53.9 | 61.74 | 27.84 | 32.34 | 37.62 | 40.07 |
模型 19 | 81.34 | 84.46 | 64.64 | 66.64 | 75.64 | 87.57 |
learning-dense-representations-of-phrases-at | 53.9 | 61.74 | 27.84 | 32.34 | 37.62 | 40.07 |