Natural Language Inference
基准测试列表
该任务相关的所有基准测试列表
bionli
最佳模型: BioLinkBert
评估指标
查看详情
commitmentbank
最佳模型: PaLM 540B (finetuned)
评估指标
查看详情
e-snli
最佳模型: ExplainThenPredictAttention (e-InferSent Bi-LSTM + Attention)
评估指标
查看详情
farstail
最佳模型: Translate-Source + fastText
评估指标
查看详情
hans
最佳模型: Roberta-large
评估指标
查看详情
med
最佳模型: NeuralLog
评估指标
查看详情
mednli
最佳模型: ClinicalMosaic
评估指标
查看详情
mrpc
最佳模型: DeBERTaV3large
评估指标
查看详情
multinli
最佳模型: T5-11B
评估指标
查看详情
multinli-dev
最佳模型: TinyBERT-6 67M
评估指标
查看详情
qnli
最佳模型: ALICE
评估指标
查看详情
rte
最佳模型: PaLM 540B (fine-tuned)
评估指标
查看详情
scitail
最佳模型: CA-MTL
评估指标
查看详情
sick
最佳模型: NeuralLog
评估指标
查看详情
snli
最佳模型: EFL (Entailment as Few-shot Learner) + RoBERTa-large
评估指标
查看详情
v-snli
最佳模型: MMBT
评估指标
查看详情
wnli
最佳模型: DeBERTa
评估指标
查看详情
xnli-chinese-dev
最佳模型: ERNIE 2.0 Large
评估指标
查看详情
xnli-chinese
最佳模型: ERNIE 2.0 Large
评估指标
查看详情
xnli-french
最佳模型: CamemBERT (large)
评估指标
查看详情
xwino
最佳模型: mGPT
评估指标
查看详情
anli
评估指标
查看详情
anli-r3
评估指标
查看详情
anli-test
评估指标
查看详情
ax
评估指标
查看详情
glue
评估指标
查看详情
jampatoisnli
评估指标
查看详情
kuake-qqr
评估指标
查看详情
kuake-qtr
评估指标
查看详情
lidirus
评估指标
查看详情
mnli-snli-anli-fever
评估指标
查看详情
multi-nli
评估指标
查看详情
probability-words-nli
评估指标
查看详情
quora-question-pairs
评估指标
查看详情
rcb
评估指标
查看详情
tabfact
评估指标
查看详情
terra
评估指标
查看详情