Code Generation On Webapp1K Duo React

pass@1

Results

Performance results of various models on this benchmark

Model Name	pass@1	Paper Title
claude-3-5-sonnet	0.679	A Case Study of Web App Coding with OpenAI Reasoning Models
mistral-large-2	0.449	A Case Study of Web App Coding with OpenAI Reasoning Models
deepseek-v2.5	0.49	A Case Study of Web App Coding with OpenAI Reasoning Models
o1-preview	0.652	A Case Study of Web App Coding with OpenAI Reasoning Models
o1-mini	0.667	A Case Study of Web App Coding with OpenAI Reasoning Models
gpt-4o-2024-08-06	0.531	A Case Study of Web App Coding with OpenAI Reasoning Models

0 of 6 row(s) selected.