LLM API Providers Leaderboard - Comparison of over 500 AI Model endpoints

Comparison of API provider performance across over 500 AI Model endpoints, including from OpenAI, Google, DeepSeek and others, across performance key metrics including price, output speed, latency, context window and more.

For more details including relating to our methodology, see our FAQs.

Reasoning model


										Further Analysis
Anthropic	Claude Fable 5 (with fallback)	1M	Proprietary	60	$7.70	59	92.66	101.07	--	Model Provider
Google	Claude Fable 5 (with fallback)	1M	Proprietary	60	$7.70	60	81.77	90.16	--	Model Provider
Microsoft Azure	Claude Fable 5 (with fallback)	1M	Proprietary	60	$14.00	57	103.35	112.16	--	Model Provider
OpenAI	GPT-5.6 Sol (max)	1M	Proprietary	59	$4.35	69	193.39	200.61	--	Model Provider
OpenAI	GPT-5.6 Sol (xhigh)	1M	Proprietary	58	$4.35	69	59.10	66.34	--	Model Provider
OpenAI	GPT-5.6 Sol (high)	1M	Proprietary	56	$4.35	67	12.97	20.47	--	Model Provider
Anthropic	Claude Opus 4.8 (max)	1M	Proprietary	56	$3.85	56	42.17	51.09	--	Model Provider
Amazon Bedrock	Claude Opus 4.8 (max)	1M	Proprietary	56	$3.85	62	40.76	48.78	--	Model Provider
Google	Claude Opus 4.8 (max)	1M	Proprietary	56	$3.85	66	39.57	47.18	--	Model Provider
OpenAI	GPT-5.6 Terra (max)	1M	Proprietary	55	$2.17	143	158.93	162.44	--	Model Provider
Amazon Bedrock	GPT-5.5 (xhigh)	272k	Proprietary	55	$4.79	78	83.59	90.00	--	Model Provider
OpenAI	GPT-5.5 (xhigh)	1.05M	Proprietary	55	$4.35	70	96.97	104.06	--	Model Provider
SpaceXAI	Grok 4.5 (high)	500k	Proprietary	54	$1.35	119	12.46	16.66	--	Model Provider
OpenAI	GPT-5.6 Sol (medium)	1M	Proprietary	54	$4.35	61	5.40	13.56	--	Model Provider
Google	Claude Opus 4.7 (max)	1M	Proprietary	54	$3.85	67	24.26	31.68	--	Model Provider
Microsoft Azure	Claude Opus 4.7 (max)	1M	Proprietary	54	$3.85	50	20.30	30.33	--	Model Provider
Amazon Bedrock	Claude Opus 4.7 (max)	1M	Proprietary	54	$3.85	59	1.99	10.40	--	Model Provider
Anthropic	Claude Opus 4.7 (max)	1M	Proprietary	54	$3.85	49	22.48	32.65	--	Model Provider
Google	Claude Sonnet 5 (max)	1M	Proprietary	53	$2.31	84	241.74	247.68	--	Model Provider
Microsoft Azure	Claude Sonnet 5 (max)	1M	Proprietary	53	$2.31	77	201.42	207.94	--	Model Provider
Anthropic	Claude Sonnet 5 (max)	1M	Proprietary	53	$1.54	80	225.33	231.62	--	Model Provider
Amazon Bedrock	Claude Sonnet 5 (max)	1M	Proprietary	53	$2.31	83	219.40	225.42	--	Model Provider
Amazon Bedrock	GPT-5.5 (high)	272k	Proprietary	53	$4.79	74	25.19	31.99	--	Model Provider
OpenAI	GPT-5.5 (high)	1.05M	Proprietary	53	$4.35	67	36.05	43.55	--	Model Provider
OpenAI	GPT-5.6 Terra (xhigh)	1M	Proprietary	52	$2.17	129	32.09	35.95	--	Model Provider
OpenAI	GPT-5.6 Luna (max)	1M	Proprietary	51	$0.87	216	103.52	105.83	--	Model Provider
Makora	GLM-5.2 (max) (FP8)	980k	Open	51	$1.30	179	0.86	14.86	11.20	Model Provider
Wafer	GLM-5.2 (max)	205k	Open	51	$0.79	227	1.84	12.86	8.82	Model Provider
FriendliAI	GLM-5.2 (max)	1M	Open	51	$0.90	212	1.48	13.27	9.44	Model Provider
Makora	GLM-5.2 (max) (NVFP4)	1M	Open	51	$0.66	204	0.85	13.13	9.82	Model Provider
Novita	GLM-5.2 (max) (FP8)	1.05M	Open	51	$0.90	37	2.51	69.38	53.49	Model Provider
Parasail	GLM-5.2 (max) (NVFP4)	1M	Open	51	$0.90	136	1.10	19.43	14.66	Model Provider
CoreWeave	GLM-5.2 (max)	262k	Open	51	$0.90	171	1.31	15.91	11.68	Model Provider
Baseten	GLM-5.2 (max)	261k	Open	51	$0.90	367	1.51	8.32	5.45	Model Provider
Together AI	GLM-5.2 (max)	262k	Open	51	$0.90	407	0.92	7.07	4.92	Model Provider
DeepInfra	GLM-5.2 (max) (FP4)	1.05M	Open	51	$0.61	42	2.37	61.74	47.50	Model Provider
Nebius	GLM-5.2 (max) (FP4)	432k	Open	51	$1.70	204	0.77	13.02	9.80	Model Provider
Blackbox AI	GLM-5.2 (max)	1.05M	Open	51	$0.78	449	1.86	7.43	4.45	Model Provider
Databricks	GLM-5.2 (max)	1M	Open	51	$0.90	338	0.91	8.30	5.92	Model Provider
Scaleway	GLM-5.2 (max)	262k	Open	51	$2.52	89	1.87	30.10	22.59	Model Provider
Fireworks	GLM-5.2 (max)	1M	Open	51	$0.82	435	1.02	6.77	4.60	Model Provider
SiliconFlow	GLM-5.2 (max) (FP8)	1.05M	Open	51	$0.90	40	2.11	64.51	49.92	Model Provider
Meta	Muse Spark 1.1 (xhigh)	1.05M	Proprietary	51	$0.78	119	1.14	22.20	16.85	Model Provider
Amazon Bedrock	GPT-5.5 (medium)	272k	Proprietary	50	$4.79	69	8.33	15.63	--	Model Provider
OpenAI	GPT-5.5 (medium)	1.05M	Proprietary	50	$4.35	64	9.92	17.76	--	Model Provider
Google	Gemini 3.5 Flash AI Studio	1M	Proprietary	50	$1.31	157	25.44	28.63	--	Model Provider
OpenAI	GPT-5.6 Sol (low)	1M	Proprietary	49	$4.35	62	2.25	10.32	--	Model Provider
OpenAI	GPT-5.6 Luna (xhigh)	1M	Proprietary	49	$0.87	196	39.83	42.38	--	Model Provider
OpenAI	GPT-5.6 Terra (high)	1M	Proprietary	49	$2.17	120	3.56	7.73	--	Model Provider
Google	Gemini 3.1 Pro Preview (AI Studio)	1M	Proprietary	46	$1.74	136	25.98	29.67	--	Model Provider
Google	Gemini 3.1 Pro Preview (Vertex)	1M	Proprietary	46	$1.74	129	21.66	25.53	--	Model Provider
OpenAI	GPT-5.6 Luna (high)	1M	Proprietary	46	$0.87	197	7.34	9.87	--	Model Provider
Alibaba Cloud	Qwen3.7 Max	991k	Proprietary	46	$1.43	197	2.55	17.28	12.20	Model Provider
Novita	Qwen3.7 Max	1M	Proprietary	46	$0.80	52	2.18	57.80	46.06	Model Provider
OpenAI	GPT-5.6 Terra (medium)	1M	Proprietary	46	$2.17	116	1.47	5.79	--	Model Provider
Google	Gemini 3.5 Flash (medium)	1M	Proprietary	45*	$1.31	151	19.59	22.90	--	Model Provider
Parasail	MiniMax-M3 (MXFP8)	1M	Open	44	$0.22	34	1.48	75.40	59.13	Model Provider
Together AI	MiniMax-M3	1M	Open	44	$0.22	97	0.75	26.47	20.57	Model Provider
Novita	MiniMax-M3	1M	Open	44	$0.22	97	2.02	27.89	20.70	Model Provider
SiliconFlow	MiniMax-M3	1M	Open	44	$0.44	112	1.37	23.64	17.82	Model Provider
MiniMax	MiniMax-M3	512k	Open	44	$0.22	111	1.41	23.99	18.06	Model Provider
DeepInfra	DeepSeek V4 Pro (max) (FP4)	1.05M	Open	44	$0.59	38	1.40	129.69	115.14	Model Provider
Microsoft Azure	DeepSeek V4 Pro (max)	1M	Open	44	$1.91	62	1.65	80.37	70.64	Model Provider
SiliconFlow	DeepSeek V4 Pro (max)	1.05M	Open	44	$0.80	44	2.22	111.82	98.36	Model Provider
Novita	DeepSeek V4 Pro (max)	1.05M	Open	44	$0.73	61	1.95	82.48	72.27	Model Provider
Makora	DeepSeek V4 Pro (max)	1M	Open	44	$1.64	219	0.84	23.13	20.00	Model Provider
Nebius	DeepSeek V4 Pro (max)	1M	Open	44	$1.93	53	1.73	94.05	82.85	Model Provider
Together AI	DeepSeek V4 Pro (max)	512k	Open	44	$1.00	212	1.03	24.07	20.68	Model Provider
Fireworks	DeepSeek V4 Pro (max)	1.05M	Open	44	$0.79	182	1.32	28.17	24.10	Model Provider
DeepSeek	DeepSeek V4 Pro (max)	1M	Open	44	$0.18	64	1.70	78.48	68.90	Model Provider
OpenAI	GPT-5.3 Codex (xhigh)	400k	Proprietary	44*	$1.87	95	90.52	95.80	--	Model Provider
Databricks	Kimi K2.6	262k	Open	44	$0.70	186	1.12	27.75	23.94	Model Provider
Crusoe	Kimi K2.6 (NVFP4)	262k	Open	44	$0.73	426	1.01	12.63	10.44	Model Provider
CoreWeave	Kimi K2.6	262k	Open	44	$0.70	285	1.17	18.54	15.61	Model Provider
Novita	Kimi K2.6	262k	Open	44	$0.61	64	1.77	79.36	69.76	Model Provider
Together AI	Kimi K2.6 (FP4)	262k	Open	44	$0.83	146	0.64	34.54	30.48	Model Provider
Fireworks	Kimi K2.6	262k	Open	44	$0.70	368	0.69	14.16	12.11	Model Provider
SiliconFlow	Kimi K2.6 (FP8)	262k	Open	44	$0.90	46	1.90	110.30	97.45	Model Provider
DeepInfra	Kimi K2.6 (FP4)	262k	Open	44	$0.60	53	0.78	94.68	84.41	Model Provider
Parasail	Kimi K2.6	262k	Open	44	$0.64	47	1.59	106.14	93.99	Model Provider
Nebius	Kimi K2.6	262k	Open	44	$1.25	226	1.90	23.83	19.72	Model Provider
Cloudflare	Kimi K2.6	262k	Open	44	$0.70	42	1.40	118.73	105.48	Model Provider
Microsoft Azure	Kimi K2.6	262k	Open	44	$1.25	202	1.32	25.78	21.98	Model Provider
Kimi	Kimi K2.6	256k	Open	44	$0.70	47	2.18	106.77	94.03	Model Provider
Amazon Bedrock	GPT-5.5 (low)	272k	Proprietary	43	$4.79	68	1.82	9.20	--	Model Provider
OpenAI	GPT-5.5 (low)	1.05M	Proprietary	43	$4.35	59	1.98	10.40	--	Model Provider
Anthropic	Claude Opus 4.7 (Non-reasoning, high)	1M	Proprietary	43*	$3.85	44	1.58	12.93	--	Model Provider
Amazon Bedrock	Claude Opus 4.7 (Non-reasoning, high)	1M	Proprietary	43*	$3.85	59	1.76	10.17	--	Model Provider
Novita	MiMo-V2.5-Pro	1.05M	Open	42	$0.21	59	1.91	44.05	33.71	Model Provider
DeepInfra	MiMo-V2.5-Pro	65.5k	Open	42	$0.64	85	0.71	30.24	23.62	Model Provider
Xiaomi	MiMo-V2.5-Pro	1M	Open	42	$0.18	51	3.83	53.01	39.35	Model Provider
Nebius	Kimi K2.7 Code (FP4)	256k	Open	42	$1.25	107	1.98	27.51	20.85	Model Provider
GMI	Kimi K2.7 Code (FP8)	65.5k	Open	42	$0.72	48	5.57	62.70	46.66	Model Provider
CoreWeave	Kimi K2.7 Code	262k	Open	42	$0.72	259	1.22	11.74	8.60	Model Provider
Parasail	Kimi K2.7 Code	262k	Open	42	$0.61	50	2.19	57.02	44.78	Model Provider
Together AI	Kimi K2.7 Code	262k	Open	42	$0.72	237	0.53	12.05	9.41	Model Provider
Novita	Kimi K2.7 Code	262k	Open	42	$0.72	58	3.06	50.31	38.59	Model Provider
Crusoe	Kimi K2.7 Code (NVFP4)	262k	Open	42	$0.71	432	0.79	7.11	5.16	Model Provider
Databricks	Kimi K2.7 Code	262k	Open	42	$0.70	162	1.10	17.95	13.76	Model Provider
DeepInfra	Kimi K2.7 Code	262k	Open	42	$0.60	34	0.97	82.29	66.41	Model Provider
Makora	Kimi K2.7 Code	262k	Open	42	$1.10	276	0.58	10.45	8.06	Model Provider
Kimi	Kimi K2.7 Code	256k	Open	42	$0.70	48	3.06	59.96	46.47	Model Provider
Anthropic	Claude Sonnet 5 (Non-reasoning)	1M	Proprietary	42	$1.54	68	1.41	8.78	--	Model Provider
SiliconFlow	Nex-N2-Pro (FP8)	262k	Open	41	$0.53	133	1.76	20.61	15.07	Model Provider
DeepInfra	DeepSeek V4 Pro (high) (FP4)	65.5k	Open	41*	$0.59	35	1.36	72.11	56.55	Model Provider
Fireworks	DeepSeek V4 Pro (high)	1.05M	Open	41*	$0.79	182	2.30	15.98	10.93	Model Provider
Microsoft Azure	DeepSeek V4 Pro (high)	1M	Open	41*	$1.91	58	2.06	45.38	34.63	Model Provider
DeepSeek	DeepSeek V4 Pro (high)	1M	Open	41*	$0.18	61	1.65	42.32	32.51	Model Provider
SiliconFlow	DeepSeek V4 Pro (high) (FP8)	1.05M	Open	41*	$0.80	43	2.97	61.48	46.77	Model Provider
Nebius	DeepSeek V4 Pro (high)	1M	Open	41*	$1.93	72	1.74	36.44	27.74	Model Provider
Together AI	DeepSeek V4 Pro (high)	512k	Open	41*	$1.00	209	1.06	12.98	9.53	Model Provider
Makora	DeepSeek V4 Pro (high)	1M	Open	41*	$1.64	194	0.84	13.66	10.25	Model Provider
Novita	DeepSeek V4 Pro (high)	1.05M	Open	41*	$0.73	65	2.24	40.71	30.75	Model Provider
Baseten	DeepSeek V4 Pro (high)	131k	Open	41*	$0.80	126	0.92	20.62	15.75	Model Provider
OpenAI	GPT-5.6 Terra (low)	1M	Proprietary	40	$2.17	113	1.37	5.78	--	Model Provider
Makora	DeepSeek V4 Flash (max)	1M	Open	40	$0.15	207	0.71	30.27	27.14	Model Provider
DeepInfra	DeepSeek V4 Flash (max) (FP4)	1.05M	Open	40	$0.05	21	1.11	294.18	269.10	Model Provider
SiliconFlow	DeepSeek V4 Flash (max) (FP8)	1.05M	Open	40	$0.08	76	1.96	82.81	74.24	Model Provider
Parasail	DeepSeek V4 Flash (max) (FP8)	1.05M	Open	40	$0.11	47	1.77	130.50	118.20	Model Provider
Novita	DeepSeek V4 Flash (max)	1.05M	Open	40	$0.08	106	1.98	59.78	53.08	Model Provider
DeepSeek	DeepSeek V4 Flash (max)	1M	Open	40	$0.06	102	1.34	61.56	55.29	Model Provider
Wafer	GLM-5.1	203k	Open	40	$0.59	61	6.00	76.49	62.27	Model Provider
DeepInfra	GLM-5.1 (FP4)	203k	Open	40	$0.70	54	0.86	80.63	70.47	Model Provider
Fireworks	GLM-5.1	203k	Open	40	$0.90	170	0.95	26.27	22.37	Model Provider
Parasail	GLM-5.1 (FP8)	203k	Open	40	$0.90	82	1.57	53.95	46.27	Model Provider
Novita	GLM-5.1 (FP8)	205k	Open	40	$0.90	50	2.91	88.85	75.93	Model Provider
CoreWeave	GLM-5.1	203k	Open	40	$1.70	181	1.28	24.93	20.90	Model Provider
Nebius	GLM-5.1 (FP8, Base)	200k	Open	40	$1.70	32	1.84	136.60	119.06	Model Provider
Together AI	GLM-5.1	203k	Open	40	$1.70	52	1.28	83.17	72.35	Model Provider
SiliconFlow	GLM-5.1	205k	Open	40	$0.90	49	2.93	90.23	77.12	Model Provider
FriendliAI	GLM-5.1	203k	Open	40	$0.90	160	0.95	27.76	23.68	Model Provider
Microsoft Azure	GPT-5.4 mini (xhigh)	400k	Proprietary	40	$0.65	274	117.85	119.67	--	Model Provider
OpenAI	GPT-5.4 mini (xhigh)	400k	Proprietary	40	$0.65	164	9.01	12.06	--	Model Provider
SpaceXAI	Grok Build 0.1 0616	256k	Proprietary	40	$0.54	60	0.53	41.95	33.13	Model Provider
Alibaba Cloud	Qwen3.6 Plus	1M	Proprietary	40	$0.43	52	2.74	119.30	106.92	Model Provider
Alibaba Cloud	Qwen3.7 Plus	1M	Proprietary	39	$0.27	51	3.06	51.88	39.05	Model Provider
OpenAI	GPT-5.4 nano (xhigh)	400k	Proprietary	38	$0.18	173	7.41	10.30	--	Model Provider
Together AI	MiniMax-M2.7	197k	Open	38	$0.22	207	0.54	14.87	11.90	Model Provider
Fireworks	MiniMax-M2.7	197k	Open	38	$0.22	90	0.76	33.59	27.29	Model Provider
MiniMax	MiniMax-M2.7	205k	Open	38	$0.22	46	1.90	65.99	53.27	Model Provider
Novita	MiniMax-M2.7 (FP8)	205k	Open	38	$0.22	52	1.91	58.95	47.41	Model Provider
SambaNova	MiniMax-M2.7	197k	Open	38	$0.78	462	2.20	8.61	5.32	Model Provider
OpenAI	GPT-5.6 Luna (medium)	1M	Proprietary	38	$0.87	196	1.98	4.53	--	Model Provider
CoreWeave	Nemotron 3 Ultra	262k	Open	38	$0.53	229	1.12	13.23	9.93	Model Provider
Together AI	Nemotron 3 Ultra	512k	Open	38	$0.62	162	0.78	17.94	14.07	Model Provider
DeepInfra	Nemotron 3 Ultra	262k	Open	38	$0.39	93	4.67	34.49	24.44	Model Provider
Nebius	Nemotron 3 Ultra	256k	Open	38	$1.20	319	2.21	10.92	7.14	Model Provider
Lightning AI	Nemotron 3 Ultra	262k	Open	38	$0.49	79	1.05	36.22	28.83	Model Provider
Blackbox AI	Nemotron 3 Ultra	262k	Open	38	$0.44	460	1.07	7.10	4.94	Model Provider
SpaceXAI	Grok 4.3 (high)	1M	Proprietary	38	$0.64	109	24.00	28.57	--	Model Provider
Amazon Bedrock	Grok 4.3 (high)	524k	Proprietary	38	$0.64	231	14.87	17.03	--	Model Provider
Microsoft Azure	Grok 4.3 (high)	200k	Proprietary	38	$1.38	100	30.40	35.41	--	Model Provider
CoreWeave	DeepSeek V4 Flash (high)	1M	Open	37*	$0.11	53	1.46	34.49	23.54	Model Provider
DeepInfra	DeepSeek V4 Flash (high) (FP4)	1.05M	Open	37*	$0.05	22	1.19	80.30	56.37	Model Provider
Makora	DeepSeek V4 Flash (high)	1M	Open	37*	$0.15	192	0.72	9.80	6.47	Model Provider
Parasail	DeepSeek V4 Flash (high) (FP8)	1.05M	Open	37*	$0.11	54	1.64	33.72	22.86	Model Provider
SiliconFlow	DeepSeek V4 Flash (high) (FP8)	1.05M	Open	37*	$0.08	82	2.00	23.27	15.16	Model Provider
Novita	DeepSeek V4 Flash (high)	1.05M	Open	37*	$0.08	103	1.87	18.80	12.07	Model Provider
DeepSeek	DeepSeek V4 Flash (high)	1M	Open	37*	$0.06	92	1.39	20.35	13.51	Model Provider
Novita	MiMo-V2.5	1.05M	Open	37	$0.07	84	1.96	31.76	23.84	Model Provider
Parasail	MiMo-V2.5	1M	Open	37	$0.09	46	1.10	55.82	43.78	Model Provider
DeepInfra	MiMo-V2.5	262k	Open	37	$0.34	46	0.64	55.16	43.61	Model Provider
Xiaomi	MiMo-V2.5	1M	Open	37	$0.06	79	2.53	34.22	25.35	Model Provider
Groq	Qwen3.6 27B	131k	Open	37	$0.84	481	1.03	13.87	11.80	Model Provider
SiliconFlow	Qwen3.6 27B (FP8)	262k	Open	37	$0.59	42	3.46	149.59	134.30	Model Provider
DeepInfra	Qwen3.6 27B FP8	262k	Open	37	$0.61	50	1.08	124.15	113.10	Model Provider
Makora	Qwen3.6 27B FP4	256k	Open	37	$0.59	47	2.24	133.67	120.79	Model Provider
Novita	Qwen3.6 27B	262k	Open	37	$0.90	60	2.84	105.76	94.59	Model Provider
Alibaba Cloud	Qwen3.6 27B	262k	Open	37	$0.90	59	3.89	108.04	95.72	Model Provider
Amazon Bedrock	Grok 4.3 (medium)	524k	Proprietary	36*	$0.64	196	9.71	12.27	--	Model Provider
Microsoft Azure	Grok 4.3 (medium)	200k	Proprietary	36*	$1.38	97	17.03	22.18	--	Model Provider
SpaceXAI	Grok 4.3 (medium)	1M	Proprietary	36*	$0.64	109	13.36	17.93	--	Model Provider
Amazon Bedrock	Grok 4.3 (low)	524k	Proprietary	35*	$0.64	194	5.62	8.20	--	Model Provider
Microsoft Azure	Grok 4.3 (low)	200k	Proprietary	35*	$1.38	109	7.15	11.74	--	Model Provider
SpaceXAI	Grok 4.3 (low)	1M	Proprietary	35*	$0.64	110	5.41	9.95	--	Model Provider
OpenAI	GPT-5.5 (Non-reasoning)	1.05M	Proprietary	35	$4.35	59	0.87	9.27	--	Model Provider
Amazon Bedrock	GPT-5.5 (Non-reasoning)	272k	Proprietary	35	$4.79	67	0.95	8.39	--	Model Provider
Wafer	GLM-5.1	203k	Open	35*	$0.59	68	5.58	12.96	--	Model Provider
Parasail	GLM-5.1	203k	Open	35*	$0.90	77	1.58	8.07	--	Model Provider
DeepInfra	GLM-5.1 (FP4)	203k	Open	35*	$0.70	46	0.92	11.87	--	Model Provider
Novita	GLM-5.1 (FP8)	205k	Open	35*	$0.90	47	3.14	13.68	--	Model Provider
FriendliAI	GLM-5.1	203k	Open	35*	$0.90	155	0.96	4.19	--	Model Provider
SiliconFlow	GLM-5.1 (FP8)	205k	Open	35*	$0.90	51	2.35	12.07	--	Model Provider
Nebius	GLM-5.1 (FP8, Base)	200k	Open	35*	$1.70	32	1.86	17.68	--	Model Provider
Google	Gemini 3.5 Flash (minimal) AI Studio	1M	Proprietary	35*	$1.31	155	0.95	4.19	--	Model Provider
Novita	KAT-Coder-Pro V1	256k	Proprietary	35	$0.22	103	1.38	6.22	--	Model Provider
Databricks	Kimi K2.6	262k	Open	35*	$0.70	191	1.15	3.77	--	Model Provider
Together AI	Kimi K2.6 (FP4)	262k	Open	35*	$0.83	107	0.57	5.25	--	Model Provider
SiliconFlow	Kimi K2.6 (FP8)	262k	Open	35*	$0.72	41	1.58	13.68	--	Model Provider
Fireworks	Kimi K2.6	262k	Open	35*	$0.70	307	0.69	2.32	--	Model Provider
Parasail	Kimi K2.6 (INT4)	262k	Open	35*	$0.61	39	1.85	14.81	--	Model Provider
DeepInfra	Kimi K2.6 (FP4)	262k	Open	35*	$0.60	47	0.74	11.27	--	Model Provider
CoreWeave	Kimi K2.6	262k	Open	35*	$0.70	253	1.15	3.12	--	Model Provider
Microsoft Azure	Kimi K2.6	262k	Open	35*	$1.25	217	1.45	3.76	--	Model Provider
Crusoe	Kimi K2.6 (NVFP4)	262k	Open	35*	$0.73	251	0.98	2.97	--	Model Provider
Kimi	Kimi K2.6	256k	Open	35*	$0.70	40	2.92	15.32	--	Model Provider
Nebius	Kimi K2.6	262k	Open	35*	$1.25	225	2.04	4.26	--	Model Provider
Novita	Kimi K2.6	262k	Open	35*	$0.61	54	3.01	12.23	--	Model Provider
Anthropic	Claude Sonnet 4.6 (Non-reasoning, Low Effort)	1M	Proprietary	34*	$2.31	43	1.52	13.13	--	Model Provider
Scaleway	GLM-5.2	262k	Open	34	$2.52	108	1.63	6.24	--	Model Provider
OpenAI	GPT-5.6 Terra (Non-reasoning)	1M	Proprietary	34	$2.17	117	0.73	5.00	--	Model Provider
Wafer	Qwen3.5 397B A17B	262k	Open	34	$0.37	61	2.42	63.34	52.65	Model Provider
Parasail	Qwen3.5 397B A17B	262k	Open	34	$0.69	85	0.98	44.10	37.27	Model Provider
SiliconFlow	Qwen3.5 397B A17B (FP8)	262k	Open	34	$0.58	112	2.34	35.28	28.47	Model Provider
DeepInfra	Qwen3.5 397B A17B (FP8)	262k	Open	34	$0.54	39	0.86	96.08	82.31	Model Provider
DigitalOcean	Qwen3.5 397B A17B	262k	Open	34	$0.40	15	1.19	241.43	207.65	Model Provider
Nebius	Qwen3.5 397B A17B (Base, FP4)	262k	Open	34	$0.90	109	2.00	35.86	29.27	Model Provider
Alibaba Cloud	Qwen3.5 397B A17B	262k	Open	34	$0.90	59	2.63	64.80	53.74	Model Provider
Novita	Qwen3.5 397B A17B	262k	Open	34	$0.90	59	1.68	64.17	54.01	Model Provider
SiliconFlow	Hy3-preview	256k	Open	34*	$0.06	167	3.13	18.14	12.01	Model Provider
OpenAI	GPT-5.6 Luna (low)	1M	Proprietary	33	$0.87	197	1.33	3.86	--	Model Provider
SiliconFlow	Qwen3.5 122B A10B (FP8)	262k	Open	32	$0.44	53	2.07	49.13	37.65	Model Provider
DeepInfra	Qwen3.5 122B A10B (FP4)	262k	Open	32	$0.40	109	5.39	28.28	18.31	Model Provider
Alibaba Cloud	Qwen3.5 122B A10B	262k	Open	32	$0.68	143	2.43	19.94	14.01	Model Provider
Novita	Qwen3.5 122B A10B	262k	Open	32	$0.68	102	1.83	26.29	19.57	Model Provider
Wafer	Qwen3.5 397B A17B	262k	Open	32*	$0.37	55	2.46	11.50	--	Model Provider
DeepInfra	Qwen3.5 397B A17B (FP8)	262k	Open	32*	$0.54	41	0.84	13.18	--	Model Provider
Alibaba Cloud	Qwen3.5 397B A17B	262k	Open	32*	$0.90	60	2.60	10.99	--	Model Provider
Nebius	Qwen3.5 397B A17B (Base, FP4)	262k	Open	32*	$0.90	108	2.01	6.64	--	Model Provider
DigitalOcean	Qwen3.5 397B A17B	262k	Open	32*	$0.40	14	119.98	156.45	--	Model Provider
Novita	Qwen3.5 397B A17B	262k	Open	32*	$0.90	57	1.64	10.40	--	Model Provider
Alibaba Cloud	Qwen3.6 35B A3B	229k	Open	32	$0.37	169	2.35	37.26	31.95	Model Provider
SiliconFlow	Qwen3.6 35B A3B (FP8)	262k	Open	32	$0.34	71	2.21	85.50	76.23	Model Provider
Scaleway	Qwen3.6 35B A3B	262k	Open	32	$0.44	186	0.99	32.66	28.99	Model Provider
DeepInfra	Qwen3.6 35B A3B (FP8)	262k	Open	32	$0.23	85	0.66	70.35	63.78	Model Provider
Makora	Qwen3.6 35B A3B FP4	1M	Open	32	$0.24	24	0.82	247.73	225.97	Model Provider
GMI	Qwen3.6 35B A3B FP8	262k	Open	32	$0.37	171	2.86	37.33	31.55	Model Provider
Parasail	Qwen3.6 35B A3B	262k	Open	32	$0.41	149	0.84	40.50	36.29	Model Provider
Novita	Qwen3.6 35B A3B	205k	Open	32	$0.37	170	1.56	36.28	31.77	Model Provider
Microsoft Azure	DeepSeek V4 Pro	1M	Open	31*	$1.91	70	1.70	8.88	--	Model Provider
Nebius	DeepSeek V4 Pro	1.05M	Open	31*	$1.93	69	1.81	9.09	--	Model Provider
Makora	DeepSeek V4 Pro	1M	Open	31*	$1.64	217	0.84	3.14	--	Model Provider
DeepSeek	DeepSeek V4 Pro	1M	Open	31*	$0.18	65	1.74	9.42	--	Model Provider
Alibaba Cloud	Qwen3.5 Omni Plus	256k	Proprietary	31*	$0.84	57	2.44	11.20	--	Model Provider
InclusionAI	Ring-2.6-1T	262k	Open	31	$0.52	126	3.31	23.07	15.81	Model Provider
Groq	Qwen3.6 27B	131k	Open	30	$0.84	487	1.09	2.11	--	Model Provider
Makora	Qwen3.6 27B FP4	256k	Open	30	$0.59	52	2.23	11.76	--	Model Provider
DeepInfra	Qwen3.6 27B FP8	262k	Open	30	$0.61	49	1.10	11.32	--	Model Provider
Alibaba Cloud	Qwen3.6 27B	262k	Open	30	$0.90	56	3.66	12.54	--	Model Provider
Novita	Qwen3.6 27B	262k	Open	30	$0.90	66	64.94	72.53	--	Model Provider
Microsoft Azure	o3	200k	Proprietary	30*	$1.55	104	22.96	27.77	--	Model Provider
OpenAI	o3	200k	Proprietary	30*	$1.55	119	6.74	10.96	--	Model Provider
StepFun	Step 3.7 Flash	256k	Open	30	$0.18	388	0.88	7.33	5.16	Model Provider
DeepInfra	Step 3.7 Flash	256k	Open	30	$0.18	155	0.51	16.60	12.88	Model Provider
OpenAI	GPT-5.4 nano	400k	Proprietary	30*	$0.18	166	5.38	8.39	--	Model Provider
Mistral	Mistral Medium 3.5	262k	Open	30	$1.16	123	2.17	22.57	16.32	Model Provider
Microsoft Azure	GPT-5.4 mini (medium)	400k	Proprietary	30*	$1.13	191	12.52	15.14	--	Model Provider
OpenAI	GPT-5.4 mini (medium)	272k	Proprietary	30*	$0.65	153	10.14	13.40	--	Model Provider
Amazon Bedrock	Claude 4.5 Haiku	200k	Proprietary	30	$0.77	112	15.01	19.48	--	Model Provider
Google	Claude 4.5 Haiku Vertex	200k	Proprietary	30	$0.77	96	15.37	20.56	--	Model Provider
Anthropic	Claude 4.5 Haiku	200k	Proprietary	30	$0.77	102	20.52	25.40	--	Model Provider
Microsoft Azure	Claude 4.5 Haiku	200k	Proprietary	30	$1.40	87	17.37	23.08	--	Model Provider
CoreWeave	Gemma 4 31B	262k	Open	29	$0.12	44	1.05	51.66	39.29	Model Provider
Cerebras	Gemma 4 31B	131k	Open	29	$1.04	1,991	0.63	1.75	0.87	Model Provider
Parasail	Gemma 4 31B	262k	Open	29	$0.12	30	2.87	77.33	57.81	Model Provider
DeepInfra	Gemma 4 31B	262k	Open	29	$0.08	19	1.11	116.89	89.89	Model Provider
SiliconFlow	Gemma 4 31B (FP8)	262k	Open	29	$0.16	62	3.19	39.12	27.90	Model Provider
SambaNova	Gemma 4 31B	131k	Open	29	$0.46	196	3.11	14.53	8.87	Model Provider
FriendliAI	Gemma 4 31B	256k	Open	29	$0.17	70	2.20	34.19	24.84	Model Provider
Lightning AI	Gemma 4 31B	131k	Open	29	$0.17	140	0.64	16.57	12.36	Model Provider
Together AI	Gemma 4 31B	262k	Open	29	$0.23	53	1.24	43.66	32.93	Model Provider
Google	Gemma 4 31B (AI Studio)	262k	Open	29	$0.00	35	1.10	64.59	49.29	Model Provider
DeepSeek	DeepSeek V4 Flash	1M	Open	29*	$0.06	100	1.24	6.23	--	Model Provider
Makora	DeepSeek V4 Flash	1M	Open	29*	$0.15	226	0.66	2.87	--	Model Provider
CoreWeave	DeepSeek V4 Flash	1M	Open	29*	$0.11	76	1.42	7.98	--	Model Provider
DeepInfra	MiMo-V2.5-Pro	65.5k	Open	28*	$0.64	87	0.79	6.51	--	Model Provider
Xiaomi	MiMo-V2.5-Pro	131k	Open	28*	$0.18	57	3.27	12.00	--	Model Provider
Novita	MiMo-V2.5-Pro	1.05M	Open	28*	$0.21	66	1.70	9.23	--	Model Provider
DeepInfra	Qwen3.5 122B A10B (FP4)	262k	Open	28	$0.40	110	5.29	9.84	--	Model Provider
Alibaba Cloud	Qwen3.5 122B A10B	262k	Open	28	$0.68	163	2.54	5.61	--	Model Provider
OpenAI	GPT-5.6 Luna (Non-reasoning)	1M	Proprietary	27	$0.87	193	0.72	3.31	--	Model Provider
SiliconFlow	Hy3-preview	328k	Open	26*	$0.06	160	3.19	6.32	--	Model Provider
StepFun	Step 3.5 Flash 2603	256k	Proprietary	26*	$0.06	196	1.03	13.76	10.19	Model Provider
Google	Gemini 2.5 Pro Vertex	1M	Proprietary	26	$1.34	110	30.79	35.34	--	Model Provider
Google	Gemini 2.5 Pro (AI Studio)	1M	Proprietary	26	$1.34	137	19.02	22.68	--	Model Provider
Makora	Gemma 4 26B A4B	1M	Open	26	$0.09	256	0.78	10.54	7.81	Model Provider
Cloudflare	Gemma 4 26B A4B	256k	Open	26	$0.12	92	1.06	28.11	21.64	Model Provider
DeepInfra	Gemma 4 26B A4B	262k	Open	26	$0.10	22	0.76	117.04	93.02	Model Provider
Parasail	Gemma 4 26B A4B	256k	Open	26	$0.10	67	1.35	38.66	29.85	Model Provider
Novita	Gemma 4 26B A4B	262k	Open	26	$0.16	27	3.72	96.35	74.10	Model Provider
Google	Gemma 4 26B A4B AI Studio	262k	Open	26	$0.00	47	1.75	54.88	42.51	Model Provider
Baseten	NVIDIA Nemotron 3 Super	203k	Open	25	$0.18	277	0.35	9.39	7.23	Model Provider
CoreWeave	NVIDIA Nemotron 3 Super	262k	Open	25	$0.26	141	1.03	18.73	14.17	Model Provider
Nebius	NVIDIA Nemotron 3 Super	256k	Open	25	$0.36	383	1.84	8.37	5.23	Model Provider
Inception	Mercury 2	128k	Proprietary	25*	$0.14	797	2.91	3.54	--	Model Provider
Google	Gemini 3.1 Flash-Lite (AI Studio)	1M	Proprietary	25	$0.22	272	5.78	7.62	--	Model Provider
Amazon Bedrock	Grok 4.3 (Non-reasoning)	524k	Proprietary	25	$0.64	193	1.11	3.70	--	Model Provider
SpaceXAI	Grok 4.3 (Non-reasoning)	1M	Proprietary	25	$0.64	119	0.78	5.00	--	Model Provider
Parasail	Trinity Large Thinking (FP8)	262k	Open	24*	$0.17	159	1.20	16.91	12.57	Model Provider
Arcee AI	Trinity Large Thinking	262k	Open	24*	$0.32	259	1.15	10.82	7.74	Model Provider
Scaleway	Qwen3.6 35B A3B	262k	Open	24*	$0.44	174	1.06	3.94	--	Model Provider
Makora	Qwen3.6 35B A3B FP4	1M	Open	24*	$0.24	27	66.82	85.61	--	Model Provider
DeepInfra	Qwen3.6 35B A3B (FP8)	262k	Open	24*	$0.27	80	0.65	6.88	--	Model Provider
Novita	Qwen3.6 35B A3B	205k	Open	24*	$0.37	185	1.55	4.26	--	Model Provider
GMI	Qwen3.6 35B A3B FP8	262k	Open	24*	$0.37	193	2.88	5.48	--	Model Provider
Parasail	Qwen3.6 35B A3B (FP8)	262k	Open	24*	$0.41	151	1.01	4.33	--	Model Provider
Alibaba Cloud	Qwen3.6 35B A3B	262k	Open	24*	$0.56	184	2.44	5.16	--	Model Provider
Groq	gpt-oss-120b (high)	131k	Open	24	$0.14	478	0.74	5.97	4.18	Model Provider
Scaleway	gpt-oss-120b (high)	128k	Open	24	$0.22	182	1.23	14.98	11.00	Model Provider
Cloudflare	gpt-oss-120b (high)	116k	Open	24	$0.39	177	1.02	15.14	11.30	Model Provider
DeepInfra	gpt-oss-120b (high)	131k	Open	24	$0.05	43	0.73	58.70	46.37	Model Provider
Microsoft Azure	gpt-oss-120b (high)	131k	Open	24	$0.20	362	0.73	7.63	5.52	Model Provider
CoreWeave	gpt-oss-120b (high)	131k	Open	24	$0.05	52	1.52	49.48	38.36	Model Provider
DeepInfra	gpt-oss-120b (high) (Turbo)	131k	Open	24	$0.20	273	0.70	9.87	7.34	Model Provider
Makora	gpt-oss-120b (high)	128k	Open	24	$0.20	177	0.72	14.87	11.32	Model Provider
Cerebras	gpt-oss-120b (high)	131k	Open	24	$0.39	1,772	0.60	2.01	1.13	Model Provider
Google	gpt-oss-120b (high) Vertex	131k	Open	24	$0.12	420	0.41	6.36	4.76	Model Provider
Baseten	gpt-oss-120b (high)	128k	Open	24	$0.14	275	0.44	9.52	7.26	Model Provider
SambaNova	gpt-oss-120b (high)	131k	Open	24	$0.26	695	1.11	4.71	2.88	Model Provider
Parasail	gpt-oss-120b (high)	131k	Open	24	$0.13	227	0.84	11.85	8.81	Model Provider
Fireworks	gpt-oss-120b (high)	131k	Open	24	$0.20	670	1.78	5.52	2.99	Model Provider
Nebius	gpt-oss-120b (high) Base	128k	Open	24	$0.20	358	1.02	8.01	5.59	Model Provider
Databricks	gpt-oss-120b (high)	128k	Open	24	$0.20	340	0.67	8.01	5.88	Model Provider
Amazon Bedrock	gpt-oss-120b (high)	131k	Open	24	$0.20	120	1.14	22.05	16.73	Model Provider
Together AI	gpt-oss-120b (high)	131k	Open	24	$0.20	570	0.64	5.03	3.51	Model Provider
Novita	gpt-oss-120b (high)	131k	Open	24	$0.07	96	0.98	27.15	20.93	Model Provider
Amazon Bedrock	Claude 4.5 Haiku	200k	Proprietary	24*	$0.77	102	1.11	5.99	--	Model Provider
Anthropic	Claude 4.5 Haiku	200k	Proprietary	24*	$0.77	91	1.00	6.49	--	Model Provider
Microsoft Azure	Claude 4.5 Haiku	200k	Proprietary	24*	$1.40	89	1.30	6.93	--	Model Provider
Google	Claude 4.5 Haiku Vertex	200k	Proprietary	24*	$0.77	92	0.60	6.04	--	Model Provider
DeepInfra	Qwen3.5 35B A3B FP8	262k	Open	23*	$0.16	152	0.43	3.72	--	Model Provider
Alibaba Cloud	Qwen3.5 35B A3B	262k	Open	23*	$0.42	196	2.23	4.78	--	Model Provider
Cohere	Command A+	200k	Open	23	$0.00	157	0.40	16.28	12.70	Model Provider
SiliconFlow	Gemma 4 12B	262k	Open	22*	$0.12	56	2.51	46.85	35.47	Model Provider
Parasail	Gemma 4 31B	262k	Open	22	$0.14	35	2.68	16.89	--	Model Provider
Cerebras	Gemma 4 31B	131k	Open	22	$1.04	1,767	0.58	0.86	--	Model Provider
FriendliAI	Gemma 4 31B	262k	Open	22	$0.17	72	2.11	9.09	--	Model Provider
Together AI	Gemma 4 31B (FP8)	262k	Open	22	$0.23	52	1.23	10.92	--	Model Provider
SiliconFlow	Gemma 4 31B (FP8)	262k	Open	22	$0.16	55	3.07	12.20	--	Model Provider
DeepInfra	Gemma 4 31B (FP8)	262k	Open	22	$0.15	23	0.87	22.43	--	Model Provider
SambaNova	Gemma 4 31B	131k	Open	22	$0.46	199	3.15	5.67	--	Model Provider
Novita	Gemma 4 31B	262k	Open	22	$0.17	23	1.38	23.30	--	Model Provider
Amazon Bedrock	Nova 2.0 Pro Preview (medium)	256k	Proprietary	22	$1.47	126	15.47	35.32	15.89	Model Provider
SiliconFlow	Qwen3.5 9B (FP8)	262k	Open	21	$0.11	42	2.42	62.22	47.84	Model Provider
Together AI	Qwen3.5 9B (FP8)	262k	Open	21	$0.11	68	0.73	37.41	29.34	Model Provider
Parasail	Qwen3 Coder Next (FP8)	262k	Open	21	$0.18	88	1.09	6.77	--	Model Provider
Novita	Qwen3 Coder Next (FP8)	262k	Open	21	$0.33	163	2.55	5.61	--	Model Provider
Amazon Bedrock	Qwen3 Coder Next	128k	Open	21	$0.57	137	1.97	5.63	--	Model Provider
Cohere	North Mini Code	256k	Open	21*	$0.00	97	0.33	26.00	20.54	Model Provider
Makora	Gemma 4 26B A4B	1M	Open	20*	$0.09	259	0.76	2.70	--	Model Provider
Parasail	Gemma 4 26B A4B	262k	Open	20*	$0.10	51	1.27	11.10	--	Model Provider
SiliconFlow	Gemma 4 26B A4B (FP8)	262k	Open	20*	$0.15	141	2.24	5.79	--	Model Provider
Scaleway	Gemma 4 26B A4B	262k	Open	20*	$0.28	220	0.96	3.23	--	Model Provider
DeepInfra	Gemma 4 26B A4B (FP8)	262k	Open	20*	$0.10	23	0.63	22.38	--	Model Provider
Novita	Gemma 4 26B A4B	262k	Open	20*	$0.16	29	2.65	19.83	--	Model Provider
DeepInfra	Qwen3.5 4B (FP8)	262k	Open	20*	$0.04	24	0.78	104.00	82.58	Model Provider
Amazon Bedrock	Nova 2.0 Pro Preview (low)	256k	Proprietary	20	$2.13	121	11.70	32.43	16.58	Model Provider
Mistral	Mistral Small 4	256k	Open	20	$0.20	166	0.71	15.74	12.02	Model Provider
Mistral	Devstral 2	262k	Open	19	$0.00	57	1.32	10.08	--	Model Provider
Amazon Bedrock	Nova 2.0 Lite (medium)	1M	Proprietary	19*	$0.52	148	18.30	35.19	13.51	Model Provider
Alibaba Cloud	Qwen3.5 Omni Flash	256k	Proprietary	19*	$0.17	229	1.91	4.09	--	Model Provider
Amazon Bedrock	Nova 2.0 Lite (high)	1M	Proprietary	18	$0.52	158	18.96	34.81	12.68	Model Provider
Mistral	Magistral Medium 1.2	131k	Proprietary	18	$2.30	41	1.73	62.55	48.66	Model Provider
Amazon Bedrock	Nova 2.0 Lite (low)	1M	Proprietary	18*	$0.52	138	12.43	30.57	14.52	Model Provider
CompactifAI	HyperNova 60B 2605	131k	Open	18	$0.05	349	0.95	8.11	5.73	Model Provider
Nebius	gpt-oss-120b (low) Base	128k	Open	18*	$0.20	317	1.02	8.90	6.31	Model Provider
Makora	gpt-oss-120b (low)	128k	Open	18*	$0.20	166	0.79	15.83	12.03	Model Provider
SambaNova	gpt-oss-120b (low)	131k	Open	18*	$0.26	707	1.14	4.67	2.83	Model Provider
Google	gpt-oss-120b (low) Vertex	131k	Open	18*	$0.12	409	0.40	6.51	4.89	Model Provider
Fireworks	gpt-oss-120b (low)	131k	Open	18*	$0.20	530	0.94	5.66	3.77	Model Provider
CoreWeave	gpt-oss-120b (low)	131k	Open	18*	$0.05	53	1.48	48.27	37.44	Model Provider
Cerebras	gpt-oss-120b (low)	131k	Open	18*	$0.39	1,798	0.61	2.00	1.11	Model Provider
Microsoft Azure	gpt-oss-120b (low)	131k	Open	18*	$0.20	351	0.83	7.95	5.69	Model Provider
Cloudflare	gpt-oss-120b (low)	128k	Open	18*	$0.39	172	0.91	15.45	11.62	Model Provider
Baseten	gpt-oss-120b (low)	128k	Open	18*	$0.14	275	0.36	9.46	7.28	Model Provider
Amazon Bedrock	gpt-oss-120b (low)	131k	Open	18*	$0.20	89	1.21	29.30	22.47	Model Provider
Parasail	gpt-oss-120b (low)	131k	Open	18*	$0.13	206	0.81	12.93	9.70	Model Provider
Databricks	gpt-oss-120b (low)	128k	Open	18*	$0.20	344	0.71	7.98	5.82	Model Provider
Together AI	gpt-oss-120b (low)	131k	Open	18*	$0.20	562	0.71	5.15	3.56	Model Provider
Groq	gpt-oss-120b (low)	131k	Open	18*	$0.20	476	0.75	6.01	4.20	Model Provider
Novita	gpt-oss-120b (low)	131k	Open	18*	$0.07	64	1.03	40.32	31.44	Model Provider
OpenAI	GPT-5.4 nano	400k	Proprietary	18*	$0.18	160	0.63	3.75	--	Model Provider
Mistral	Devstral Small 2	256k	Open	17	$0.00	53	1.18	10.68	--	Model Provider
Alibaba Cloud	Qwen3 Next 80B A3B	262k	Open	17	$1.05	173	2.31	16.73	11.54	Model Provider
Nebius	Qwen3 Next 80B A3B (FP8)	262k	Open	17	$0.26	101	1.03	25.71	19.74	Model Provider
Google	Qwen3 Next 80B A3B Vertex	262k	Open	17	$0.26	125	0.77	20.69	15.94	Model Provider
Microsoft Azure	GPT-5.4 mini	400k	Proprietary	17*	$1.13	158	1.04	4.22	--	Model Provider
OpenAI	GPT-5.4 mini	272k	Proprietary	17*	$0.65	150	0.79	4.12	--	Model Provider
DeepInfra	Qwen3.5 4B FP8	262k	Open	16*	$0.04	27	0.72	19.05	--	Model Provider
Amazon Bedrock	Mistral Large 3	256k	Open	16	$0.60	141	1.23	4.79	--	Model Provider
Microsoft Azure	Mistral Large 3	256k	Open	16	$0.60	65	1.56	9.22	--	Model Provider
Mistral	Mistral Large 3	262k	Open	16	$0.60	46	1.17	12.09	--	Model Provider
Nebius	Nemotron 3 Nano Omni 30B A3B Reasoning (FP8)	65.5k	Open	15*	$0.08	311	1.00	9.03	6.42	Model Provider
CoreWeave	gpt-oss-20b (high)	131k	Open	15	$0.04	107	0.95	24.33	18.70	Model Provider
DeepInfra	gpt-oss-20b (high)	131k	Open	15	$0.04	114	0.40	22.38	17.59	Model Provider
Together AI	gpt-oss-20b (high)	131k	Open	15	$0.07	434	0.36	6.12	4.61	Model Provider
Lightning AI	gpt-oss-20b (high)	128k	Open	15	$0.07	274	0.55	9.69	7.31	Model Provider
Cloudflare	gpt-oss-20b (high)	128k	Open	15	$0.21	168	0.74	15.62	11.90	Model Provider
Novita	gpt-oss-20b (high)	131k	Open	15	$0.05	124	1.01	21.20	16.15	Model Provider
Google	gpt-oss-20b (high) Vertex	131k	Open	15	$0.09	280	0.65	9.57	7.14	Model Provider
Amazon Bedrock	gpt-oss-20b (high)	131k	Open	15	$0.09	148	44.25	61.14	13.51	Model Provider
Databricks	gpt-oss-20b (high)	131k	Open	15	$0.09	289	0.82	9.48	6.93	Model Provider
Groq	gpt-oss-20b (high)	131k	Open	15	$0.10	960	0.79	3.39	2.08	Model Provider
Amazon Bedrock	Nova 2.0 Pro Preview	256k	Proprietary	14	$2.13	115	1.09	5.45	--	Model Provider
Together AI	gpt-oss-20b (low)	131k	Open	14*	$0.07	450	0.43	5.99	4.45	Model Provider
Lightning AI	gpt-oss-20b (low)	128k	Open	14*	$0.07	272	0.58	9.77	7.36	Model Provider
CoreWeave	gpt-oss-20b (low)	131k	Open	14*	$0.04	114	0.96	22.85	17.51	Model Provider
Cloudflare	gpt-oss-20b (low)	128k	Open	14*	$0.21	158	0.77	16.58	12.65	Model Provider
Amazon Bedrock	gpt-oss-20b (low)	131k	Open	14*	$0.09	77	12.32	44.86	26.04	Model Provider
Novita	gpt-oss-20b (low)	131k	Open	14*	$0.05	101	1.02	25.68	19.73	Model Provider
Databricks	gpt-oss-20b (low)	131k	Open	14*	$0.09	313	0.79	8.77	6.39	Model Provider
Groq	gpt-oss-20b (low)	131k	Open	14*	$0.10	951	0.80	3.42	2.10	Model Provider
Google	gpt-oss-20b (low) Vertex	131k	Open	14*	$0.09	289	0.37	9.03	6.93	Model Provider
Microsoft Azure	Llama 4 Maverick (FP8)	128k	Open	14	$0.46	121	1.16	5.28	--	Model Provider
Amazon Bedrock	Llama 4 Maverick	128k	Open	14	$0.31	228	0.86	3.05	--	Model Provider
Snowflake	Llama 4 Maverick	131k	Open	14	$0.50	123	1.08	5.16	--	Model Provider
DeepInfra	Llama 4 Maverick (FP8)	1.05M	Open	14	$0.20	33	0.68	16.00	--	Model Provider
Databricks	Llama 4 Maverick	131k	Open	14	$0.60	86	0.92	6.77	--	Model Provider
Novita	Llama 4 Maverick (FP8)	1.05M	Open	14	$0.33	34	1.03	15.85	--	Model Provider
Parasail	Llama 4 Maverick (FP8)	1.05M	Open	14	$0.27	128	1.01	4.91	--	Model Provider
Nebius	NVIDIA Nemotron 3 Nano	262k	Open	14	$0.08	132	1.05	20.04	15.19	Model Provider
Novita	NVIDIA Nemotron 3 Nano (FP4)	262k	Open	14	$0.07	245	1.02	11.24	8.18	Model Provider
DeepInfra	NVIDIA Nemotron 3 Nano	262k	Open	14	$0.07	84	6.98	36.70	23.78	Model Provider
Novita	Ling 2.6 Flash	262k	Open	14	$0.06	172	1.17	4.09	--	Model Provider
GMI	Qwen3 Next 80B A3B	262k	Open	14*	$0.29	177	2.53	5.35	--	Model Provider
DeepInfra	Qwen3 Next 80B A3B	262k	Open	14*	$0.19	97	0.56	5.69	--	Model Provider
Parasail	Qwen3 Next 80B A3B	262k	Open	14*	$0.21	115	0.90	5.25	--	Model Provider
Novita	Qwen3 Next 80B A3B	131k	Open	14*	$0.29	184	1.71	4.43	--	Model Provider
Alibaba Cloud	Qwen3 Next 80B A3B	131k	Open	14*	$0.65	185	2.36	5.07	--	Model Provider
Google	Qwen3 Next 80B A3B Vertex	262k	Open	14*	$0.26	173	0.62	3.51	--	Model Provider
SiliconFlow	Gemma 4 12B (Non-reasoning)	262k	Open	13*	$0.12	36	2.75	16.82	--	Model Provider
Amazon Bedrock	Nova Premier	1M	Proprietary	13*	$2.18	34	2.89	17.54	--	Model Provider
DeepInfra	Llama Nemotron Super 49B v1.5	131k	Open	12*	$0.40	49	1.23	51.77	40.43	Model Provider
Mistral	Mistral Small 4	262k	Open	12*	$0.20	148	0.74	4.11	--	Model Provider
Sarvam	Sarvam 105B (high)	128k	Open	12*	$0.04	132	2.05	20.96	15.13	Model Provider
Amazon Bedrock	Nova 2.0 Lite	1M	Proprietary	12*	$0.52	158	1.18	4.35	--	Model Provider
Amazon Bedrock	Magistral Small 1.2	128k	Open	11	$0.60	107	1.46	24.73	18.61	Model Provider
Mistral	Magistral Small 1.2	131k	Open	11	$0.60	80	0.94	32.11	24.93	Model Provider
Mistral	Ministral 3 14B	262k	Open	11	$0.20	79	0.86	7.23	--	Model Provider
Amazon Bedrock	Ministral 3 14B	256k	Open	11	$0.20	206	1.08	3.51	--	Model Provider
DeepInfra	Llama 4 Scout	328k	Open	10	$0.12	58	0.58	9.20	--	Model Provider
CompactifAI	Llama 4 Scout	131k	Open	10	$0.10	94	1.34	6.65	--	Model Provider
Microsoft Azure	Llama 4 Scout	128k	Open	10	$0.26	128	0.89	4.80	--	Model Provider
Cloudflare	Llama 4 Scout	131k	Open	10	$0.33	40	0.76	13.15	--	Model Provider
Amazon Bedrock	Llama 4 Scout	128k	Open	10	$0.22	185	0.95	3.65	--	Model Provider
Novita	Llama 4 Scout	131k	Open	10	$0.22	53	0.87	10.37	--	Model Provider
Google	Llama 4 Scout Vertex	1.31M	Open	10	$0.30	146	0.76	4.18	--	Model Provider
Groq	Llama 4 Scout	131k	Open	10	$0.13	447	0.85	1.97	--	Model Provider
Nebius	Hermes 4 70B (FP8)	128k	Open	10*	$0.16	92	1.35	28.63	21.83	Model Provider
Alibaba Cloud	Qwen3 Omni 30B A3B	65.5k	Open	10*	$0.32	97	1.99	27.67	20.54	Model Provider
Groq	Llama 3.3 70B	131k	Open	9	$0.61	304	0.99	2.63	--	Model Provider
Parasail	Llama 3.3 70B (FP8)	131k	Open	9	$0.17	76	2.41	9.00	--	Model Provider
SambaNova	Llama 3.3 70B	128k	Open	9	$0.66	282	1.88	3.65	--	Model Provider
Nebius	Llama 3.3 70B Base	128k	Open	9	$0.16	20	2.40	27.02	--	Model Provider
Makora	Llama 3.3 70B FP8	128k	Open	9	$0.20	297	1.48	3.16	--	Model Provider
CoreWeave	Llama 3.3 70B	128k	Open	9	$0.71	81	1.00	7.17	--	Model Provider
CompactifAI	Llama 3.3 70B	128k	Open	9	$0.17	135	1.35	5.05	--	Model Provider
Together AI	Llama 3.3 70B Turbo	131k	Open	9	$0.88	85	1.62	7.51	--	Model Provider
Microsoft Azure	Llama 3.3 70B	128k	Open	9	$0.71	100	2.36	7.36	--	Model Provider
DeepInfra	Llama 3.3 70B (Turbo, FP8)	131k	Open	9	$0.12	18	1.94	29.77	--	Model Provider
Cloudflare	Llama 3.3 70B	24k	Open	9	$0.49	42	4.14	15.95	--	Model Provider
Amazon Bedrock	Llama 3.3 70B	128k	Open	9	$0.71	130	1.24	5.09	--	Model Provider
Google	Llama 3.3 70B Vertex	128k	Open	9	$0.72	164	0.66	3.71	--	Model Provider
Databricks	Llama 3.3 70B	128k	Open	9	$0.60	68	1.22	8.56	--	Model Provider
Scaleway	Llama 3.3 70B	100k	Open	9	$1.05	86	1.40	7.24	--	Model Provider
Nebius	Llama Nemotron Ultra Base	131k	Open	9*	$0.72	51	2.39	51.20	39.04	Model Provider
Nebius	Hermes 4 405B (FP8)	128k	Open	9*	$1.20	42	2.38	61.41	47.22	Model Provider
DeepInfra	NVIDIA Nemotron Nano 12B v2 VL (FP8)	131k	Open	9*	$0.24	281	0.44	9.34	7.12	Model Provider
Amazon Bedrock	Ministral 3 8B	256k	Open	9	$0.15	206	1.04	3.48	--	Model Provider
Mistral	Ministral 3 8B	262k	Open	9	$0.15	79	0.85	7.16	--	Model Provider
DeepInfra	NVIDIA Nemotron Nano 9B V2	131k	Open	9*	$0.05	86	6.46	35.57	23.29	Model Provider
Nebius	Hermes 4 405B (FP8)	128k	Open	9*	$1.20	40	2.37	14.98	--	Model Provider
DeepInfra	Llama Nemotron Super 49B v1.5	131k	Open	9*	$0.40	51	1.22	11.03	--	Model Provider
Amazon Bedrock	Llama 3.1 405B Latency Optimized	128k	Open	9*	$3.00	75	2.43	9.11	--	Model Provider
Liquid AI	LFM2.5-8B-A1B	32.8k	Open	8*	$0.00	338	8.24	15.64	5.92	Model Provider
Microsoft Azure	Command A	256k	Open	8*	$3.25	41	3.24	15.39	--	Model Provider
Cohere	Command A	288k	Open	8*	$3.25	57	1.64	10.45	--	Model Provider
DeepInfra	Llama 3.1 Nemotron 70B	131k	Open	8*	$1.20	305	5.06	6.70	--	Model Provider
Novita	NVIDIA Nemotron 3 Nano (FP4)	262k	Open	7*	$0.07	218	1.05	3.34	--	Model Provider
DeepInfra	NVIDIA Nemotron 3 Nano	262k	Open	7*	$0.07	82	0.42	6.55	--	Model Provider
DeepInfra	NVIDIA Nemotron Nano 9B V2	131k	Open	7*	$0.05	82	7.00	13.11	--	Model Provider
Amazon Bedrock	NVIDIA Nemotron Nano 9B V2	131k	Open	7*	$0.08	166	1.20	4.23	--	Model Provider
Nebius	Hermes 4 70B (FP8)	128k	Open	7*	$0.16	97	1.35	6.52	--	Model Provider
Mistral	Ministral 3 3B	131k	Open	7	$0.10	163	0.62	3.68	--	Model Provider
Amazon Bedrock	Ministral 3 3B	256k	Open	7	$10.00	536	0.95	1.88	--	Model Provider
CoreWeave	Granite 4.1 8B	131k	Open	7*	$0.06	121	0.80	4.93	--	Model Provider
Sarvam	Sarvam 30B (high)	64k	Open	7*	$0.03	162	1.87	17.28	12.32	Model Provider
Amazon Bedrock	Llama 3.2 90B (Vision)	128k	Open	6*	$0.72	59	1.18	9.64	--	Model Provider
CoreWeave	Phi-4 Mini	128k	Open	6	$0.11	233	0.94	3.08	--	Model Provider
Microsoft Azure	Phi-4 Mini	128k	Open	6	$0.00	46	0.82	11.76	--	Model Provider
AI21 Labs	Jamba 1.7 Large	256k	Open	5*	$2.60	58	1.43	10.11	--	Model Provider
Replicate	Granite 4.0 H Small	128k	Open	5*	$0.08	368	10.59	11.95	--	Model Provider
Alibaba Cloud	Qwen3 Omni 30B A3B	65.5k	Open	5*	$0.32	94	2.04	7.38	--	Model Provider
Microsoft Azure	Phi-4	16k	Open	5*	$0.16	25	2.19	21.82	--	Model Provider
DeepInfra	Phi-4	16.4k	Open	5*	$0.08	80	0.71	6.95	--	Model Provider
Amazon Bedrock	Nova Micro	130k	Proprietary	5*	$0.03	290	0.96	2.69	--	Model Provider
Amazon Bedrock	NVIDIA Nemotron Nano 12B v2 VL	128k	Open	5*	$0.24	206	1.18	3.62	--	Model Provider
DeepInfra	NVIDIA Nemotron Nano 12B v2 VL (FP8)	131k	Open	5*	$0.24	300	0.46	2.12	--	Model Provider
Microsoft Azure	Phi-4 Multimodal	128k	Open	5*	$0.00	17	0.83	29.66	--	Model Provider
DeepInfra	Llama 3.2 11B (Vision)	131k	Open	3*	$0.35	55	0.51	9.54	--	Model Provider
Amazon Bedrock	Llama 3.2 11B (Vision)	128k	Open	3*	$0.16	51	0.82	10.63	--	Model Provider
Liquid AI	LFM2.5-VL-1.6B	32.8k	Open	1*	$0.00	440	7.60	8.73	--	Model Provider
Anthropic	Claude Sonnet 5 (low)	1M	Proprietary	--	$1.54	57	1.41	10.13	--	Model Provider
Anthropic	Claude Sonnet 5 (xhigh)	1M	Proprietary	--	$1.54	69	29.45	36.75	--	Model Provider
Anthropic	Claude Sonnet 5 (high)	1M	Proprietary	--	$1.54	66	10.44	18.02	--	Model Provider
Together AI	Cogito v2.1	164k	Open	--	$1.25	91	0.85	28.24	21.91	Model Provider
Anthropic	Claude Sonnet 5 (medium)	1M	Proprietary	--	$1.54	60	2.36	10.76	--	Model Provider

Key definitions

Maximum number of combined input & output tokens. Output tokens commonly have a significantly lower limit (varied by model).

Tokens per second received while the model is generating tokens (ie. after first chunk has been received from the API for models which support streaming).

Time to first token received, in seconds, after API request sent. For reasoning models which share reasoning tokens, this will be the first reasoning token. For models which do not support streaming, this represents time to receive the completion.

Price per token, shown in USD per million tokens. Price is a blend of cache hit, input, and output token prices using the selected ratio (default 7:2:1 cache-input-output).

Price per token generated by the model (received from the API), represented as USD per million Tokens.

Price per token included in the request/message sent to the API, represented as USD per million Tokens.

Metrics are 'live' and are based on the past 72 hours of measurements, measurements are taken 8 times a day for single requests and 2 times per day for parallel requests.

LLM API Providers Leaderboard - Comparison of over 500 AI Model endpoints

Key definitions

Context Window

Output Speed

Latency (Time to First Token)

Price

Output Price

Input Price

Time Period