User profile

mlx-mike

13 runsFirst seen 2026-04-13Avg 70.9

Best PipelineScore

77.8MAINLINE

on WizardLM 2 8x22B

Best run beats 76% of all 428 submissionsBest rig h200-141gb ranks #8 of 63 rigs

Total tokens70.9KAcross every task this user has run

Avg latency1029msPer task, across all submissions

Tasks run32513 submissions x ~34 tasks

Rigs used11Distinct hardware tags

Category signature

Average score per category across all 13 runs.

Code

71.2

Reason

71.1

Tool Use

71.6

RAG

70.9

Speed

69.2

Hardware mix

Rigs this user benchmarked on.

m3-pro-36gb2 (15%)

rtx-4070-12gb2 (15%)

h200-141gb1 (8%)

b200-192gb1 (8%)

m3-max-128gb1 (8%)

rtx-3060-12gb1 (8%)

a100-40gb1 (8%)

m3-max-64gb1 (8%)

ryzen-7950x-rtx-30901 (8%)

rtx-4090-24gb1 (8%)

ryzen-7950x-cpu-only1 (8%)

Provider mix

Where they spend their tokens.

alibaba3 (23%)

microsoft2 (15%)

mistral2 (15%)

yi2 (15%)

nous1 (8%)

google1 (8%)

upstage1 (8%)

meta1 (8%)

Models tried

Best score per model. Click a model to see its full page.

#	Model	Provider	Best Score	Tier	Achieved
1	WizardLM 2 8x22B	microsoft	77.8	MAINLINE	2026-05-15
2	Mixtral 8x22B Instruct	mistral	77.4	MAINLINE	2026-04-17
3	Codestral 22B	mistral	76.9	MAINLINE	2026-05-14
4	Qwen 3 14B Instruct	alibaba	74.8	FEEDER	2026-04-19
5	Yi 1.5 34B Chat	yi	72.7	FEEDER	2026-04-26
6	Hermes 3 Llama 3.1 8B	nous	69.7	FEEDER	2026-04-13
7	Qwen 3 8B Instruct	alibaba	69.5	FEEDER	2026-04-21
8	Gemma 2 27B IT	google	69.0	FEEDER	2026-04-28
9	SOLAR 10.7B Instruct	upstage	66.7	FEEDER	2026-05-01
10	Qwen 2.5 7B Instruct	alibaba	66.3	FEEDER	2026-05-08
11	Code Llama 34B Instruct	meta	64.6	FEEDER	2026-05-11
12	Phi 3 Small 7B	microsoft	63.9	FEEDER	2026-05-16

All submissions

Every run, ordered by score.

#	Model	Hardware	Score	Tier	Code	Reason	Tool Use	RAG	Speed	Tokens	Avg ms	Date
1	WizardLM 2 8x22B	h200-141gb	77.8	MAINLINE	79.3	75.6	76.0	79.4	80.7	5.5K	880	2026-05-15
2	Mixtral 8x22B Instruct	b200-192gb	77.4	MAINLINE	75.5	83.5	74.5	73.5	76.4	5.9K	912	2026-04-17
3	Codestral 22B	m3-max-128gb	76.9	MAINLINE	77.0	75.0	79.5	80.5	70.8	5.6K	1505	2026-05-14
4	Qwen 3 14B Instruct	rtx-3060-12gb	74.8	FEEDER	73.6	80.1	76.8	72.7	71.9	5.5K	834	2026-04-19
5	Yi 1.5 34B Chat	a100-40gb	72.7	FEEDER	78.3	73.7	71.1	67.6	71.9	5.2K	624	2026-04-26
6	Yi 1.5 34B Chat	m3-max-64gb	72.2	FEEDER	75.5	75.0	73.2	72.9	65.3	5.6K	1520	2026-05-21
7	Hermes 3 Llama 3.1 8B	m3-pro-36gb	69.7	FEEDER	67.3	69.5	75.0	67.8	68.3	5.6K	786	2026-04-13
8	Qwen 3 8B Instruct	rtx-4070-12gb	69.5	FEEDER	68.4	70.1	69.3	64.8	72.4	5.8K	745	2026-04-21
9	Gemma 2 27B IT	ryzen-7950x-rtx-3090	69.0	FEEDER	65.9	74.8	68.8	68.2	68.3	5.2K	1486	2026-04-28
10	SOLAR 10.7B Instruct	rtx-4070-12gb	66.7	FEEDER	72.8	61.8	68.4	68.3	62.5	5.7K	840	2026-05-01
11	Qwen 2.5 7B Instruct	m3-pro-36gb	66.3	FEEDER	65.2	63.9	66.0	69.5	67.3	5.7K	860	2026-05-08
12	Code Llama 34B Instruct	rtx-4090-24gb	64.6	FEEDER	66.7	62.7	71.5	68.4	54.6	4.9K	1528	2026-05-11
13	Phi 3 Small 7B	ryzen-7950x-cpu-only	63.9	FEEDER	60.6	59.1	60.9	68.3	68.8	4.7K	856	2026-05-16