Open Medical-LLM Leaderboard

🩺 The Open Medical LLM Leaderboard aims to track, rank and evaluate the performance of large language models (LLMs) on medical question answering tasks. It evaluates LLMs across a diverse array of medical datasets, including MedQA (USMLE), PubMedQA, MedMCQA, and subsets of MMLU related to medicine and biology. The leaderboard offers a comprehensive assessment of each model's medical knowledge and question answering capabilities.

The datasets cover various aspects of medicine such as general medical knowledge, clinical knowledge, anatomy, genetics, and more. They contain multiple-choice and open-ended questions that require medical reasoning and understanding. More details on the datasets can be found in the "LLM Benchmarks Details" section below.

The main evaluation metric used is Accuracy (ACC). Submit a model for automated evaluation on the "Submit" page. If you have comments or suggestions on additional medical datasets to include, please reach out to us in our discussion forum.

Evaluation Purpose: The primary role of this leaderboard is to assess and compare the performance of the models. It does not facilitate the distribution, deployment, or clinical use of these models. The models on this leaderboard are not approved for clinical use and are intended for research purposes only. Please refer to the "Advisory Notice" section in the "About" page.

The backend of the Open Medical LLM Leaderboard uses the Eleuther AI Language Model Evaluation Harness. More technical details can be found in the "About" page.

The GPT-4, and Med-PaLM-2 results are taken from their official papers. Since Med-PaLM doesn't provide zero-shot accuracy, we are using 5-shot accuracy from their paper for comparison. All results presented are in the zero-shot setting, except for Med-PaLM-2 which use 5-shot accuracy. Gemini results are taken from recent Clinical-NLP (NAACL 24) Paper

Model Availability Requirement: To maintain the integrity of the leaderboard, only models that are actively accessible will be included. Submissions must be available either via an API or a public Hugging Face repository to allow validation of the reported results. If a model's repository is empty or its API is inaccessible, the submission will be removed from the leaderboard, as the primary goal is to ensure that models listed here remain accessible for evaluation and comparison.


🔶	invalid-coder/Sakura-SOLAR-Instruct-CarbonVillain-en-10.7B-v2-slerp	90.01	75.19	81.07	91.85	95.85	98.61	85.75	93.2	98.53	78.97	invalid-coder/Sakura-SOLAR-Instruct-CarbonVillain-en-10.7B-v2-slerp


🔶	ProbeMedicalYonseiMAILab/medllama3-v20	90.01	75.4	81.07	91.85	95.85	98.61	94.8	98	98.9	75.6	ProbeMedicalYonseiMAILab/medllama3-v20
🔶	ProbeMedicalYonseiMAILab/medllama3-v20	89.94	75.19	81.38	91.85	95.47	98.61	94.8	98	98.53	75.6	ProbeMedicalYonseiMAILab/medllama3-v20
🔶	aaditya/OpenBioLLMLlama-70B	86.06	74.01	78.16	83.9	92.93	93.83	85.75	93.2	93.75	78.97	aaditya/OpenBioLLMLlama-70B
🟢	Med-PaLM 2 (5 Shots)	84.09	71.3	79.7	77.8	88.3	94.4	80.9	90	95.2	79.2	Med-PaLM 2 (5 Shots)
🟢	GPT-4	82.97	69.5	78.8	80	86.4	95.1	76.9	91	93.8	75.2	GPT-4
🔶	skumar9/Llama-medx_v3.2	75.42	60.53	61.04	77.04	82.26	86.81	72.83	84	81.25	73	skumar9/Llama-medx_v3.2
🟢	Flan-PaLM	74.7	57.6	67.6	63.7	80.4	88.9	76.3	75	83.8	79	Flan-PaLM
🔶	Jayant9928/orpo_med_v3	73.94	61.3	61.19	71.85	78.11	83.33	71.68	84	79.78	74.2	Jayant9928/orpo_med_v3
🔶	skumar9/Llama-medx_v3.1	73.94	61.3	61.19	71.85	78.11	83.33	71.68	84	79.78	74.2	skumar9/Llama-medx_v3.1
🔶	johnsnowlabs/JSL-MedLlama-3-8B-v2.0	73.85	61.3	62.06	71.85	78.11	82.64	71.1	84	79.41	74.2	johnsnowlabs/JSL-MedLlama-3-8B-v2.0
🔶	skumar9/Llama-medx_v3	73.83	61.2	61.27	71.85	78.11	83.33	71.1	84	79.41	74.2	skumar9/Llama-medx_v3
🔶	Jayant9928/orpo_med_v2	73.65	61.18	61.59	71.11	76.98	83.33	72.25	83	79.41	74	Jayant9928/orpo_med_v2
🔶	abhinand/Llama-3-OpenBioMed-8B-slerp-v0.3	73.56	61.58	61.27	71.11	77.74	84.03	71.1	82	79.04	74.2	abhinand/Llama-3-OpenBioMed-8B-slerp-v0.3
⭕	lighteternal/Llama3-merge-biomed-8b	73.55	62.44	62.61	72.59	77.74	82.64	68.79	84	77.94	73.2	lighteternal/Llama3-merge-biomed-8b
🔶	abhinand/Llama-3-Galen-8B-32k-v1	72.99	59.84	60.72	69.63	77.74	83.33	71.1	83	78.31	73.2	abhinand/Llama-3-Galen-8B-32k-v1
🟢	ChenWeiLi/Med-ChimeraLlama-3-8B_SHERP	72.71	60.82	62.77	69.63	76.6	79.86	69.36	83	77.57	74.8	ChenWeiLi/Med-ChimeraLlama-3-8B_SHERP
🔶	aaditya/OpenBioLLM-Llama3-8B	72.5	56.91	58.99	69.83	76.1	84.21	68.04	86.1	78.21	74.12	aaditya/OpenBioLLM-Llama3-8B
🔶	Jayant9928/orpo_med_v0	72.43	55.34	67.87	69.63	75.85	78.47	67.05	85	78.68	74	Jayant9928/orpo_med_v0
🔶	johnsnowlabs/JSL-MedLlama-3-8B-v1.0	72.4	55.7	67.95	69.63	75.09	79.86	65.9	85	78.68	73.8	johnsnowlabs/JSL-MedLlama-3-8B-v1.0
⭕	shanchen/llama3-8B-slerp-med-chinese	72.34	55.7	67.79	69.63	74.72	79.86	65.9	85	78.68	73.8	shanchen/llama3-8B-slerp-med-chinese
🔶	Jayant9928/orpo_v2	72.29	55.56	67.56	71.11	75.09	77.08	67.63	85	77.57	74	Jayant9928/orpo_v2
🟢	winninghealth/WiNGPT2-Llama-3-8B-Base	72.1	55.65	67.87	69.63	75.09	78.47	65.9	84	78.68	73.6	winninghealth/WiNGPT2-Llama-3-8B-Base
⭕	shanchen/llama3-8B-slerp-med-chinese	71.9	55.68	68.11	68.89	74.34	79.86	64.16	84	78.68	73.4	shanchen/llama3-8B-slerp-med-chinese
🟢	winninghealth/WiNGPT2-Llama-3-8B-Base	71.89	55.65	68.11	68.89	74.34	79.86	64.16	83	79.41	73.6	winninghealth/WiNGPT2-Llama-3-8B-Base
🟦	aaditya/Llama3-OpenBioLLM-8B	71.73	57.76	57.82	68.15	76.6	83.33	67.63	84	78.31	72	aaditya/Llama3-OpenBioLLM-8B
⭕	ChenWeiLi/Med-ChimeraLlama-3_1k_5_epoch	71.59	60.77	62.29	65.93	76.6	79.17	68.79	82	75	73.8	ChenWeiLi/Med-ChimeraLlama-3_1k_5_epoch
🔶	probemedicalandyonseimailab/medllama3-v5	71.49	57.76	61.74	71.85	76.23	77.08	68.79	82	73.53	74.4	probemedicalandyonseimailab/medllama3-v5
🔶	adinath/ollama_v9	71.46	57.09	57.27	66.67	76.98	83.33	69.36	82	79.04	71.4	adinath/ollama_v9
🔶	timberrific/open-bio-med-merge	71.33	56.75	62.92	65.93	76.23	80.56	67.05	81	75.37	76.2	timberrific/open-bio-med-merge
🔶	probemedicalandyonseimailab/medllama3-v5.1	71.19	57.4	60.33	69.63	75.47	78.47	67.05	80	73.53	78.8	probemedicalandyonseimailab/medllama3-v5.1
🟢	ChenWeiLi/MedLlama-3-8B_DARE_v1.0	71.06	57.3	59.39	71.11	75.47	79.17	66.47	82	74.63	74	ChenWeiLi/MedLlama-3-8B_DARE_v1.0
🔶	probemedicalandyonseimailab/medllama3-v6	71.06	57.21	61.51	69.63	75.09	77.78	67.63	80	73.9	76.8	probemedicalandyonseimailab/medllama3-v6
🟦	mlabonne/Daredevil-8B-abliterated-dpomix	70.99	58.09	60.88	65.19	73.58	78.47	67.05	84	74.26	77.4	mlabonne/Daredevil-8B-abliterated-dpomix
🔶	mlabonne/Daredevil-8B-abliterated	70.86	58.36	61.27	65.19	72.83	79.17	65.32	84	74.63	77	mlabonne/Daredevil-8B-abliterated
⭕	ChenWeiLi/Med-ChimeraLlama-3_10k	70.8	61.15	62.14	65.93	77.36	76.39	65.9	81	75.37	72	ChenWeiLi/Med-ChimeraLlama-3_10k
🟢	Gemini-1.0	70.79	54.3	58	66.7	76.7	88	69.2	75.8	77.7	70.7	Gemini-1.0
🔶	shanchen/llama3-8B-slerp-biomed-chat-chinese	70.78	56.39	63.55	65.93	75.09	77.08	68.79	80	75	75.2	shanchen/llama3-8B-slerp-biomed-chat-chinese
⭕	ChenWeiLi/Med-ChimeraLlama-3_1k_10_epoch	70.74	60.75	62.06	65.93	75.85	77.08	67.63	79	75.74	72.6	ChenWeiLi/Med-ChimeraLlama-3_1k_10_epoch
🔶	shanchen/llama3-8B-slerp-med-chinese2	70.71	56.42	63.79	65.19	75.47	77.08	68.79	80	74.63	75	shanchen/llama3-8B-slerp-med-chinese2
🔶	winninghealth/WiNGPT2-Llama-3-8B-Chat	70.57	53.96	66.54	66.67	75.47	77.78	63.58	81	77.57	72.6	winninghealth/WiNGPT2-Llama-3-8B-Chat
🔶	HPAI-BSC/Llama3-Aloe-8B-Alpha	70.46	58.76	62.45	68.15	74.72	77.08	64.16	79	72.79	77	HPAI-BSC/Llama3-Aloe-8B-Alpha
🔶	probemedicalandyonseimailab/medllama3-v4	70.44	57.47	61.9	69.63	75.85	77.08	66.47	81	73.53	71	probemedicalandyonseimailab/medllama3-v4
🔶	Kukedlc/NeuralLLaMa-3-8b-DT-v0.1	70.43	57.73	61.67	62.22	72.45	79.17	66.47	83	73.53	77.6	Kukedlc/NeuralLLaMa-3-8b-DT-v0.1
🟦	Kukedlc/NeuralLLaMa-3-8b-ORPO-v0.3	70.4	58.52	61.19	62.22	73.21	79.86	65.32	82	74.26	77	Kukedlc/NeuralLLaMa-3-8b-ORPO-v0.3
🔶	abhinand/Llama-3-OpenBioMed-8B-dare-ties-v1.0	70.28	55.41	59.94	66.67	69.81	81.25	68.79	82	73.9	74.8	abhinand/Llama-3-OpenBioMed-8B-dare-ties-v1.0
⭕	ChenWeiLi/Med-ChimeraLlama-3_1k_20_epoch	70.24	60.44	62.06	65.93	76.23	76.39	63.01	78	76.1	74	ChenWeiLi/Med-ChimeraLlama-3_1k_20_epoch
🔶	adinath/ollama_v6	70.23	56.97	60.41	70.37	75.09	80.56	61.85	81	70.59	75.2	adinath/ollama_v6
🔶	HPAI-BSC/Llama3-Aloe-8B-Alpha	70.14	58.81	62.37	68.15	73.21	77.08	63.58	79	72.06	77	HPAI-BSC/Llama3-Aloe-8B-Alpha
🔶	uygarkurt/llama-3-merged-linear	70.13	56.97	60.8	60.74	72.08	81.25	65.32	83	72.79	78.2	uygarkurt/llama-3-merged-linear
🔶	DeepMount00/Llama-3-8b-Ita	70.11	57.04	60.72	62.22	72.08	80.56	64.16	83	72.79	78.4	DeepMount00/Llama-3-8b-Ita
🔶	ProbeMedicalYonseiMAILab/medllama3-v16	70.1	58.45	60.25	70.37	74.72	75	63.58	79	73.53	76	ProbeMedicalYonseiMAILab/medllama3-v16
🟢	mlabonne/ChimeraLlama-3-8B-v3	70.05	57.35	61.27	65.19	71.32	77.08	64.16	83	74.63	76.4	mlabonne/ChimeraLlama-3-8B-v3
🔶	johnsnowlabs/JSL-Med-Sft-Llama-3-8B	70.02	57.73	59.78	69.63	74.72	78.47	61.85	83	70.22	74.8	johnsnowlabs/JSL-Med-Sft-Llama-3-8B
🟦	Danielbrdz/Barcenas-Llama3-8b-ORPO	69.93	56.68	60.88	60.74	71.7	81.25	63.58	83	73.9	77.6	Danielbrdz/Barcenas-Llama3-8b-ORPO
🔶	skumar9/Llama-medx_v0	69.91	57.61	59.47	69.63	74.34	78.47	61.85	83	70.22	74.6	skumar9/Llama-medx_v0
🟢	meta-llama/Meta-Llama-3-8B	69.9	57.47	59.7	68.89	74.72	78.47	61.85	83	70.22	74.8	meta-llama/Meta-Llama-3-8B
🔶	shanchen/llama3-slerp-med	69.88	55.37	61.27	68.15	70.57	77.78	64.16	82	76.84	72.8	shanchen/llama3-slerp-med
🔶	adinath/ollama-3-8B	69.83	57.16	59.94	69.63	73.58	78.47	62.43	82	70.22	75	adinath/ollama-3-8B
🟢	meta-llama/Meta-Llama-3-8B	69.81	57.69	60.02	68.89	74.72	78.47	60.12	83	70.22	75.2	meta-llama/Meta-Llama-3-8B
🟦	VAGOsolutions/Llama-3-SauerkrautLM-8b-Instruct	69.76	56.73	60.57	60.74	72.08	79.17	64.74	83	72.43	78.4	VAGOsolutions/Llama-3-SauerkrautLM-8b-Instruct
🔶	adinath/ollama_v5	69.75	57.61	59.78	68.89	74.72	78.47	61.27	82	70.22	74.8	adinath/ollama_v5
🔶	probemedicalandyonseimailab/medllama3-v10	69.72	55.08	60.09	68.15	72.45	76.39	67.05	81	71.69	75.6	probemedicalandyonseimailab/medllama3-v10
⭕	jondurbin/bagel-8b-v1.0	69.66	57.04	58.92	68.89	75.09	78.47	64.16	80	70.59	73.8	jondurbin/bagel-8b-v1.0
🟦	mlabonne/Llama-3-8B-Instruct-abliterated-dpomix	69.65	56.3	60.64	61.48	71.7	75	65.9	85	74.63	76.2	mlabonne/Llama-3-8B-Instruct-abliterated-dpomix
🔶	IBI-CAAI/MELT-llama-2-7b-chat-v0.1	69.46	43.65	48.08	65.19	75.85	76.39	75.72	78	87.5	74.8	IBI-CAAI/MELT-llama-2-7b-chat-v0.1
🔶	lightblue/suzume-llama-3-8B-multilingual	69.3	56.61	60.09	65.93	72.45	79.17	65.9	81	70.96	71.6	lightblue/suzume-llama-3-8B-multilingual
🔶	johnsnowlabs/JSL-MedMNX-7B-v2.0	69.3	56.3	59.23	65.19	74.72	75.69	65.32	75	74.63	77.6	johnsnowlabs/JSL-MedMNX-7B-v2.0
🔶	adinath/lft_8b	69.3	56.49	59.15	60.74	75.09	75.69	66.47	83	70.22	76.8	adinath/lft_8b
🟦	qnguyen3/Master-Yi-9B	69.07	52.88	56.17	67.41	72.83	80.56	65.9	78	71.69	76.2	qnguyen3/Master-Yi-9B
🔶	ruslanmv/ai-medical-model-32bit	69	56.8	60.49	62.96	71.32	73.61	65.32	83	73.53	74	ruslanmv/ai-medical-model-32bit
⭕	meta-llama/Meta-Llama-3-8B-Instruct	68.99	56.85	60.72	62.22	70.94	73.61	65.32	82	74.63	74.6	meta-llama/Meta-Llama-3-8B-Instruct
🟦	abhishekchohan/Yi-9B-Forest-DPO-v1.0	68.93	49.89	53.34	62.96	75.09	80.56	71.68	79	72.06	75.8	abhishekchohan/Yi-9B-Forest-DPO-v1.0
🔶	probemedicalandyonseimailab/medllama3-v11	68.93	55.15	58.05	64.44	74.34	75.69	66.47	80	70.59	75.6	probemedicalandyonseimailab/medllama3-v11
🔶	adinath/ollama_v7	68.9	56.47	60.41	65.93	73.58	79.17	61.27	79	69.85	74.4	adinath/ollama_v7
🟢	01-ai/Yi-1.5-9B	68.89	53.26	55.38	68.89	71.7	78.47	67.63	81	72.06	71.6	01-ai/Yi-1.5-9B
🔶	failspy/Meta-Llama-3-8B-Instruct-abliterated-v3	68.84	56.63	61.04	60	72.45	74.31	65.9	84	72.43	72.8	failspy/Meta-Llama-3-8B-Instruct-abliterated-v3
🔶	Jayant9928/tnayajv2.0	68.62	57.42	60.49	62.96	71.32	74.31	61.85	82	72.79	74.4	Jayant9928/tnayajv2.0
🔶	skumar9/Llama-medx_v2	68.51	57.16	59.94	61.48	72.45	73.61	61.27	82	73.9	74.8	skumar9/Llama-medx_v2
⭕	cognitivecomputations/Llama-3-8B-Instruct-abliterated-v2	68.06	56.32	60.96	64.44	71.32	79.17	60.69	80	70.59	69	cognitivecomputations/Llama-3-8B-Instruct-abliterated-v2


🔶	invalid-coder/Sakura-SOLAR-Instruct-CarbonVillain-en-10.7B-v2-slerp	90.01	75.19	81.07	91.85	95.85	98.61	85.75	93.2	98.53	78.97	instruction-tuned	MT5ForConditionalGeneration	bfloat16	cc-by-nc-nd-4.0	10.732	2838	false	351336647a1c4855f5abfb267a3b228542464da5	invalid-coder/Sakura-SOLAR-Instruct-CarbonVillain-en-10.7B-v2-slerp

Why Leaderboard?

Evaluating the medical knowledge and clinical reasoning capabilities of LLMs is crucial as they are increasingly being applied to healthcare and biomedical applications. The Open Medical LLM Leaderboard provides a platform to assess the latest LLMs on their performance on a variety of medical question answering tasks. This can help identify the strengths and gaps in medical understanding of current models.

How it works

📈 We evaluate the models on 9 medical Q&A datasets using the Eleuther AI Language Model Evaluation Harness , a unified framework to test language models on different tasks.

Advisory Notice

The Open Medical-LLM Leaderboard showcases medical models intended solely for research and development purposes. It is important to be aware of the following:

Evaluation Purpose: The primary role of this leaderboard is to assess and compare the performance of the models. It does not facilitate the distribution, deployment, or clinical use of these models.

Regulatory Status: The models listed on this leaderboard have not been approved or registered by any regulatory authorities, including the US FDA, the European Medicines Agency (EMA), Health Canada, or the Therapeutic Goods Administration (TGA) in Australia. They are not listed in the US FDA Database for approved AI in healthcare or the EUDAMED database.

Disclaimer: These models are not intended for direct patient care, clinical decision support, or any other professional medical purposes. Their use should be limited to research, development, and exploratory applications by qualified individuals who understand their limitations and the regulatory requirements.

Risk Warning: The outputs of these models may contain inaccuracies, biases, or misalignments that could pose risks if relied upon for medical decision-making. The models' performance has not been rigorously evaluated in randomized controlled trials or real-world healthcare environments.

Research Tool Only: The models on this leaderboard are intended solely as research tools to assist healthcare professionals and should never be considered a replacement for the professional judgment and expertise of a qualified medical doctor.

Further Validation Needed: Proper adaptation and validation of these models for specific medical use cases would require significant additional work, some of them including:

Thorough testing and evaluation in relevant clinical scenarios.
Alignment with evidence-based guidelines and best practices.
Mitigation of potential biases and failure modes.
Integration with human oversight and interpretation.
Compliance with regulatory and ethical standards.

Always consult a qualified healthcare provider for personal medical needs.

About Open Life Science AI

An Open Life Science Project to Benchmark and Track AI Progress, Share Models and Datasets in the Life Science Field. More info

Datasets

MedQA (USMLE)

1273 real-world questions from the US Medical License Exams (USMLE) to test general medical knowledge
PubMedQA

500 questions constructed from PubMed article titles along with the abstracts as context to test understanding of biomedical research
MedMCQA

4183 questions from Indian medical entrance exams (AIIMS & NEET PG) spanning 2.4k healthcare topics
MMLU-Clinical knowledge

265 multiple choice questions on clinical knowledge
MMLU-Medical genetics

100 MCQs on medical genetics
MMLU-Anatomy

135 anatomy MCQs
MMLU-Professional medicine

272 MCQs on professional medicine
MMLU-College biology

144 MCQs on college-level biology
MMLU-College medicine

173 college medicine MCQs

Evaluation Metric

Metric Accuracy (ACC) is used as the main evaluation metric across all datasets.

Details and Logs

Detailed results are available in the results directory:

https://huggingface.co/datasets/openlifescienceai/results

Input/outputs for each model can be found in the details page accessible by clicking the 📄 emoji next to the model name.

Reproducibility

To reproduce the results, you can run this evaluation script:

python eval_medical_llm.py

To evaluate a specific dataset on a model, use the EleutherAI LLM Evaluation Harness:

python main.py --model=hf-auto --model_args="pretrained=<model>,revision=<revision>,parallelize=True" --tasks=<dataset> --num_fewshot=<n_shots> --batch_size=1 --output_path=<output_dir>

Note some datasets may require additional setup, refer to the Evaluation Harness documentation.

Adjust batch size based on your GPU memory if not using parallelism. Minor variations in results are expected with different batch sizes due to padding.

Icons

🟢 Pre-trained model
🔶 Fine-tuned model
? Unknown model type
⭕ Instruction-tuned
🟦 RL-tuned

Missing icons indicate the model info is not yet added, feel free to open an issue to include it!


01-ai/Yi-1.5-9B-Chat-16K	main	false	float32	Original	RUNNING
01-ai/Yi-1.5-9B-Chat	main	false	float32	Original	RUNNING
SrikanthChellappa/Collaiborator-MEDLLM-Llama-3-8B-v2-7	main	false	bfloat16	Original	RUNNING
cognitivecomputations/dolphin-2.9.1-yi-1.5-9b	main	false	float32	Original	RUNNING
vicgalle/Configurable-Yi-1.5-9B-Chat	main	false	float32	Original	RUNNING
wenbopan/Faro-Yi-9B-DPO	main	false	float32	Original	RUNNING
wenbopan/Faro-Yi-9B	main	false	float32	Original	RUNNING


1024m/PHI-4-Hindi	main	false	bfloat16	Original	PENDING
1024m/QWEN-14B-B100	main	false	bfloat16	Original	PENDING
BAAI/Infinity-Instruct-3M-0625-Qwen2-7B	main	false	bfloat16	Original	PENDING
BSC-LT/salamandra-7b-instruct	main	false	float16	Original	PENDING
BSC-LT/salamandra-7b	main	false	float16	Original	PENDING
BaekSeungJu/PreTrained_Ophthalmic_LLM	main	false	bfloat16	Original	PENDING
ContactDoctor/Bio-Medical-Llama-3-8B	main	false	bfloat16	Original	PENDING
Cran-May/tempmotacilla-cinerea-0308	main	false	bfloat16	Original	PENDING
Danielbrdz/Barcenas-14b-Phi-3-medium-ORPO	main	false	float16	Original	PENDING
Echelon-AI/Med-Qwen2-7B	main	false	float16	Original	PENDING
Echelon-AI/medbotlm-v0.2	main	false	bfloat16	Original	PENDING
FreedomIntelligence/Apollo2-0.5B	main	false	bfloat16	Original	PENDING
FreedomIntelligence/Apollo2-3.8B	main	false	bfloat16	Original	PENDING
FreedomIntelligence/Apollo2-7B	main	false	bfloat16	Original	PENDING
FreedomIntelligence/HuatuoGPT-o1-72B	main	false	bfloat16	Original	PENDING
Ghufran27/medical-llama2-7b	main	false	float16	Original	PENDING
Ghufran27/my-medical-llama	main	false	float32	Adapter	PENDING
GritLM/GritLM-7B-KTO	main	false	bfloat16	Original	PENDING
GritLM/GritLM-8x7B-KTO	main	false	bfloat16	Original	PENDING
HoangHa/Pensez-Llama3.1-8B	main	false	bfloat16	Original	PENDING
KarthikNimmagadda/Biomistral-Finetuned-Medical-Dataset	main	false	float16	Delta	PENDING
KarthikNimmagadda/Medllama3-8B-Finetuned-Medical-Datasett	main	false	float16	Delta	PENDING
Kukedlc/NeuralLLaMa-3-8b-ORPO-v0.4	main	false	float16	Original	PENDING
Kukedlc/NeuralSynthesis-7B-v0.1	main	false	bfloat16	Original	PENDING
Kukedlc/NeuralSynthesis-7B-v0.3	main	false	bfloat16	Original	PENDING
Kukedlc/NeuralSynthesis-7b-v0.4-slerp	main	false	bfloat16	Original	PENDING
Lowenzahn/KoBioMed-Llama-3.1-8B-Instruct	main	false	bfloat16	Original	PENDING
MaziyarPanahi/Calme-4x7B-MoE-v0.1	main	false	bfloat16	Original	PENDING
MaziyarPanahi/Calme-4x7B-MoE-v0.2	main	false	bfloat16	Original	PENDING
MilyaShams/DeepSeek-R1-Distill-Qwen-1.5B-Medical	main	false	float32	Original	PENDING
NLPark/Shi-Cis-Kestrel-uncensored	main	false	bfloat16	Original	PENDING
NehaAkshantula/DeepSeek-MedChat	main	false	float32	Original	PENDING
Norawit/msmarco-roberta-medxemoji-v.1	main	false	bfloat16	Original	PENDING
NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO	main	false	bfloat16	Original	PENDING
OussamaEL/MedExpert-8B	main	false	bfloat16	Original	PENDING
PranavHarshan/LaMistral-V4	main	false	bfloat16	Original	PENDING
Qwen/QwQ-32B	main	false	float32	Original	PENDING
Qwen/Qwen2-1.5B-Instruct	main	false	bfloat16	Original	PENDING
Qwen/Qwen2-1.5B	main	false	bfloat16	Original	PENDING
Qwen/Qwen2-7B-Instruct	main	false	bfloat16	Original	PENDING
Qwen/Qwen2-7B	main	false	bfloat16	Original	PENDING
Qwen/Qwen2.5-14B-Instruct	main	false	bfloat16	Original	PENDING
Qwen/Qwen2.5-14B	main	false	bfloat16	Original	PENDING
Qwen/Qwen2.5-32B-Instruct	main	false	bfloat16	Original	PENDING
Qwen/Qwen2.5-32B	main	false	bfloat16	Original	PENDING
Qwen/Qwen2.5-72B-Instruct	main	false	bfloat16	Original	PENDING
Qwen/Qwen2.5-72B	main	false	bfloat16	Original	PENDING
Qwen/Qwen2.5-7B-Instruct	main	false	bfloat16	Original	PENDING
Qwen/Qwen2.5-7B-Instruct	main	false	float32	Original	PENDING
Qwen/Qwen2.5-7B	main	false	bfloat16	Original	PENDING
Ramikan-BR/tinyllama-coder-py-4bit-v10	da5637d	false	float16	Original	PENDING
Rithvik762/gemma_medical	main	false	float16	Original	PENDING
Rithvik762/gemma_medical	main	false	float32	Original	PENDING
RubielLabarta/LogoS-7Bx2-MoE-13B-v0.2	main	false	bfloat16	Original	PENDING
SakanaAI/DiscoPOP-zephyr-7b-gemma	main	false	bfloat16	Original	PENDING
SrikanthChellappa/Collaiborator-MEDLLM-Llama-3-8B-v2-8	main	false	bfloat16	Original	PENDING
SrikanthChellappa/Collaiborator-MEDLLM-Llama-3-8B-v2-9	main	false	bfloat16	Original	PENDING
TIGER-Lab/MAmmoTH2-8x7B-Plus	2874911ada99fd46688ad40516e61bc30a702e20	false	bfloat16	Original	PENDING
Violayang/model40	main	false	float16	Original	PENDING
Violayang/model	main	false	float16	Original	PENDING
XeTute/Medic-1B	main	false	bfloat16	Delta	PENDING
XeTute/Medic-3B	main	false	bfloat16	Delta	PENDING
abacusai/Smaug-Mixtral-v0.1	main	false	bfloat16	Original	PENDING
allknowingroger/MultiverseEx26-7B-slerp	main	false	bfloat16	Original	PENDING
arcee-ai/Arcee-Spark	main	false	bfloat16	Original	PENDING
arshaan-nazir/Biomistral-7B-Medical-Llama3-8B-SLERP	main	false	float32	Adapter	PENDING
automerger/YamshadowExperiment28-7B	main	false	bfloat16	Original	PENDING
ayan-sh003/Llama-3-8b-Medy	main	false	bfloat16	Original	PENDING
bekalebendong/nlpproject-finetuned-jbnu-en-to-kor-qlora-3	main	false	float16	Adapter	PENDING
chengang12345/Qwen2.5-32B-Instruct-FineTune	main	false	bfloat16	Original	PENDING
cogbuji/MrGrammaticalOntology-internistai-SCT-core-0.6.5	main	false	float32	Original	PENDING
cognitivecomputations/dolphin-2.6-mixtral-8x7b	d099b57c21184bb51317ff4c150f284d9e59d4fd	false	bfloat16	Original	PENDING
cognitivecomputations/dolphin-2.7-mixtral-8x7b	9ad9d14e7ffae62b6ae4458035b6d9f165c212ee	false	bfloat16	Original	PENDING
cognitivecomputations/dolphin-2.9.1-yi-1.5-9b	main	false	bfloat16	Original	PENDING
cognitivecomputations/dolphin-2.9.2-Phi-3-Medium-abliterated	main	false	bfloat16	Original	PENDING
cognitivecomputations/dolphin-2.9.2-Phi-3-Medium	main	false	bfloat16	Original	PENDING
cognitivecomputations/dolphin-2.9.2-qwen2-7b	main	false	bfloat16	Original	PENDING
cognitivecomputations/dolphin-2.9.3-mistral-nemo-12b	main	false	bfloat16	Original	PENDING
collaiborateorg/Collaiborator-MEDLLM-Llama-3-8B-v2	main	false	bfloat16	Original	PENDING
deepseek-ai/DeepSeek-R1-Distill-Qwen-32B	main	false	bfloat16	Original	PENDING
dumbequation/Qwen2.5-3B-reasoning-medical-symptoms-GRPO-f16	main	false	float16	Original	PENDING
empirischtech/Llama-3.1-8B-Instruct-MedQA	main	false	bfloat16	Original	PENDING
gbueno86/Cathallama-70B	main	false	bfloat16	Original	PENDING
ggbaobao/medc_llm_based_on_qwen2.5	main	false	float32	Original	PENDING
ghost-x/ghost-8b-beta-1608	main	false	bfloat16	Original	PENDING
google/flan-t5-xl	main	false	float16	Original	PENDING
google/flan-t5-xxl	main	false	float16	Original	PENDING
google/flan-ul2	main	false	bfloat16	Original	PENDING
h0m4m/sympter-1	main	false	float32	Adapter	PENDING
h0m4m/sympter-1	main	false	float32	Original	PENDING
haoranxu/ALMA-13B-R	main	false	bfloat16	Adapter	PENDING
harshad317/PubMed-2nd-8B-slerp	main	false	bfloat16	Original	PENDING
harshad317/PubMed-2nd-8B-slerp	main	false	float32	Original	PENDING
harshad317/PubMed-8B-slerp	main	false	bfloat16	Original	PENDING
harshad317/PubMed-8B-slerp	main	false	float32	Original	PENDING


01-ai/Yi-1.5-9B-32K	main	false	bfloat16	Original	FINISHED
01-ai/Yi-1.5-9B	main	false	bfloat16	Original	FINISHED
AdaptLLM/medicine-chat	main	false	float32	Original	FINISHED
Artples/L-MChat-7b	main	false	bfloat16	Original	FINISHED
BEE-spoke-data/mega-ar-126m-4k	main	false	float32	Original	FINISHED
BioMistral/BioMistral-7B-DARE	main	false	float16	Original	FINISHED
BioMistral/BioMistral-7B-SLERP	main	false	float16	Original	FINISHED
BioMistral/BioMistral-7B-TIES	main	false	float16	Original	FINISHED
BioMistral/BioMistral-7B-Zephyr-Beta-SLERP	main	false	float16	Original	FINISHED
BioMistral/BioMistral-7B	main	false	float16	Original	FINISHED
BioMistral/BioMistral-DARE-NS	main	false	bfloat16	Adapter	FINISHED
BioMistral/BioMistral-MedMNX	main	false	bfloat16	Delta	FINISHED
BioMistral/BioMistral-MedMNX	main	false	bfloat16	Original	FINISHED
ChenWeiLi/Med-ChimeraLlama-3-8B_SHERP	main	false	bfloat16	Original	FINISHED
ChenWeiLi/Med-ChimeraLlama-3_10k	main	false	bfloat16	Original	FINISHED
ChenWeiLi/Med-ChimeraLlama-3_1k_10_epoch	main	false	bfloat16	Original	FINISHED
ChenWeiLi/Med-ChimeraLlama-3_1k_20_epoch	main	false	bfloat16	Original	FINISHED
ChenWeiLi/Med-ChimeraLlama-3_1k_5_epoch	main	false	bfloat16	Original	FINISHED
ChenWeiLi/MedLlama-3-8B_DARE_v1.0	main	false	float16	Original	FINISHED
CohereForAI/aya-23-8B	main	false	bfloat16	Original	FINISHED
CohereForAI/aya-23-8B	main	false	float16	Original	FINISHED
Danielbrdz/Barcenas-Llama3-8b-ORPO	main	false	float16	Original	FINISHED
DeepMount00/Llama-3-8b-Ita	main	false	bfloat16	Original	FINISHED
EleutherAI/gpt-neo-2.7B	main	false	float16	Original	FINISHED
EleutherAI/pythia-1.4b-deduped	main	false	float16	Original	FINISHED
EleutherAI/pythia-1.4b	main	false	bfloat16	Original	FINISHED
EleutherAI/pythia-1b-deduped	main	false	bfloat16	Original	FINISHED
EleutherAI/pythia-1b	main	false	float16	Original	FINISHED
EleutherAI/pythia-2.8b-deduped	main	false	bfloat16	Original	FINISHED
EleutherAI/pythia-2.8b	main	false	float16	Original	FINISHED
Flan-PaLM	main	false	float16	Original	FINISHED
FreedomIntelligence/Apollo-0.5B	main	false	bfloat16	Original	FINISHED
FreedomIntelligence/Apollo-2B	main	false	bfloat16	Original	FINISHED
FreedomIntelligence/Apollo-6B	main	false	bfloat16	Original	FINISHED
FreedomIntelligence/Apollo-7B	main	false	bfloat16	Original	FINISHED
GPT-3.5 Turbo 1106	main	false	float16	Original	FINISHED
GPT-4	main	false	float16	Original	FINISHED
Gemini-1.0	main	false	float16	Original	FINISHED
HPAI-BSC/Llama3-Aloe-8B-Alpha	main	false	bfloat16	Original	FINISHED
HPAI-BSC/Llama3-Aloe-8B-Alpha	main	false	float32	Original	FINISHED
HiTZ/Medical-mT5-large	main	false	float32	Original	FINISHED
HuggingFaceH4/zephyr-7b-beta	main	false	float16	Original	FINISHED
IBI-CAAI/MELT-TinyLlama-1.1B-Chat-v1.0	main	false	bfloat16	Original	FINISHED
IBI-CAAI/MELT-llama-2-7b-chat-v0.1	main	false	bfloat16	Original	FINISHED
Jayant9928/orpo_med_v0	main	false	float32	Original	FINISHED
Jayant9928/orpo_med_v2	main	false	float32	Original	FINISHED
Jayant9928/orpo_med_v3	main	false	float32	Original	FINISHED
Jayant9928/orpo_v2	main	false	float32	Original	FINISHED
Jayant9928/tnayaj	main	false	float32	Original	FINISHED
Jayant9928/tnayajv2.0	main	false	float32	Original	FINISHED
Kabster/Bio-Mistralv2-Squared	main	false	float32	Original	FINISHED
Kabster/BioMistral-Zephyr-Beta-SLERP	main	false	float32	Original	FINISHED
Kukedlc/NeuralLLaMa-3-8b-DT-v0.1	main	false	float16	Original	FINISHED
Kukedlc/NeuralLLaMa-3-8b-ORPO-v0.3	main	false	float16	Original	FINISHED
LeoLM/leo-mistral-hessianai-7b	main	false	bfloat16	Original	FINISHED
Locutusque/Hercules-3.1-Mistral-7B	main	false	bfloat16	Original	FINISHED
Locutusque/Llama-3-Orca-1.0-8B	main	false	bfloat16	Original	FINISHED
Med-PaLM 2 (5 Shots)	main	false	float16	Original	FINISHED
MoaData/Myrrh_solar_10.7b_3.0	main	false	float16	Original	FINISHED
Nexusflow/Starling-LM-7B-beta	main	false	float32	Original	FINISHED
NotAiLOL/Med-Yi-1.5-9B	main	false	bfloat16	Original	FINISHED
NotAiLOL/Yi-1.5-dolphin-9B	main	false	bfloat16	Original	FINISHED
NousResearch/Hermes-2-Pro-Mistral-7B	main	false	float32	Original	FINISHED
NousResearch/Nous-Hermes-2-Mistral-7B-DPO	main	false	bfloat16	Original	FINISHED
NousResearch/Nous-Hermes-2-Mistral-7B-DPO	main	false	float32	Original	FINISHED
OEvortex/EMO-2B	main	false	float16	Original	FINISHED
OEvortex/EMO-2B	main	false	float32	Original	FINISHED
OEvortex/MediKAI	main	false	float16	Original	FINISHED
OpenModels4all/gemma-1.1-7b-it	main	false	float32	Original	FINISHED
Ppoyaa/Lumina-3.5	main	false	bfloat16	Original	FINISHED
ProbeMedicalYonseiMAILab/medllama3-v16	main	false	bfloat16	Original	FINISHED
ProbeMedicalYonseiMAILab/medllama3-v20	main	false	bfloat16	Original	FINISHED
ProbeMedicalYonseiMAILab/medllama3-v20	main	false	float32	Original	FINISHED
Qwen/Qwen1.5-7B-Chat	main	false	bfloat16	Original	FINISHED
Qwen/Qwen1.5-7B	main	false	bfloat16	Original	FINISHED
SeaLLMs/SeaLLM-7B-v2.5	main	false	bfloat16	Original	FINISHED
SrikanthChellappa/Collaiborator-MEDLLM-Llama-3-8B-v1	main	false	bfloat16	Original	FINISHED