Recipes

Recipes#

To help you get started with Oumi, we’ve prepared a set of recipes for common use cases. These recipes are designed to be easy to understand and modify, and should be a good starting point for your own projects. Each recipe is a YAML file that can be used to train, evaluate, or deploy a model. We also have corresponding job configs for most recipes that let you run the job remotely; they’re usually files ending in _job.yaml in the same directory as the recipe config.

Overview#

The recipes are organized by model family and task type. Each recipe includes:

Configuration files for different tasks (training, evaluation, inference)
Platform-specific job configurations (Cloud (e.g. GCP), Polaris, or local)
Multiple training methods (FFT, LoRA, QLoRA, FSDP/DDP)

To use a recipe, simply download the desired configuration file, modify any parameters as needed, and run the configuration using the Oumi CLI. For example:

oumi train --config path/to/config.yaml
oumi evaluate --config path/to/config.yaml
oumi infer --config path/to/config.yaml

You can also check out the README.md in each recipe’s directory for more details and examples. You can easily adapt these recipes to use with other supported models, datasets, and cloud providers.

Common Models#

🐋 DeepSeek R1 Family#

Model	Configuration	Links
DeepSeek R1 671B	`recipes/deepseek_r1/inference/671b_together_infer.yaml`	`Download` oumi-ai/oumi
Distilled Llama 8B	`recipes/deepseek_r1/sft/distill_llama_8b/full_train.yaml`	`Download` oumi-ai/oumi
	`recipes/deepseek_r1/sft/distill_llama_8b/lora_train.yaml`	`Download` oumi-ai/oumi
	`recipes/deepseek_r1/sft/distill_llama_8b/qlora_train.yaml`	`Download` oumi-ai/oumi
	`recipes/deepseek_r1/evaluation/distill_llama_8b/eval.yaml`	`Download` oumi-ai/oumi
	`recipes/deepseek_r1/inference/distill_llama_8b_infer.yaml`	`Download` oumi-ai/oumi
Distilled Llama 70B	`recipes/deepseek_r1/sft/distill_llama_70b/full_train.yaml`	`Download` oumi-ai/oumi
	`recipes/deepseek_r1/sft/distill_llama_70b/lora_train.yaml`	`Download` oumi-ai/oumi
	`recipes/deepseek_r1/sft/distill_llama_70b/qlora_train.yaml`	`Download` oumi-ai/oumi
	`recipes/deepseek_r1/evaluation/distill_llama_70b/eval.yaml`	`Download` oumi-ai/oumi
	`recipes/deepseek_r1/inference/distill_llama_70b_infer.yaml`	`Download` oumi-ai/oumi
Distilled Qwen 1.5B	`recipes/deepseek_r1/sft/distill_qwen_1_5b/full_train.yaml`	`Download` oumi-ai/oumi
	`recipes/deepseek_r1/sft/distill_qwen_1_5b/lora_train.yaml`	`Download` oumi-ai/oumi
	`recipes/deepseek_r1/evaluation/distill_qwen_1_5b/eval.yaml`	`Download` oumi-ai/oumi
	`recipes/deepseek_r1/inference/distill_qwen_1_5b_infer.yaml`	`Download` oumi-ai/oumi
Distilled Qwen 32B	`recipes/deepseek_r1/sft/distill_qwen_32b/lora_train.yaml`	`Download` oumi-ai/oumi
	`recipes/deepseek_r1/evaluation/distill_qwen_32b/eval.yaml`	`Download` oumi-ai/oumi
	`recipes/deepseek_r1/inference/distill_qwen_32b_infer.yaml`	`Download` oumi-ai/oumi

🦙 Llama Family#

Model	Configuration	Links
Llama 3.1 8B	`recipes/llama3_1/sft/8b_full/train.yaml`	`Download` oumi-ai/oumi
	`recipes/llama3_1/sft/8b_lora/train.yaml`	`Download` oumi-ai/oumi
	`recipes/llama3_1/sft/8b_qlora/train.yaml`	`Download` oumi-ai/oumi
	`recipes/llama3_1/pretraining/8b/train.yaml`	`Download` oumi-ai/oumi
	`recipes/llama3_1/evaluation/8b_eval.yaml`	`Download` oumi-ai/oumi
	`recipes/llama3_1/inference/8b_infer.yaml`	`Download` oumi-ai/oumi
Llama 3.3 70B	`recipes/llama3_3/sft/70b_full/train.yaml`	`Download` oumi-ai/oumi
	`recipes/llama3_3/sft/70b_lora/train.yaml`	`Download` oumi-ai/oumi
	`recipes/llama3_3/sft/70b_qlora/train.yaml`	`Download` oumi-ai/oumi
	`recipes/llama3_3/evaluation/70b_eval.yaml`	`Download` oumi-ai/oumi
	`recipes/llama3_3/inference/70b_infer.yaml`	`Download` oumi-ai/oumi
Llama 3.1 405B	`recipes/llama3_1/sft/405b_full/train.yaml`	`Download` oumi-ai/oumi
	`recipes/llama3_1/sft/405b_lora/train.yaml`	`Download` oumi-ai/oumi
	`recipes/llama3_1/sft/405b_qlora/train.yaml`	`Download` oumi-ai/oumi
Llama 3.2 1B	`recipes/llama3_2/sft/1b_full/train.yaml`	`Download` oumi-ai/oumi
	`recipes/llama3_2/evaluation/1b_eval.yaml`	`Download` oumi-ai/oumi
	`recipes/llama3_2/inference/1b_infer.yaml`	`Download` oumi-ai/oumi
Llama 3.2 3B	`recipes/llama3_2/sft/3b_full/train.yaml`	`Download` oumi-ai/oumi
	`recipes/llama3_2/sft/3b_lora/train.yaml`	`Download` oumi-ai/oumi
	`recipes/llama3_2/sft/3b_qlora/train.yaml`	`Download` oumi-ai/oumi
	`recipes/llama3_2/evaluation/3b_eval.yaml`	`Download` oumi-ai/oumi
	`recipes/llama3_2/inference/3b_infer.yaml`	`Download` oumi-ai/oumi

🎨 Vision Models#

Model	Configuration	Links
Llama 3.2 Vision 11B	`recipes/vision/llama3_2_vision/sft/11b_full/train.yaml`	`Download` oumi-ai/oumi
	`recipes/vision/llama3_2_vision/evaluation/11b_eval.yaml`	`Download` oumi-ai/oumi
	`recipes/vision/llama3_2_vision/inference/11b_infer.yaml`	`Download` oumi-ai/oumi
	`recipes/vision/llama3_2_vision/inference/11b_sglang_infer.yaml`	`Download` oumi-ai/oumi
	`recipes/vision/llama3_2_vision/inference/11b_rvllm_infer.yaml`	`Download` oumi-ai/oumi
LLaVA 7B	`recipes/vision/llava_7b/sft/train.yaml`	`Download` oumi-ai/oumi
	`recipes/vision/llava_7b/inference/infer.yaml`	`Download` oumi-ai/oumi
	`recipes/vision/llava_7b/inference/vllm_infer.yaml`	`Download` oumi-ai/oumi
Phi3 Vision	`recipes/vision/phi3/sft/full/train.yaml`	`Download` oumi-ai/oumi
	`recipes/vision/phi3/inference/vllm_infer.yaml`	`Download` oumi-ai/oumi
Phi4 Multimodal	`recipes/vision/phi4/sft/full/train.yaml`	`Download` oumi-ai/oumi
	`recipes/vision/phi4/inference/vllm_infer.yaml`	`Download` oumi-ai/oumi
Qwen2-VL 2B	`recipes/vision/qwen2_vl_2b/sft/full/train.yaml`	`Download` oumi-ai/oumi
	`recipes/vision/qwen2_vl_2b/inference/infer.yaml`	`Download` oumi-ai/oumi
	`recipes/vision/qwen2_vl_2b/inference/sglang_infer.yaml`	`Download` oumi-ai/oumi
	`recipes/vision/qwen2_vl_2b/inference/vllm_infer.yaml`	`Download` oumi-ai/oumi
Qwen2.5-VL 3B	`recipes/vision/qwen2_5_vl_3b/sft/full/train.yaml`	`Download` oumi-ai/oumi
	`recipes/vision/qwen2_5_vl_3b/inference/infer.yaml`	`Download` oumi-ai/oumi
	`recipes/vision/qwen2_5_vl_3b/inference/vllm_infer.yaml`	`Download` oumi-ai/oumi
SmolVLM	`recipes/vision/smolvlm/sft/full/train.yaml`	`Download` oumi-ai/oumi

🎯 Training Techniques#

This section lists an example config for various training techniques supported by Oumi.

Technique	Configuration	Links
FSDP	`recipes/llama3_1/sft/8b_lora/fsdp_train.yaml`	`Download` oumi-ai/oumi
Long-context training	`recipes/llama3_1/sft/8b_full/longctx_train.yaml`	`Download` oumi-ai/oumi
DPO	`recipes/phi3/dpo/train.yaml`	`Download` oumi-ai/oumi
GRPO	`examples/grpo_tldr/train.yaml`	`Download` oumi-ai/oumi
DDP Pretraining	`examples/fineweb_ablation_pretraining/ddp/train.yaml`	`Download` oumi-ai/oumi
FSDP Pretraining	`examples/fineweb_ablation_pretraining/fsdp/train.yaml`	`Download` oumi-ai/oumi

🚀 Inference#

Model	Configuration	Links
DeepSeek R1 671B	`recipes/deepseek_r1/inference/671b_together_infer.yaml`	`Download` oumi-ai/oumi
DeepSeek R1 Distill Llama 8B	`recipes/deepseek_r1/inference/distill_llama_8b_infer.yaml`	`Download` oumi-ai/oumi
DeepSeek R1 Distill Llama 70B	`recipes/deepseek_r1/inference/distill_llama_70b_infer.yaml`	`Download` oumi-ai/oumi
DeepSeek R1 Distill Qwen 1.5B	`recipes/deepseek_r1/inference/distill_qwen_1_5b_infer.yaml`	`Download` oumi-ai/oumi
DeepSeek R1 Distill Qwen 32B	`recipes/deepseek_r1/inference/distill_qwen_32b_infer.yaml`	`Download` oumi-ai/oumi
Llama 3.1 8B	`recipes/llama3_1/inference/8b_infer.yaml`	`Download` oumi-ai/oumi
	`recipes/llama3_1/inference/8b_sglang_infer.yaml`	`Download` oumi-ai/oumi
	`recipes/llama3_1/inference/8b_rvllm_infer.yaml`	`Download` oumi-ai/oumi
Llama 3.1 70B	`recipes/llama3_1/inference/70b_infer.yaml`	`Download` oumi-ai/oumi
Llama 3.2 1B	`recipes/llama3_2/inference/1b_infer.yaml`	`Download` oumi-ai/oumi
	`recipes/llama3_2/inference/1b_sglang_infer.yaml`	`Download` oumi-ai/oumi
	`recipes/llama3_2/inference/1b_vllm_infer.yaml`	`Download` oumi-ai/oumi
Llama 3.2 3B	`recipes/llama3_2/inference/3b_infer.yaml`	`Download` oumi-ai/oumi
	`recipes/llama3_2/inference/3b_sglang_infer.yaml`	`Download` oumi-ai/oumi
	`recipes/llama3_2/inference/3b_vllm_infer.yaml`	`Download` oumi-ai/oumi
Llama 3.2 Vision 11B	`recipes/vision/llama3_2_vision/inference/11b_infer.yaml`	`Download` oumi-ai/oumi
	`recipes/vision/llama3_2_vision/inference/11b_sglang_infer.yaml`	`Download` oumi-ai/oumi
	`recipes/vision/llama3_2_vision/inference/11b_rvllm_infer.yaml`	`Download` oumi-ai/oumi
GPT-2	`recipes/gpt2/inference/infer.yaml`	`Download` oumi-ai/oumi