michal.i/o

❯

❯

❯

LLM Training and Tuning

LLM Training and Tuning

Jan 21, 20251 min read

pretraining
1. filtered for quality
2. include instruction tuning data
3. synthetic data
4. weighted sampling from different sources / categories
long context training
annealing with high quality data
supervised finetuning
RLHF / DPO

Common LLM Settings - Google Sheets
torchtune: Easy and Accessible Finetuning in Native PyTorch - Evan Smothers, Meta - YouTube

Optimizations

Quantized Optimizers

Fused Ops

GitHub - unslothai/unsloth: Finetune Llama 3.2, Mistral, Phi & Gemma LLMs 2-5x faster with 80% less memory
GitHub - linkedin/Liger-Kernel: Efficient Triton Kernels for LLM Training

Compile

FlexAttention

Block causal mask to pack samples

Distributed

Pretraining

Finetuning

Post Training / Alignment

Alignment and Post Training

Optimizations
Quantized Optimizers
Fused Ops
Compile
FlexAttention
Distributed
Pretraining
Finetuning
Post Training / Alignment

Backlinks

No backlinks found

Graph View

Created with Quartz v4.4.0 © 2025