Skip to main content

LLMs (Large Language Models)

#ml/nlp/llm

Tokenization

GitHub - SumanthRH/tokenization: A comprehensive deep dive into the world of tokens
GitHub - openai/tiktoken: tiktoken is a fast BPE tokeniser for use with OpenAI's models.

Chat

Alignment

Instruction Tuning

RLHF

DPO

[2305.18290] Direct Preference Optimization: Your Language Model is Secretly a Reward Model
RLHF progress: Scaling DPO to 70B, DPO vs PPO update, Tülu 2, Zephyr-β, meaningful evaluation, data contamination
Fine-tune a Mistral-7b model with DPO.ipynb
GitHub - eric-mitchell/direct-preference-optimization: Reference implementation for DPO (Direct Preference Optimization)
Fine-tune Llama 2 with DPO
RLHF and DPO compared: user feedback methods for LLM optimization | by Automata | 𝐀𝐈 𝐦𝐨𝐧𝐤𝐬.𝐢𝐨 | Oct, 2023 | Medium

Training

Fine Tuning

GitHub - OpenAccess-AI-Collective/axolotl: Go ahead and axolotl questions

Inference

Serving

Hamel’s Blog - Optimizing latency

Quantization

Tutorials

GitHub - RahulSChand/llama2.c-for-dummies: Step by step explanation/tutorial of llama2.c

Visualization

LLM Visualization

Decoding

X

Inference Benchmarks

Performance of llama.cpp on Apple Silicon · ggerganov/llama.cpp · Discussion #4167 · GitHub

Evaluation

Evaluate LLMs and RAG a practical example using Langchain and Hugging Face

Applications

Text to SQL

GitHub - defog-ai/sqlcoder: SoTA LLM for converting natural language questions to SQL queries

Tokenization
Chat
Alignment
Training
- Fine Tuning
Inference
Serving
- Quantization
Tutorials
- Visualization
- Decoding
Inference Benchmarks
Evaluation
Applications
- Text to SQL