2024-08-19

August 23, 2024 1 min read

Papers

[2408.10189] Transformers to SSMs: Distilling Quadratic Knowledge to Subquadratic Models #ssms #distillation
[2408.10012] CLIPCleaner: Cleaning Noisy Labels with CLIP #label-noise
[2403.17695] PlainMamba: Improving Non-Hierarchical Mamba in Visual Recognition
[2301.07088] Vision Learners Meet Web Image-Text Pairs #selfsup
[2308.07545] Vision-Language Dataset Distillation
[2408.12408] An Evaluation of Deep Learning Models for Stock Market Trend Prediction
[2407.10240] xLSTMTime : Long-term Time Series Forecasting With xLSTM

Videos

Aidan Gomez: What No One Understands About Foundation Models | E1191 - YouTube
Cohere For AI - Community Talks: Charles Hernandez - YouTube #torch #quantization
Fast, lazy container loading in modal.com by Jonathon Belotti - YouTube

Articles

uv: Unified Python packaging #python #uv #packaging

distillation label-noise packaging python quantization selfsup ssms torch uv

Contents

Papers
Videos
Articles