› sample_hunter // about
le projet
Sample Hunter est un outil de découverte de samples musicaux pour beatmakers et diggers. Il combine trois modes :
- recherche par similarité audio via embeddings LAION-CLAP 512d (catalogue local)
- recherche textuelle cross-modale : « piano mélancolique style Dilla » trouve les samples qui matchent
- découverte aléatoire YouTube via thèmes curés (soul 60s, library music, jazz fusion, italo disco…)
comment c'est analysé
Pour chaque sample du catalogue, le worker Python :
- télécharge à la volée la fenêtre audio depuis YouTube via
yt-dlp+ffmpeg - détecte les instruments avec PANNs (CNN14, AudioSet)
- calcule un embedding 512d avec LAION-CLAP (HTSAT-tiny)
- stocke instruments + scores + embedding dans Postgres (pgvector)
- supprime systématiquement le fichier audio téléchargé
[!] charte légale
Aucun fichier audio copyrighté n'est hébergé par Sample Hunter. La plateforme ne stocke que :
- des métadonnées publiques (titre, artiste, année)
- des identifiants YouTube qui pointent vers la vidéo originale (lecture via embed officiel YouTube avec timestamp)
- des vecteurs d'embeddings 512dnon réversibles — on ne peut pas reconstruire l'audio à partir d'un embedding
Les analyses sont effectuées sur des extraits limités (max 60s) téléchargés à la volée, exclusivement pour l'extraction de features (PANNs + CLAP), puis purgés systématiquement. Cet usage relève de l'analyse computationnelle protégée par l'exception de fouille de textes et données dans plusieurs juridictions (UE: art. 4 directive CDSM 2019/790 ; US: fair use).
Si vous êtes ayant droit et souhaitez retirer un track ou une référence du catalogue, contactez-nous : la suppression est automatique sur simple demande.
stack
- Frontend : Next.js 16 (App Router) · TypeScript strict · Tailwind 3 · Supabase Auth (magic link)
- Backend DB : Postgres 15 + pgvector (embeddings cosine)
- Worker audio : Python 3.11 · FastAPI · PANNs · LAION-CLAP · asyncpg
- Assistant IA : Claude Opus 4.7 (Anthropic) avec tool use + prompt caching
- APIs externes : Discogs · YouTube Data v3 · MusicBrainz (fallback)
opensource
Sample Hunter est un projet personnel. github (à venir).