‹ retour

› sample_hunter // about

le projet

Sample Hunter est un outil de découverte de samples musicaux pour beatmakers et diggers. Il combine trois modes :

  • recherche par similarité audio via embeddings LAION-CLAP 512d (catalogue local)
  • recherche textuelle cross-modale : « piano mélancolique style Dilla » trouve les samples qui matchent
  • découverte aléatoire YouTube via thèmes curés (soul 60s, library music, jazz fusion, italo disco…)

comment c'est analysé

Pour chaque sample du catalogue, le worker Python :

  1. télécharge à la volée la fenêtre audio depuis YouTube via yt-dlp + ffmpeg
  2. détecte les instruments avec PANNs (CNN14, AudioSet)
  3. calcule un embedding 512d avec LAION-CLAP (HTSAT-tiny)
  4. stocke instruments + scores + embedding dans Postgres (pgvector)
  5. supprime systématiquement le fichier audio téléchargé

[!] charte légale

Aucun fichier audio copyrighté n'est hébergé par Sample Hunter. La plateforme ne stocke que :

  • des métadonnées publiques (titre, artiste, année)
  • des identifiants YouTube qui pointent vers la vidéo originale (lecture via embed officiel YouTube avec timestamp)
  • des vecteurs d'embeddings 512dnon réversibles — on ne peut pas reconstruire l'audio à partir d'un embedding

Les analyses sont effectuées sur des extraits limités (max 60s) téléchargés à la volée, exclusivement pour l'extraction de features (PANNs + CLAP), puis purgés systématiquement. Cet usage relève de l'analyse computationnelle protégée par l'exception de fouille de textes et données dans plusieurs juridictions (UE: art. 4 directive CDSM 2019/790 ; US: fair use).

Si vous êtes ayant droit et souhaitez retirer un track ou une référence du catalogue, contactez-nous : la suppression est automatique sur simple demande.

stack

  • Frontend : Next.js 16 (App Router) · TypeScript strict · Tailwind 3 · Supabase Auth (magic link)
  • Backend DB : Postgres 15 + pgvector (embeddings cosine)
  • Worker audio : Python 3.11 · FastAPI · PANNs · LAION-CLAP · asyncpg
  • Assistant IA : Claude Opus 4.7 (Anthropic) avec tool use + prompt caching
  • APIs externes : Discogs · YouTube Data v3 · MusicBrainz (fallback)

opensource

Sample Hunter est un projet personnel. github (à venir).