Inspiration

Problème fréquent lors du tournage de mes court-métrages; « filme tout et organise après »

What it does

Après un long tournage, que ça soit des entrevues, conférences, court métrages ou reportages, un cinéaste se retrouver avec plusieurs gigaoctets de prises sur une dizaine de cartes SD et doit les trier manuellement.

AutoCat offre une solution à ce problème, en analysant chaque vidéo afin d'identifier à quelle scène elle appartient et lui donne un nom significatif pour une intervention humaine plus efficace.

How we built it

AutoCat commence par analyser les vidéos et leurs attribuer une série de poids.

Ensuite, ces poids sont insérés dans un espace latent complexe à 7 dimensions.

Un algorithme de pariage identifie ensuite les distances entre les îlots.

Enfin, les deltas sont utilisés pour trouver les débuts et fin des scènes.

Les fichiers sont ensuite renommés alphabétiquement pour l'identification humaine rapide.

Challenges we ran into

À cause du « Birthday paradox », l'algorithme de « clustering » était vraiment difficile à ajuster.

Accomplishments that we're proud of

Vitesse : 3 minutes par gigaoctet Taux de classification : 93.7% Taux de réussite (total) : 98.3%

What we learned

Pour un ordinateur, toutes les images se ressemblent! De plus, le décodage Hardware c'est de la magie noire!!!

What's next for AutoCat

Apprentissage machine pour la construction de l'espace latent

Built With

Share this project:

Updates