Détection de doublons video

jipe

Membre confirmé
15 Mars 2003
25
0
Bonjour,

Existe-t-il une appli me permettant de détecter les doublons
dans mes fichiers video ?
Sachant que ces videos ne sont pas nécessairement encodées de la même manière
et que les tailles de fichiers ne sont pas forcément les mêmes. et que les noms
des fichiers sont également différents.

Il faudrait donc une appli qui détecte des scènes quasi identiques dans des fichiers
et qui me donne l'info comme quoi il est probable que toto.avi et titi.mp4 soient
la même chose ...

ça existe ?

merci !
 
bonjour

le probleme c'est que d'entrée techniquement ce ne sont pas des doublons!

même si ce qui est dans la video est d'un point de vue "artistique" la même chose ce sont des fichiers differents aux formats differents avec un contenu different

les detecteurs de doublons se basent
soit sur les noms
soit noms et formats
soit dans les avancés similarité de contenu ( au sens informatique pas au sens artistique)
 
bonjour

le probleme c'est que d'entrée techniquement ce ne sont pas des doublons!

même si ce qui est dans la video est d'un point de vue "artistique" la même chose ce sont des fichiers differents aux formats differents avec un contenu different

les detecteurs de doublons se basent
soit sur les noms
soit noms et formats
soit dans les avancés similarité de contenu ( au sens informatique pas au sens artistique)

Bon ... tout dépend de la définition associée au mot "doublon".
Pour moi, si j'ai un film codé avec une certaine qualité en x.264 et le même film,
codée en divx, il s'agit bien d'un doublon.

Y-a-t-il des outils basés sur la similarité de contenus pour les vidéos ?

merci pour ta réponse
 
pour un ordi ce n'est pas un doublon
mais un fichier A et un fichier B
( un original et son converti ou 2 fichiers venant de 2 sources)
 
pour un ordi ce n'est pas un doublon
mais un fichier A et un fichier B
( un original et son converti ou 2 fichiers venant de 2 sources)

:rolleyes:
Je ne savais pas qu'il y avait une définition officielle d'un doublon :rolleyes:
Et quand bien même, ma question est suffisamment claire non ?
 
Pourquoi répondre à une question si vous n'avez rien à dire ? c'est d'un pénible et tellement enfantin.
Il vous a juste répondu trois fois non, et en argumentant (au cas où vous n'auriez pas compris les 2 premières fois :rateau: )

Par contre ne reste qu'à vous de développer le "soft miracle" qui s'occupera de détecter les vidéos qui ne sont pas des doublons mais des vidéos à contenu similaire.

PS: ce genre de soft existe vaguement dans le monde open-source: détection de zones par filet neutral pour essayer des identifications. Non seulement ça ne marche "pas" (ou peu), mais il faudrait une ferme de calculateurs et des disques et ram en pagaille pour arriver à faire correctement le boulot.

PPS: J'aime la convivialité des forums avec les gens qui désirent des réponses mais ne les acceptent pas :)
 
Mcherve dit autrement ce que j'ai dit

pour tes YEUX ces contenus paraissent les mêmes ( images et son)
car ton cerveau analyse quelque soit l'outil ou fichier
( idem que ce soit un avi ou tv hertzienne ou film en 16 millimetres ou VHS ou DVD)


pour un ordi , pas du tout
ce sont des fichiers
supports differents aux formats differents avec codages differents et contenu different

déjà rien que des techniques de reconnaissance d'une mage même format c'est complexe , une sequence ca se complexifie grave, alors si en plus il faut que l'outil gere la conversion. informatique.entre formats..
 
Il vous a juste répondu trois fois non, et en argumentant (au cas où vous n'auriez pas compris les 2 premières fois :rateau: )

Absolument pas ... il a fait une fixation sur le mot " doublon " en m'expliquant
des choses totalement évidentes ... comme quoi les fichiers étaient différents :rolleyes: alors
que j'ai clairement répondu dès mon deuxième message que c'était bien la similarité de contenus
qui m'intéressaient.
(il continue d'ailleurs dans son dernier message ... ). Peut-être devrais je lui
répondre "Ah bon, je ne peux pas me contenter de faire un "diff") ?

PS: ce genre de soft existe vaguement dans le monde open-source: détection de zones par filet neutral pour essayer des identifications. Non seulement ça ne marche "pas" (ou peu), mais il faudrait une ferme de calculateurs et des disques et ram en pagaille pour arriver à faire correctement le boulot.

Merci beaucoup pour cette réponse. Je vais essayer de trouver ces outils open source mais d'accord
sur le fait que cela doit demander beaucoup de puissance ...
 
le "il" te répond

Derniere fois

il n'y a PAS similarité de contenu


Bon, je vais te laisser le dernier mot :)
Si on était pas sur le web, je t'offrirais une bière et on pourrait discuter
de ça plus tranquillement ...

Faut que j'aille lire les nouveautés apple du jour

bonne soirée
 
Bon, je vais te laisser le dernier mot :)
Si on était pas sur le web, je t'offrirais une bière et on pourrait discuter
de ça plus tranquillement ...

Faut que j'aille lire les nouveautés apple du jour

bonne soirée

Je tombe par hasard sur cette discussion, effectivement c'est assez stérile de renvoyer quelqu'un dans ses filets pour une question de définition, alors que le problème est bien posé : il cherche à détecter des vidéos dont le contenu est le même, qu'importe les transformations qu'a subi le signal vidéo (encodage, ré-encodage, bruit, couleur/NB, ratio, etc.).

Bref, j'apporte ma contribution car pour le coup j'ai travaillé dans le domaine de la détection d'images et de vidéos pendant des années.

D'abord, puisqu'on est dans les définitions, dans l'industrie on parle effectivement de :
- "doublons" pour des fichiers vidéos identiques
- "matchs" pour des vidéos issues du même fichier original mais altérées par les transformations citées plus haut.
- "similaires" pour des vidéos "qui se ressemblent", avec tout le flou que ça comporte (exemple: deux matches de foot)

Ensuite, hormis la recherche de doublons qui est triviale puisque les fichiers sont identiques, c'est une technologie très compliquée à mettre en oeuvre. En résumé, elle utilise un mix d'analyse d'images et d'intelligence artificielle pour calculer des empreintes numériques de vidéos. On compare ensuite ces empreintes pour décider si deux vidéos sont des "matchs". Tout l'enjeu est que ces empreintes ne soient pas trop sensibles aux diverses transformations.

Comme il n'y a pas vraiment de marché pour les particuliers et que la techno est super compliquée, il n'y a pas (à ma connaissance) de logiciel grand-public qui fait ça, uniquement des logiciels d'entreprise.

Peace.
 
Bonjour,

Existe-t-il une appli me permettant de détecter les doublons
dans mes fichiers video ?
Sachant que ces videos ne sont pas nécessairement encodées de la même manière
et que les tailles de fichiers ne sont pas forcément les mêmes. et que les noms
des fichiers sont également différents.

Il faudrait donc une appli qui détecte des scènes quasi identiques dans des fichiers
et qui me donne l'info comme quoi il est probable que toto.avi et titi.mp4 soient
la même chose ...

ça existe ?

merci !

Je trouve assez pathétiques les réponses qui ont été apportées jusque là ...
Bref, techniquement ce n'est pourtant pas si difficile de faire un outil qui propose une détection de "doublons" vidéos ...
Il suffirait de se baser sur la DUREE des vidéos, évidemment, le taux de mauvaise détection serait relativement élevé, mais pas tant que ça ... cela permettrait donc de retrouver rapidement les doublons de vidéos codées sur des formats différents.
Quant aux abrutis qui te répondent que ce ne sont pas des doublons, ces mecs ont un cerveau codés en binaires et donc aucune intelligence associée pour admettre que ce sont bel et bien des doublons ... Je précise que Google image trouve très bien les images similaires même si "techniquement" les fichiers ne sont pas identiques.
Ces personnes semblent incapable de comprendre que pour NOUS êtres humains, le contenu d'une vidéo est ce que l'on voit en regardant la vidéo, et bien évidemment pas la succession de 0 et de 1 qui sont sur le disque dur pour nous permettre d'enregistrer le fichier ...
Si je trouve un tel outil, je l'indiquerai... si je ne le trouve pas ... faudrait que je prenne le temps de le faire ...