Passer au contenu principal

La technologie derrière notre recherche de photos basée sur l'IA

Découvrez la technologie derrière la recherche de photos basée sur l'IA

Mis à jour il y a plus d'un an

Notre recherche de photos basée sur l'IA est basée sur les recherches d'OpenAI et utilise un traitement du langage naturel de type GPT combiné à une compréhension visuelle de pointe pour offrir une expérience de recherche de photos supérieure.

Notre recherche de photos basée sur l'IA est entièrement conçue pour analyser vos photos et trouver celles qui correspondent à votre terme de recherche. Nous utilisons des modèles pré-entraînés qui ont été optimisés sur un vaste ensemble de données pour reconnaître et catégoriser avec précision différents types de contenu visuel.

Voici comment cela fonctionne:

  1. Nous utilisons des modèles d'IA pré-entraînés : nous utilisons des modèles d'IA qui ont déjà été formés sur de grands ensembles de données externes d'images et de textes. Nous ne formons pas davantage les modèles en fonction de vos images, garantissant ainsi un service entièrement sécurisé qui prend également en compte la confidentialité.

  2. Nous convertissons les images en vecteurs : lorsque vous téléchargez des images sur MediaMarkt Cloud, notre modèle d'IA analyse automatiquement le contenu de chaque image et crée une représentation vectorielle de chaque image. Un vecteur est une matrice de centaines de nombres non lisibles par l’humain, mais qui permet de comparer un vecteur à un autre.

  3. Nous convertissons la requête de recherche en vecteur : lorsque vous décrivez l'image que vous recherchez, nous convertissons également le terme de recherche en représentation vectorielle.

  4. Nous comparons les vecteurs : Nous calculons maintenant la distance entre le vecteur de recherche créé à partir de votre recherche et les vecteurs d'images associés à chaque image que vous avez stockée chez nous. Si la distance entre les vecteurs est petite, cela signifie que les vecteurs sont similaires. On dit alors que le score de similarité entre les deux vecteurs (la recherche et l’image) est élevé.

  5. Nous vous montrons le résultat : nous trions les images du score de similarité le plus élevé au plus bas, afin que vous puissiez voir les images les plus précises et les plus pertinentes en fonction de votre demande de recherche.

  6. Nous le faisons rapidement : à partir du moment où vous effectuez une recherche jusqu'à ce que le résultat apparaisse, cela prend 0,3 seconde. Plutôt cool, non ?

Limites actuelles de notre recherche de photos basée sur l'IA :

  • Il ne dispose actuellement pas de reconnaissance faciale personnalisée, c'est-à-dire la possibilité d'identifier des personnes spécifiques avec des noms. Cependant, le modèle comprend et reconnaît les visages, et en utilisant l'outil « Rechercher des similaires », vous pouvez trouver des images contenant les mêmes personnes. L'activation du marquage des personnes est quelque chose que nous ajouterons très probablement dans un avenir proche !

  • La localisation de l'image trouvée dans les métadonnées n'est pas encore intégrée à la recherche, ce qui limite la recherche géographique. Cependant, le modèle reconnaît des lieux, des villes et des régions célèbres, donc la recherche de « La Tour Eiffel en France » ou « Taj Mahal » donnera des résultats très précis. Il peut également comprendre si les photos sont prises à New York ou à Londres, car le modèle a été entraîné sur des millions d'images.

  • Il ne prend actuellement pas en charge la recherche de périodes horaires

  • Elle est limitée par le contenu visuel de vos photos, qui ne représente pas toujours fidèlement ce que vous recherchez (si la qualité de l'image est mauvaise, l'angle est étrange, etc.)

Avez-vous trouvé la réponse à votre question ?