Hoppa till huvudinnehåll

Tekniken bakom vår AI-baserade bildsökning

Läs mer om tekniken bakom AI-baserad bildsökning

Uppdaterad för mer än ett år sedan

Vår AI-baserade bildsökning är baserad på forskning från OpenAI och använder GPT-liknande naturlig språkbehandling, kombinerat med toppmodern visuell förståelse för att ge en överlägsen bildsökningsupplevelse.

Vår AI-baserade bildsökningsfunktion är fullt utvecklad för att analysera och hitta bilder som matchar din sökning. Vi använder förutbildade modeller optimerade på en stor datamängd för att exakt känna igen och kategorisera olika typer av visuellt innehåll.

Så här fungerar det:

  1. Vi använder förtränade AI-modeller: Vi använder AI-modeller som redan är tränade på stora externa dataset med bilder och texter. Vi tränar inte modellerna vidare baserat på dina bilder, på det sättet säkerställer vi en helt säker tjänst som samtidigt tar särskild hänsyn till integritet.

  2. Vi omvandlar bilderna till vektorer: När du laddar upp bilder till Elgiganten Cloud analyserar vår AI-modell automatiskt innehållet i varje bild och skapar en vektorrepresentation av varje bild. En vektor är en matris med hundratals tal som inte kan läsas av människor, men som gör det möjligt att jämföra en vektor med en annan vektor.

  3. Vi omvandlar söktexten till en vektor: När du beskriver bilden du letar efter, konverterar vi också söktermen till en vektorrepresentation.

  4. Vi jämför vektorerna: Nu beräknar vi avståndet mellan sökvektorn som skapades från din sökning och bildvektorerna kopplade till varje bild du har sparat hos oss. Om avståndet mellan vektorerna är litet betyder det att vektorerna liknar varandra. Då säger vi att likhetsscoren mellan de två vektorerna (sökningen och bilden) är hög.

  5. Vi visar dig resultatet: Vi sorterar bilderna från högst till lägst likhetsscore, så att du får se de mest exakta och relevanta bilderna baserat på din sökförfrågan.

  6. Vi gör det snabbt: Från det att du söker till resultatet visas tar det 0,3 sekunder. Ganska coolt, eller hur?

Nuvarande begränsningar med vår AI-baserade bildsökning:

  • Vi har för närvarande inte personlig ansiktsigenkänning, det vill säga möjligheten att tagga specifika personer med namn. Modellen förstår och känner igen ansikten, och genom att använda verktyget "Hitta liknande" kan du hitta bilder med samma personer i dem. Möjligheten att tagga personer är något vi förmodligen kommer att lägga till inom en snar framtid!

  • Platsen där bilden togs, som kan hämtas från metadata, är för närvarande inte integrerad i sökningen, vilket innebär att geografiska sök är begränsade. Modellen känner dock igen kända platser, städer och regioner, så att sökningar som "Eiffeltornet i Frankrike" eller "Taj Mahal" ger mycket exakta resultat. Sökfunktionen kan också förstå om bilder är tagna i New York, Paris eller London, eftersom modellen är tränad på miljontals bilder.

  • För närvarande stöder modellen inte sökningar efter tidsperioder, här måste man än så länge använda tidslinjen.

  • Sökfunktionen är begränsad av det visuella innehållet i dina bilder, vilket kanske inte alltid representerar exakt det du söker efter (om bildkvaliteten är dålig, vinkeln är konstig, ljuset är dåligt osv.).

Fick du svar på din fråga?