Slapp av, KI kommer ikke til å erstatte fotografen: Her er tre ting kunstig intelligens ikke klarer

Ikke vær redd for at kunstig intelligens skal gjøre deg overflødig som fotograf med det første. Selv om KI kan skape imponerende bilder, er det fortsatt områder der den mislykkes totalt

Det er lett å få inntrykk av at kunstig intelligens har nådd et intelligensnivå som gjør den i stand til å skape et hvilket som helst motiv med en realisme som matcher et ekte bilde. Dette er langt fra sannheten.

Kunstig intelligens har fortsatt en lang vei å gå før det kan erstatte et kamera. KI fungerer overbevisende innenfor visse rammer, men når du beveger deg utenfor dem, kommer den til kort.

Derfor finnes det mange gode grunner til at vi i redaksjonen baserer arbeidet vårt på ekte bilder.

Likevel er vi nysgjerrige på teknologien og skriver ofte artikler om de nyeste mulighetene innen KI. I løpet av prosessen har vi kommet over overraskende begrensninger som har gjort det klart hvor dum KI fortsatt kan være. Les mer nedenfor.

KI forstår ikke kontekst

Når vi har skrevet om tjenester som kan generere KI-bilder, har vi ofte bedt tjenesten om å lage et bilde av en fotograf som eksempel. Enten det er en naturfotograf som tar bilder av en fugl eller en studiofotograf som fotograferer en modell, har vi sett det vanlige problemet at KI ikke klarer å skjønne hvordan den skal rette kameraet mot motivet. Det peker som regel i en helt tilfeldig retning.

Årsaken er at KI-modeller sjelden er gode til å forstå kontekst. De vet hva en fugl er og kan skape et overbevisende bilde av en fugl, og det samme med en fotograf. Men de forstår ikke sammenhengen mellom fotograf og fugl, og klarer derfor ikke å koble de to elementene sammen til et meningsfylt bilde.

Vi vet ikke hva fotografen sikter mot, men det er i hvert fall ikke den vakkert poserende modellen. Bildet ble skapt av Google Gemini.

KI kan ikke lage enkle grafiske sammenstillinger

Når vi skriver nettartikler om kunstig intelligens, har vi av og til ønsket å ha et illustrasjonsbilde som viser en liten samling av KI-bilder. Hvis artikkelen for eksempel handlet om fem KI-programmer, ba vi om fem KI-bilder i en kollasj. Overraskende nok var det her det gikk galt. Uansett hvilken KI-modell vi har spurt etter, har vi konsekvent fått kollasjer med seks bilder, selv etter at vi har påpekt feilen.

Årsaken er at kunstig intelligens ikke forstår forskjellene i proporsjonene som må til for å få fem bilder til å passe inn i ett sammenhengende kvadratisk bilde.

I tillegg til at bildet inneholder seks bilder og ikke fem som vi ba om, er det noe galt med måten det første bildet er beskåret på. Bildet er opprettet av ChatGPT.

KI sliter med de små detaljene

Når vi vil sjekke om et bilde er skapt med KI, sjekker vi om detaljene er realistiske. Det kan for eksempel være avslørende hvis skygger faller annerledes over motivet. Det samme gjelder avvik i refleksjoner, der det som reflekteres i glass eller vann, kan være ulikt det som burde ha blitt reflektert i bildet.

Dette skyldes at kunstig intelligens kan slite med å forstå de grunnleggende fysiske lovene for for eksempel lys og skygge og ikke kan håndtere kompleksiteten i å gjengi et spesifikt element i et bilde som en speiling.

De fine brosteinene i gågaten skaper problemer for KI-modellen. Skyggene er heller ikke konsekvent kastet. Bildet er generert med Firefly i Photoshop.

De verste feilene er borte i nyere KI-modeller

De tre nevnte eksemplene er ikke de eneste feilene KI kan gjøre. Hender og fingre er noe kunstig intelligens har slitt med å reprodusere. Symmetri kan også være problematisk, for eksempel at øredobber og sokker er ulike, selv om du eksplisitt ber om det motsatte. Tekst i bilder kan også være problematisk, og det samme kan kroppsholdning og gjengivelsen av anatomiske detaljer. Nyere KI-modeller har imidlertid blitt bedre på disse elementene.