Sora. Hvordan vil realistiske videoer fra OpenAI ændre erhvervslivet? | AI i erhvervslivet #94

For et par dage siden fangede Google endnu engang opmærksomheden hos AI-entusiaster ved at annoncere Gemini 1.5 blot en uge efter frigivelsen af den kraftfulde Gemini 1.0 Ultra-model og omdøbe chatbotten Bard til Gemini.

Dog lod OpenAI ikke Google nyde en stærk position inden for AI i selv en dag. Skaberne af ChatGPT afslørede en endnu mere spændende løsning: Sora, en videogenerator, der er i stand til at skabe næsten minutlange videoer baseret på tekstuelle prompts. OpenAIs Sora er klar til at blive et banebrydende værktøj med potentiale til at revolutionere videoinholdsskabelsesindustrien. Men hvad der gør Sora exceptionel, er ikke kun dens tekniske kapaciteter, men også dens brede vifte af potentielle anvendelser – fra marketing og uddannelse til underholdningsindustrien og daglig kommunikation. Lad os undersøge, hvordan Sora har til hensigt at bringe disse ændringer, og hvilke udsigter det åbner op for virksomheder.

Sora fra OpenAI – en ny æra inden for videoinholdsskabelse

Vi er kommet langt siden de første klodsede forsøg på at skabe videoer ved hjælp af computere. Det er allerede tydeligt, at videoer skabt af generativ kunstig intelligens, selv dem der kun er seks måneder gamle, ser ret akavede ud sammenlignet med Soras generationer. Selvom Sora, som kan skabe realistiske videoscener baseret på tekstuelle instruktioner, stadig er i eksperimenteringsfasen og endnu ikke er tilgængelig for offentligheden, er dens kapaciteter forbløffende.

Sora tilbyder en bred vifte af anvendelser, der kan ændre den måde, vi skaber og forbruger videoinhold på. Her er et par eksempler:

  • generering af komplekse scener med flere karakterer eller objekter,
  • animation af allerede eksisterende billeder,
  • redigering af skabte videoer,
  • kombinering af forskellige grafik eller videoer til én.

Disse eksempler viser enorme fremskridt inden for AI. Men frem for alt åbner det døre til nye muligheder for at skabe videoinhold. Se blot på præsentationen af en video i høj opløsning, der skildrer skønheden ved en blomstrende blomst:

Kilde: OpenAI (https://cdn.openai.com/sora/videos/flower-blooming.mp4 eller https://youtu.be/UNmqxZoTgsk)

Hvordan vil Sora blive brugt?

Er Sora bare et legetøj og et andet værktøj til at skabe videoinhold? Nej. I det mindste ifølge OpenAI. Som skaberne af Sora skriver:

Vi lærer kunstig intelligens at forstå og simulere den fysiske verden i bevægelse, og målet er at træne modeller, der hjælper folk med at løse problemer, der kræver interaktion med den virkelige verden.

For at generere videoer præcist skal modellen forstå verden på et meget dybere niveau end det, der er nødvendigt for tekstskabelse. Dette indebærer at forstå fysik, rumlige relationer mellem objekter på samme plan og samspillet mellem forgrund og baggrund.

Sora vil være i stand til at generere:

  • video fra tekst – den første og vigtigste innovation i modellen,
  • video fra billeder – hvilket muliggør animation af eksisterende generationer skabt i DALL·E 3,
  • video fra billede og tekst – hvilket muliggør mere præcis filmproduktion,
  • video fra video – tilføjelse af specialeffekter, forlængelse af filmen, kombination af to eksisterende optagelser eller ændring af videostil,
  • billeder fra tekst – formodentlig til sidst erstatte DALL·E og tilbyde generationer med en opløsning på 2048×2048.

I fremtiden kunne Sora bruges til at skabe reklamevideoer, indhold til sociale medier eller forretningspræsentationer. Det er et værktøj, der helt kan ændre den måde, vi skaber og deler videoinhold på:

Kilde: OpenAI (https://cdn.openai.com/sora/videos/aquarium-nyc.mp4 eller https://youtu.be/3l8wjxjNubE)

Selvom dette kolossale skridt i udviklingen af generativ kunstig intelligens er spændende, rejser det også bekymringer vedrørende risiciene forbundet med deep fakes, især i relation til de amerikanske præsidentvalg. Truslerne forbundet med brugen af Sora inkluderer primært:

  • Desinformation. Deepfakes, herunder fotorealistiske videoer genereret af Sora, kan sprede falske nyheder, der kan påvirke den offentlige mening og underminere demokratiet. Ved at skabe falske videoer, der ser ægte ud, kan seerne manipuleres og bedras.
  • Overtrædelse af privatlivets fred. At gøre Sora tilgængelig ville give enhver med en computer og internetadgang mulighed for at skabe falskt indhold, herunder videoer, der krænker privatlivets fred og misbruger personlige data uden tilladelse. Sandsynligvis af denne grund vil det tage noget tid, før Sora er tilgængelig for offentligheden. OpenAI skal sikre passende sikkerhedsforanstaltninger.
  • Skadelig omdømme. Ved at bruge Sora kan hackere udgive sig for andre personer, organisationer eller mærker for at bagvaske dem. Ved at skabe indtrykket af, at nogen siger eller gør ting, de aldrig har gjort, kan sådanne videoer betydeligt skade omdømme og troværdighed. Kombinationen af deepfake-teknologi med AI-baseret stemmekloning kan desværre føre til skabelsen af mange overbevisende falskner. Efterhånden som vi nærmer os et punkt, hvor det bliver ekstremt svært at skelne en falsk optagelse fra en ægte, bliver årvågenhed, bevidsthed og kritisk tænkning stadig mere afgørende for at bekæmpe potentielle skader forårsaget af deepfakes.

Derfor, selvom Soras kapaciteter er imponerende, må vi være forsigtige med deres indvirkning på samfundet, skabe reguleringer og tage yderligere skridt for at minimere deres negative konsekvenser.

Hvordan bruger man Sora?

Selvom Sora i øjeblikket er i testfasen og ikke er tilgængelig for en bredere offentlighed, ser det ud til, at brugen af den er en simpel og intuitiv proces. Brugere vil sandsynligvis kunne bruge den, som de nu bruger DALL-E 3 i ChatGPT Plus. Det vil sige, at de kan indtaste tekstkommandoer, som Sora vil konvertere til korte videoklip. Dette tilbyder nye muligheder for indholdsskabere, marketingfolk og undervisere, så de hurtigt kan lave engagerende, høj kvalitet videoer.

Hvordan sammenlignes Sora med andre AI-videogeneratorer?

Men hvordan sammenlignes Sora med andre videogeneratorer? Indtil videre kan vi kun spekulere i, hvordan Sora vil præstere, men baseret på beskrivelsen af værktøjet, der er tilgængeligt på OpenAIs hjemmeside, kan vi lave nogle generelle observationer:

  • Runway – Sora vil fungere på en lignende måde, men med meget højere realisme. Runway giver dig mulighed for at skabe video- og billedindhold ved hjælp af AI, herunder tekst-til-video og billede-til-billede muligheder. Det tilbyder også redigeringsforbedringer som baggrundsfjernelse og elementudskiftning baseret på tekstkommandoer.
  • Synthesia – platformen fungerer anderledes end Sora, da den tilbyder skabelsen af realistiske videoer med digitale avatarer, der understøtter over 120 sprog og muliggør oprettelse af brugerdefinerede avatarer. Vi ved endnu ikke, hvordan Sora vil håndtere opgaver som at kombinere lyd eller generere tale med det visuelle materiale, den skaber.
  • HeyGen – dens unikhed ligger i stemmekloning og evnen til at skabe en avatar med brugerdefinerede gestus, så dens funktionalitet adskiller sig betydeligt fra Soras tilbud.
  • Stable Video Diffusion – sandsynligvis Soras mest alvorlige direkte konkurrent, der kan forvandle statiske billeder til videoanimationer, primært for indholdsskabere på sociale medier. Dens eksperimentelle natur og det faktum, at den er baseret på åbne adgangsmodeller, rejser store forhåbninger i forbindelse med filmproduktion og animation.

Sora adskiller sig fra andre værktøjer til videogenerering, da den skaber meget realistiske videoer, der ligner ægte optagelser. Opløsning er særligt vigtig her. Sora kan lave videoer med opløsninger op til 1920x1080px.

Med sin dybe forståelse af sprog fortolker modellen kommandoer præcist. Her brugte OpenAI metoden, der er bevist i DALL-E 3. Modellen fortolker først en simpel prompt indtastet af brugeren og genererer derefter visuelt indhold baseret på sin udførlige og detaljerede version. Dette gør det muligt for den at skabe komplekse scener og generere karakterer, der udtrykker autentiske følelser:

Kilde: OpenAI (https://cdn.openai.com/sora/videos/closeup-man-in-glasses.mp4 eller https://youtu.be/pxkfUDoQg5I)

Hvordan kan Sora påvirke den kreative industri?

Soras potentiale til at transformere den kreative industri er enormt. Adgang til dette værktøj for filmskabere og designere bringer en ny kvalitet til skabelsen af videoinhold. Sora fungerer som grundlag for modeller, der er i stand til at simulere den virkelige verden, hvilket kunne være et gennembrud i opnåelsen af AGI (Artificial General Intelligence). I det mindste er det, hvad dens skabere, OpenAI, hævder.

Da Sora skaber realistiske bevægelige billeder, der ligner dem, der er filmet af menneskehånd, har det potentiale til betydeligt at ændre feltet for videoproduktion, fra træningsmaterialer til Hollywood-produktioner. Sora vil uden tvivl påvirke:

  • Marketing. Sora har potentiale til at revolutionere reklamekampagner ved hurtigt at generere attraktivt videoinhold baseret på marketingbudskaber eller produktbeskrivelser.
  • Underholdningsindustrien. Filmstudier og indholdsskabere kan drage fordel af Soras evne til at skabe realistiske scener og karakterer, hvilket strømliner produktionsprocesserne.
  • Spil. Spiludviklere kan bruge Sora til at skabe film eller trailers inden for spil, hvilket forbedrer spillernes oplevelser.
  • Uddannelse. Letheden ved at skabe høj kvalitet uddannelsesmaterialer, herunder “how-to” instruktionsvideoer, kan i høj grad forbedre attraktiviteten af træning og kurser.

Kilde: DALL·E 3, prompt: Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)

Hvordan kan virksomheder drage fordel af realistisk AI-video?

Brugen af AI i videoproduktion tilbyder virksomheder en række fordele, såsom tids- og omkostningsbesparelser, ensartet kvalitet af resultater og øget værdi af slutproduktet. OpenAI tager skridt mod at sikre Soras sikkerhed, herunder samarbejde med anti-modstands teams og udvikling af en klassifikator til at opdage AI-genererede videoer.

Sora fra OpenAI åbner op for nye muligheder for at skabe og forbruge videoinhold. Fra at revolutionere den kreative industri til at påvirke marketing og uddannelse, til at påvirke daglig kommunikation – potentialet er enormt. Som et værktøj, der kan ændre spillereglerne fuldstændigt, fortjener Sora særlig opmærksomhed. Vi ser frem til yderligere information fra OpenAI, især vedrørende hvornår Sora vil blive tilgængelig for den bredere offentlighed. Dette markerer begyndelsen på en ny æra inden for videoinholdsskabelse. Næste skridt er dens integration med lyd, stemme og 3D-modeller, hvilket vil åbne døre til metaverset.

Hvis du kan lide vores indhold, så bliv en del af vores travle bier-fællesskab på Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.

Robert Whitney

JavaScript-ekspert og instruktør, der coacher IT-afdelinger. Hans hovedmål er at hæve teamproduktiviteten ved at lære andre, hvordan man effektivt samarbejder, mens man koder.

View all posts →

Robert Whitney

JavaScript-ekspert og instruktør, der coacher IT-afdelinger. Hans hovedmål er at hæve teamproduktiviteten ved at lære andre, hvordan man effektivt samarbejder, mens man koder.

Share
Published by
Robert Whitney

Recent Posts

AI’s rolle i indholdsmoderation | AI i erhvervslivet #129

Virksomheder kæmper med at håndtere en stor mængde indhold, der offentliggøres online, fra sociale medieindlæg…

3 months ago

Sentimentanalyse med AI. Hvordan hjælper det med at drive forandring i erhvervslivet? | AI i erhvervslivet #128

I en tid med digital transformation har virksomheder adgang til en hidtil uset mængde data…

3 months ago

AI videoproduktion. Nye horisonter inden for videoinholdproduktion for virksomheder | AI i erhvervslivet #126

Forestil dig en verden, hvor dit firma kan skabe engagerende, personlige videoer til enhver lejlighed…

3 months ago

LLMOps, eller hvordan man effektivt håndterer sprogmodeller i en organisation | AI i erhvervslivet #125

For fuldt ud at udnytte potentialet i store sprogmodeller (LLMs) skal virksomheder implementere en effektiv…

3 months ago

Automatisering eller augmentation? To tilgange til AI i en virksomhed | AI i erhvervslivet #124

I 2018 havde Unilever allerede påbegyndt en bevidst rejse for at balancere automatiserings- og augmenteringsevner.…

3 months ago