For et par dage siden fangede Google endnu engang opmærksomheden hos AI-entusiaster ved at annoncere Gemini 1.5 blot en uge efter frigivelsen af den kraftfulde Gemini 1.0 Ultra-model og omdøbe chatbotten Bard til Gemini.
Dog lod OpenAI ikke Google nyde en stærk position inden for AI i selv en dag. Skaberne af ChatGPT afslørede en endnu mere spændende løsning: Sora, en videogenerator, der er i stand til at skabe næsten minutlange videoer baseret på tekstuelle prompts. OpenAIs Sora er klar til at blive et banebrydende værktøj med potentiale til at revolutionere videoinholdsskabelsesindustrien. Men hvad der gør Sora exceptionel, er ikke kun dens tekniske kapaciteter, men også dens brede vifte af potentielle anvendelser – fra marketing og uddannelse til underholdningsindustrien og daglig kommunikation. Lad os undersøge, hvordan Sora har til hensigt at bringe disse ændringer, og hvilke udsigter det åbner op for virksomheder.
Vi er kommet langt siden de første klodsede forsøg på at skabe videoer ved hjælp af computere. Det er allerede tydeligt, at videoer skabt af generativ kunstig intelligens, selv dem der kun er seks måneder gamle, ser ret akavede ud sammenlignet med Soras generationer. Selvom Sora, som kan skabe realistiske videoscener baseret på tekstuelle instruktioner, stadig er i eksperimenteringsfasen og endnu ikke er tilgængelig for offentligheden, er dens kapaciteter forbløffende.
Sora tilbyder en bred vifte af anvendelser, der kan ændre den måde, vi skaber og forbruger videoinhold på. Her er et par eksempler:
Disse eksempler viser enorme fremskridt inden for AI. Men frem for alt åbner det døre til nye muligheder for at skabe videoinhold. Se blot på præsentationen af en video i høj opløsning, der skildrer skønheden ved en blomstrende blomst:
Kilde: OpenAI (https://cdn.openai.com/sora/videos/flower-blooming.mp4 eller https://youtu.be/UNmqxZoTgsk)
Er Sora bare et legetøj og et andet værktøj til at skabe videoinhold? Nej. I det mindste ifølge OpenAI. Som skaberne af Sora skriver:
Vi lærer kunstig intelligens at forstå og simulere den fysiske verden i bevægelse, og målet er at træne modeller, der hjælper folk med at løse problemer, der kræver interaktion med den virkelige verden.
For at generere videoer præcist skal modellen forstå verden på et meget dybere niveau end det, der er nødvendigt for tekstskabelse. Dette indebærer at forstå fysik, rumlige relationer mellem objekter på samme plan og samspillet mellem forgrund og baggrund.
Sora vil være i stand til at generere:
I fremtiden kunne Sora bruges til at skabe reklamevideoer, indhold til sociale medier eller forretningspræsentationer. Det er et værktøj, der helt kan ændre den måde, vi skaber og deler videoinhold på:
Kilde: OpenAI (https://cdn.openai.com/sora/videos/aquarium-nyc.mp4 eller https://youtu.be/3l8wjxjNubE)
Selvom dette kolossale skridt i udviklingen af generativ kunstig intelligens er spændende, rejser det også bekymringer vedrørende risiciene forbundet med deep fakes, især i relation til de amerikanske præsidentvalg. Truslerne forbundet med brugen af Sora inkluderer primært:
Derfor, selvom Soras kapaciteter er imponerende, må vi være forsigtige med deres indvirkning på samfundet, skabe reguleringer og tage yderligere skridt for at minimere deres negative konsekvenser.
Selvom Sora i øjeblikket er i testfasen og ikke er tilgængelig for en bredere offentlighed, ser det ud til, at brugen af den er en simpel og intuitiv proces. Brugere vil sandsynligvis kunne bruge den, som de nu bruger DALL-E 3 i ChatGPT Plus. Det vil sige, at de kan indtaste tekstkommandoer, som Sora vil konvertere til korte videoklip. Dette tilbyder nye muligheder for indholdsskabere, marketingfolk og undervisere, så de hurtigt kan lave engagerende, høj kvalitet videoer.
Men hvordan sammenlignes Sora med andre videogeneratorer? Indtil videre kan vi kun spekulere i, hvordan Sora vil præstere, men baseret på beskrivelsen af værktøjet, der er tilgængeligt på OpenAIs hjemmeside, kan vi lave nogle generelle observationer:
Sora adskiller sig fra andre værktøjer til videogenerering, da den skaber meget realistiske videoer, der ligner ægte optagelser. Opløsning er særligt vigtig her. Sora kan lave videoer med opløsninger op til 1920x1080px.
Med sin dybe forståelse af sprog fortolker modellen kommandoer præcist. Her brugte OpenAI metoden, der er bevist i DALL-E 3. Modellen fortolker først en simpel prompt indtastet af brugeren og genererer derefter visuelt indhold baseret på sin udførlige og detaljerede version. Dette gør det muligt for den at skabe komplekse scener og generere karakterer, der udtrykker autentiske følelser:
Kilde: OpenAI (https://cdn.openai.com/sora/videos/closeup-man-in-glasses.mp4 eller https://youtu.be/pxkfUDoQg5I)
Soras potentiale til at transformere den kreative industri er enormt. Adgang til dette værktøj for filmskabere og designere bringer en ny kvalitet til skabelsen af videoinhold. Sora fungerer som grundlag for modeller, der er i stand til at simulere den virkelige verden, hvilket kunne være et gennembrud i opnåelsen af AGI (Artificial General Intelligence). I det mindste er det, hvad dens skabere, OpenAI, hævder.
Da Sora skaber realistiske bevægelige billeder, der ligner dem, der er filmet af menneskehånd, har det potentiale til betydeligt at ændre feltet for videoproduktion, fra træningsmaterialer til Hollywood-produktioner. Sora vil uden tvivl påvirke:
Kilde: DALL·E 3, prompt: Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)
Brugen af AI i videoproduktion tilbyder virksomheder en række fordele, såsom tids- og omkostningsbesparelser, ensartet kvalitet af resultater og øget værdi af slutproduktet. OpenAI tager skridt mod at sikre Soras sikkerhed, herunder samarbejde med anti-modstands teams og udvikling af en klassifikator til at opdage AI-genererede videoer.
Sora fra OpenAI åbner op for nye muligheder for at skabe og forbruge videoinhold. Fra at revolutionere den kreative industri til at påvirke marketing og uddannelse, til at påvirke daglig kommunikation – potentialet er enormt. Som et værktøj, der kan ændre spillereglerne fuldstændigt, fortjener Sora særlig opmærksomhed. Vi ser frem til yderligere information fra OpenAI, især vedrørende hvornår Sora vil blive tilgængelig for den bredere offentlighed. Dette markerer begyndelsen på en ny æra inden for videoinholdsskabelse. Næste skridt er dens integration med lyd, stemme og 3D-modeller, hvilket vil åbne døre til metaverset.
Hvis du kan lide vores indhold, så bliv en del af vores travle bier-fællesskab på Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.
JavaScript-ekspert og instruktør, der coacher IT-afdelinger. Hans hovedmål er at hæve teamproduktiviteten ved at lære andre, hvordan man effektivt samarbejder, mens man koder.
Virksomheder kæmper med at håndtere en stor mængde indhold, der offentliggøres online, fra sociale medieindlæg…
I en tid med digital transformation har virksomheder adgang til en hidtil uset mængde data…
Vidste du, at du kan få essensen af en fler timers optagelse fra et møde…
Forestil dig en verden, hvor dit firma kan skabe engagerende, personlige videoer til enhver lejlighed…
For fuldt ud at udnytte potentialet i store sprogmodeller (LLMs) skal virksomheder implementere en effektiv…
I 2018 havde Unilever allerede påbegyndt en bevidst rejse for at balancere automatiserings- og augmenteringsevner.…