Midjourney v6. Innovationer inden for AI-billedgenerering | AI i erhvervslivet #112

Hvordan bruger man Midjourneys muligheder i erhvervslivet?

Hvis du vil visualisere dine ideer øjeblikkeligt, uden at ansætte grafiske designere og vente på, at projekter bliver færdige, er Midjourney v6 et af de mest interessante AI-værktøjer på markedet. Det giver dig mulighed for at skabe hurtigt og effektivt:

  • prototyper,
  • produktvisualiseringer,
  • konceptuelle materialer.

Et af de bedste eksempler på brugen af Midjourney er, når en tech-startup ønsker at præsentere en vision for sit fremtidige produkt for investorer. Alt hvad der kræves, er et par velformulerede prompts, eller tekstsignaler til kunstig intelligens, og Midjourney vil generere en række billeder for at se ideen i al sin pragt.

En anden anvendelse er oprettelsen af marketing- og reklameindhold. I stedet for at stole på fotoshoots kan du basere din visuelle kommunikation på unikke og iøjnefaldende billeder, der er skabt direkte til dine behov:

  • reklamekampagner,
  • promotionsmaterialer,
  • produktopakning.

Midjourney spiller en nøglerolle i at hjælpe med at tilpasse udseendet og følelsen af et produkt til kunden. Det giver dig mulighed for hurtigt at eksperimentere med forskellige stilarter, kompositioner og teknikker i realtid.

Kilde: Midjourney, prompt: Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)

Hvordan fungerer Midjourney?

Midjourney skaber visuelle repræsentationer baseret på tekstuelle brugerinstruktioner kaldet “prompts”. Det er afhængigt af et komplekst neuralt netværk, der er trænet på millioner af billede- og teksteksempler for at genkende mønstre og forbindelser mellem ord og visuelle elementer.

Kommunikationen med Midjourney foregår via Discord, hvor brugerne sender deres prompts, og værktøjet genererer de tilsvarende billeder. Sprogmodellerne fortolker betydningen af brugerens ord og genererer billeder baseret på disse fortolkninger. En typisk proces ser sådan ud:

  1. Brugeren indtaster en prompt, såsom “Et realistisk portræt af en ældre kvinde i renæssancestil, med fremhævede ansigtstræk og rige farver.”
  2. Midjourney analyserer prompten og genererer fire indledende billeder i henhold til brugerens instruktioner.
  3. Hvis resultaterne ikke er helt tilfredsstillende, kan brugeren ændre prompten eller tilføje yderligere instruktioner for at forfine det ønskede resultat.
  4. Midjourney tager højde for de ændrede instruktioner og genererer en ny serie billeder.
  5. Denne proces gentages, indtil et tilfredsstillende resultat opnås.

Takket være sin avancerede maskinlæringsproces og den stadigt voksende database er Midjourney i stand til at skabe ekstremt realistiske og detaljerede billeder, der ligner håndlavede værker af kunstnere. Desuden udvikler værktøjet sig konstant for bedre at forstå sproget og generere bedre billeder.

Kilde: Midjourney, prompt: Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)

Hvad er nyt i Midjourney v6?

Den nyeste version af Midjourney, kendt som v6, bringer en række innovationer, der betydeligt forbedrer mulighederne for dette kraftfulde værktøj. Blandt de vigtigste er lettere og mere naturlig prompting, muligheden for at skabe undertekster, endnu større realisme i de skabte billeder og forbedrede kompositioner.

Lettere prompting

En af de vigtigste ændringer i Midjourney v6 er en forbedret sprogmodel, der muliggør en mere intuitiv og præcis formulering af prompts. I tidligere versioner var det nogle gange svært at opnå de ønskede resultater, selv med præcise beskrivelser. Den nye version gør et meget bedre stykke arbejde med at fortolke komplekse og beskrivende prompts, hvilket gør det lettere at kommunikere brugerens vision.

For eksempel kunne prompten “…et gammelt træskib med et sejl i en flaske, liggende på et træbord i en øde havn, med solnedgangsstråler, der kommer gennem et støvet vindue…” tidligere have givet algoritmen problemer. Men v6 Midjourney er i stand til at forstå og inkorporere mange detaljer som materialer, belysning, perspektiv og stemning for at generere billeder, der perfekt afspejler denne beskrivende instruktion.

Kilde: Midjourney, prompt: Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)

Generering af undertekster

En anden stor innovation i Midjourney v6 er den væsentligt forbedrede evne til at skabe billedtekster og integrere dem med billedet. I tidligere versioner resulterede forsøg på at generere tekst ofte i sløret tekst eller et sæt bogstaver, der groft lignede ord. Nu kan Midjourney placere læsbare billedtekster i en række stilarter og interessante skrifttyper. Dette åbner op for nye muligheder for at skabe:

  • logotyper,
  • annoncer,
  • plakater og andet grafisk materiale ved hjælp af tekst.
Endnu mere realistiske billeder

Midjourney v6 introducerer også forbedret billedkvalitet, der bringer det tættere på realismen af fotografi. Forbedringerne inkluderer:

  • mere naturlig belysning,
  • mere præcis teksturreproduktion,
  • bedre bevarelse af proportioner.

Resultaterne ser ekstremt realistiske ud og er ofte svære at skelne fra et foto.

Bedre komposition

Ud over øget realisme lover Midjourney v6 også forbedringer i billedkomposition. Et af de almindelige problemer i tidligere versioner var den unaturlige placering af elementer i en scene, hvilket gjorde det åbenlyst ved første øjekast, at noget var “forkert” med billedet. Den nye version håndterer proportionerne og placeringen af objekter bedre, hvilket skaber mere afbalancerede og æstetisk tiltalende kompositioner.

Begrænsninger ved Midjourney v6

Betyder dette, at der ikke er nogen grund til at forfølge fotografi, og at Midjourney v6 har nået perfektion? Ikke rigtig. På trods af sine mange fordele og innovationer har Midjourney v6 stadig nogle begrænsninger. Nogle er af teknisk art, såsom vanskeligheder med at få adgang til værktøjet, da det er nødvendigt at registrere sig på Discord, hvor du kan anmode om billeder. Andre relaterer sig til manglende evne til at finjustere resultaterne eller til at indsætte dine egne materialer, såsom produktbilleder, i de genererede billeder.

Behovet for at bruge Discord

På trods af planer om en dedikeret web- og mobilapp fungerer Midjourney i øjeblikket stadig primært gennem Discord-appen. For nybegyndere kan dette være en smule en hindring, da de skal mestre både Discord og selve billedskabelsesværktøjet.

Midjourney-webapplikationen er i øjeblikket kun tilgængelig for betalende brugere, der allerede har genereret mere end 1.000 billeder.

Hindret arbejde med resultater

Selvom Midjourney v6 gør et bedre stykke arbejde med at fortolke komplekse prompts, kan det stadig have problemer med at bevare detaljer og elementer, når det arbejder på det samme billede. Efter et par ændringer kan modellen begynde at miste nogle aspekter af billedet, hvilket gør det svært at bringe det til den ønskede tilstand.

Ændringer, såsom at ændre belysningen eller tilføje baggrundselementer, kan få figurerne eller objekterne til at ændre sig, og kompositionen kan blive sløret. Efter flere iterationer kan modellen begynde at miste nogle af de tidligere detaljer i selve portrættet, såsom præcise ansigtstræk eller teksturer.

Høje omkostninger for virksomheder

Mens Midjourney tilbyder en række abonnementsplaner med rimelige priser for individuelle brugere, kan omkostningerne hurtigt stige for virksomheder, der har brug for at generere hundreder eller tusinder af billeder om måneden til marketingkampagner eller projekter. Især for avancerede anvendelser, der kræver maksimal opløsning og kvalitet, kan prisen pr. billede nå flere dollars, hvilket kan være en betydelig udgift på årlig basis.

Kilde: Midjourney (https://docs.midjourney.com/docs/plans)

Restriktive regler for indholdsproduktion

Midjourney, ligesom andre AI-billedgenereringsværktøjer, har en række indbyggede restriktioner og filtre for at forhindre misbrug af teknologien. For eksempel er der restriktioner for at generere falske billeder af berømte personer eller ekstremistisk eller kriminelt indhold. Selvom disse restriktioner har legitime etiske og juridiske grunde, kan de også fungere som en barriere for nogle kreative ideer. De detaljerede bestemmelser i Midjourneys privatlivspolitik kan findes her: https://docs.midjourney.com/docs/privacy-policy. I mellemtiden kan du finde brugsvilkårene, som bør tjekkes regelmæssigt, især for kommerciel brug af billeder genereret af Midjourney, på dette link: https://docs.midjourney.com/docs/terms-of-service.

Sammenfatning

Midjourney v6 er det næste skridt i at skabe AI-billeder, der er umulige at skelne fra fotografier. Det tilbyder en række innovationer, der forbedrer kvaliteten, realismen og mulighederne for dette værktøj. Lettere og mere naturlig prompting, muligheden for at skabe læsbare billedtekster, øget billedrealisme og bedre komposition er blot nogle af de vigtigste forbedringer, der gør denne version ekstremt attraktiv for virksomheder, kunstnere og skabere.

Men ligesom enhver teknologi er Midjourney v6 ikke uden sine begrænsninger. Behovet for at bruge Discord, vanskelighederne ved præcist at redigere billeder, periodiske logiske fejl, høje omkostninger for virksomheder og restriktive regler for indholdsproduktion er alle aspekter, der skal overvejes, før man beslutter at bruge dette værktøj.

Hvis du kan lide vores indhold, så bliv en del af vores travle bier-fællesskab på Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.

Robert Whitney

JavaScript-ekspert og instruktør, der coacher IT-afdelinger. Hans hovedmål er at hæve teamproduktiviteten ved at lære andre, hvordan man effektivt samarbejder, mens man koder.

View all posts →

Robert Whitney

JavaScript-ekspert og instruktør, der coacher IT-afdelinger. Hans hovedmål er at hæve teamproduktiviteten ved at lære andre, hvordan man effektivt samarbejder, mens man koder.

Share
Published by
Robert Whitney

Recent Posts

AI’s rolle i indholdsmoderation | AI i erhvervslivet #129

Virksomheder kæmper med at håndtere en stor mængde indhold, der offentliggøres online, fra sociale medieindlæg…

2 days ago

Sentimentanalyse med AI. Hvordan hjælper det med at drive forandring i erhvervslivet? | AI i erhvervslivet #128

I en tid med digital transformation har virksomheder adgang til en hidtil uset mængde data…

2 days ago

AI videoproduktion. Nye horisonter inden for videoinholdproduktion for virksomheder | AI i erhvervslivet #126

Forestil dig en verden, hvor dit firma kan skabe engagerende, personlige videoer til enhver lejlighed…

2 days ago

LLMOps, eller hvordan man effektivt håndterer sprogmodeller i en organisation | AI i erhvervslivet #125

For fuldt ud at udnytte potentialet i store sprogmodeller (LLMs) skal virksomheder implementere en effektiv…

3 days ago

Automatisering eller augmentation? To tilgange til AI i en virksomhed | AI i erhvervslivet #124

I 2018 havde Unilever allerede påbegyndt en bevidst rejse for at balancere automatiserings- og augmenteringsevner.…

3 days ago