Hvad er ReALM?

ReALM står for “Reference Resolution As Language Modeling,” en banebrydende løsning udviklet af Apple-forskere. Det er således en ny sprogmodel (Large Language Model, LLM), der behandler problemet med referencer som en opgave inden for sprogmodellering.

ReALM konverterer effektivt forskellige typer kontekst til en tekstuel repræsentation, som den derefter behandler som en del af en sprogopgave. Dette kan inkludere:

  • samtaler – såsom tekstbeskeder, stemmekommandoer til en assistent eller e-mails,
  • elementer på skærmen – for eksempel fotos, kalender, vejr-widget eller applikationer og processer, der kører i baggrunden.

Hvad gør ReALM forskellig fra andre modeller til genkendelse af referencer? Først og fremmest tilgangen – i stedet for at stole på billedbehandling, kører ReALM i tekstdomænet. Dette gør det meget lettere og mere effektivt, hvilket burde gøre det muligt at køre direkte på mobile enheder, samtidig med at brugernes privatliv opretholdes.

På hvilke måder er ReALM bedre end GPT-4?

Apples forskningsteam sammenlignede ReALM med de mest kraftfulde sprogmodeller på markedet i dag – GPT-3.5 og GPT-4 fra OpenAI. Resultaterne var imponerende. I opgaver med genkendelse af referencer opnåede den mindste ReALM-variant en nøjagtighed, der var sammenlignelig med GPT-4! De større ReALM-modeller overgik endda GPT-4 i at genkende referencer til elementer, der vises på skærmen (http://arxiv.org/abs/2403.20329).

Hvad forklarer denne fordel? For det første er ReALM fantastisk til domænespecifikke forespørgsler, såsom dem vedrørende smarte hjemmeapparater. Dette skyldes, at ReALM demonstrerer en dybere forståelse af kontekst ved at finjustere modellen til domænespecifikke data.

Desuden, i modsætning til GPT-4, som primært træner på billeder af virkelige objekter, excellerer ReALM i at genkende tekstuelle elementer og komponenter i applikationsbrugergrænseflader. Og det er forståelsen af grænseflader, der er kritisk for den glatte interaktion mellem stemmeassistenter og de applikationer, vi bruger i dag.

ReALM

Kilde: DALL·E 3, prompt: Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)

Er dette begyndelsen på æraen med virkelig intelligente assistenter?

Ja, integrationen af ReALM med Siri kunne åbne et helt nyt kapitel i menneske-computer interaktion. Med ReALM vil Siri være i stand til at forstå kommandoer, der inkluderer referencer til elementer, der vises på smartphoneskærmen, samt processer og applikationer, der kører i baggrunden. Men hvornår vil denne mulighed være tilgængelig for brugerne? Det er stadig ukendt.

Vi står tilbage med spekulationer baseret på modellens tekniske kapaciteter. Så hvordan kunne en ReALM-drevet Siri fungere? For eksempel, hvis du browser en virksomhedsliste og ser en virksomhed, du er interesseret i, kunne du simpelthen sige til Siri, “Ring til denne virksomhed,” og assistenten – ved at bruge ReALM til at analysere konteksten – vil finde telefonnummeret til den virksomhed, du angiver, og starte opkaldet. Du behøver ikke engang at forklare præcist, hvilken virksomhed du mener.

Og dette er kun begyndelsen på mulighederne med ReALM. Kommandoer som “Afspil den seneste playliste” ville muliggøre intuitiv kontrol af multimedieapplikationer og smarte hjemmeenheder. ReALM kunne også give Siri mulighed for at forstå konteksten af samtaler og kommandohistorik, så assistenten reagerer passende på brugerens tidligere anmodninger. Dette er et skridt mod intelligente agenter, der bringer os tættere på ikke en kunstig intelligens, der forstår vores forespørgsler, men en, der ved, hvordan man udfører kommandoer.

Og dette er kun begyndelsen på, hvad ReALM kan gøre. Kommandoer som “afspil den seneste playliste” ville muliggøre intuitiv kontrol af medieapplikationer og smarte hjemmeenheder. ReALM kunne også give Siri mulighed for at forstå konteksten af samtaler og kommandohistorik, så assistenten reagerer passende på brugerens tidligere anmodninger. Dette er et skridt mod intelligente agenter, der bringer os tættere på ikke en kunstig intelligens, der forstår vores forespørgsler, men en, der ved, hvordan man udfører kommandoer.

Desværre må brugere af Android-enheder vente. I øjeblikket er der ingen information om Googles planer om at tilføje Geminis kapaciteter til Google Assistant. En Google Gemini-app til Android-enheder er blevet udviklet (https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en_US), men den er endnu ikke tilgængelig uden for USA.

ReALM

Kilde: Google Play (https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en_US)

Resumé

ReALM er Apples innovative tilgang til at løse problemet med kontekstgenkendelse af stemmeassistenter. I stedet for at stole på billedbehandling konverterer denne sprogmodel forskellige typer kontekst til en tekstuel repræsentation, som den derefter behandler i en sprogopgave. Denne tilgang sikrer ikke kun høj genkendelsesnøjagtighed, men også evnen til at fungere på en mobil enhed, samtidig med at brugernes privatliv opretholdes.

At give Siri adgang til ReALM kan give mere naturlige og kontekstuelle stemmeinteraktioner, et vigtigt skridt mod virkelig intelligente assistenter. Med ReALM vil Siri være i stand til straks at reagere på kommandoer relateret til skærmelementer, applikationer og baggrundsprocesser. Én ting er sikker – forbedring af assistenternes kontekstuelle bevidsthed er nøglen til at skabe virkelig intelligente og naturlige stemmeinteraktioner, og ReALM er uden tvivl et vigtigt skridt i den retning.

ReALM

Hvis du kan lide vores indhold, så bliv en del af vores travle bier-fællesskab på Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.

Robert Whitney

JavaScript-ekspert og instruktør, der coacher IT-afdelinger. Hans hovedmål er at hæve teamproduktiviteten ved at lære andre, hvordan man effektivt samarbejder, mens man koder.

View all posts →

AI in business:

  1. 6 fantastiske ChatGTP-plugins, der vil gøre dit liv lettere
  2. Navigere nye forretningsmuligheder med ChatGPT-4
  3. 3 fantastiske AI-skribenter, du skal prøve i dag
  4. Syntetiske skuespillere. Top 3 AI videogeneratorer
  5. Hvad er svaghederne ved min forretningsidé? En brainstormingsession med ChatGPT
  6. Brug af ChatGPT i erhvervslivet
  7. Nye tjenester og produkter, der arbejder med AI
  8. Automatiserede sociale medieindlæg
  9. Planlægning af indlæg på sociale medier. Hvordan kan AI hjælpe?
  10. AI's rolle i forretningsbeslutningstagning
  11. Forretnings-NLP i dag og i morgen
  12. AI-assisterede tekstchatbots
  13. AI-applikationer i erhvervslivet - oversigt
  14. Trusler og muligheder ved AI i erhvervslivet (del 2)
  15. Trusler og muligheder ved AI i erhvervslivet (del 1)
  16. Hvad er fremtiden for AI ifølge McKinsey Global Institute?
  17. Kunstig intelligens i erhvervslivet - Introduktion
  18. Hvad er NLP, eller naturlig sprogbehandling i erhvervslivet
  19. Google Translate vs DeepL. 5 anvendelser af maskinoversættelse til erhvervslivet
  20. Automatisk dokumentbehandling
  21. Driften og forretningsapplikationerne af voicebots
  22. Virtuel assistent teknologi, eller hvordan man taler med AI?
  23. Hvad er Business Intelligence?
  24. Hvordan kan kunstig intelligens hjælpe med BPM?
  25. Kreativ AI i dag og i morgen
  26. Kunstig intelligens i indholdsstyring
  27. Udforskning af AI's kraft i musikskabelse
  28. 3 nyttige AI grafiske designværktøjer. Generativ AI i erhvervslivet
  29. AI og sociale medier – hvad siger de om os?
  30. Vil kunstig intelligens erstatte forretningsanalytikere?
  31. AI-værktøjer til lederen
  32. Fremtidens arbejdsmarked og kommende professioner
  33. RPA og API'er i en digital virksomhed
  34. Nye interaktioner. Hvordan ændrer AI den måde, vi betjener enheder på?
  35. Multimodal AI og dens anvendelser i erhvervslivet
  36. Kunstig intelligens og miljøet. 3 AI-løsninger til at hjælpe dig med at opbygge en bæredygtig virksomhed
  37. AI indholddetektorer. Er de det værd?
  38. ChatGPT vs Bard vs Bing. Hvilken AI-chatbot fører løbet?
  39. Er chatbot AI en konkurrent til Google-søgning?
  40. Effektive ChatGPT-forespørgsler til HR og rekruttering
  41. Prompt engineering. Hvad laver en promptingeniør?
  42. AI og hvad ellers? Top teknologitrends for virksomheder i 2024
  43. AI og forretningsetik. Hvorfor du bør investere i etiske løsninger
  44. Meta AI. Hvad skal du vide om Facebooks og Instagrams AI-understøttede funktioner?
  45. AI-regulering. Hvad skal du vide som iværksætter?
  46. 5 nye anvendelser af AI i erhvervslivet
  47. AI-produkter og -projekter - hvordan adskiller de sig fra andre?
  48. AI som en ekspert på dit team
  49. AI-team vs. rollefordeling
  50. Hvordan vælger man et karrierefelt inden for AI?
  51. AI i HR: Hvordan rekrutteringsautomatisering påvirker HR og teamudvikling
  52. AI-assisteret procesautomatisering. Hvor skal man starte?
  53. 6 mest interessante AI-værktøjer i 2023
  54. Hvad er virksomhedens AI modenhedsanalyse?
  55. AI til B2B-personalisering
  56. ChatGPT anvendelsessager. 18 eksempler på, hvordan du kan forbedre din virksomhed med ChatGPT i 2024
  57. AI Mockup-generator. Top 4 værktøjer
  58. Mikrolæring. En hurtig måde at få nye færdigheder.
  59. De mest interessante AI-implementeringer i virksomheder i 2024
  60. Hvilke udfordringer bringer AI-projektet?
  61. Top 8 AI-værktøjer til erhvervslivet i 2024
  62. AI i CRM. Hvad ændrer AI i CRM-værktøjer?
  63. UE AI-loven. Hvordan regulerer Europa brugen af kunstig intelligens
  64. Top 7 AI hjemmesidebyggere
  65. No-code værktøjer og AI-innovationer
  66. Hvor meget øger brugen af AI produktiviteten i dit team?
  67. Hvordan man bruger ChatGTP til markedsundersøgelser?
  68. Hvordan kan du udvide rækkevidden af din AI-markedsføringskampagne?
  69. AI i transport og logistik
  70. Hvilke forretningsproblemer kan AI løse?
  71. Hvordan matcher du en AI-løsning med et forretningsproblem?
  72. Kunstig intelligens i medierne
  73. AI i bank- og finanssektoren. Stripe, Monzo og Grab
  74. AI i rejsebranchen
  75. Hvordan AI fremmer fødslen af nye teknologier
  76. AI i e-handel. Oversigt over globale ledere
  77. Top 4 AI billedskabelsesværktøjer
  78. Top 5 AI-værktøjer til dataanalyse
  79. Revolutionen af AI i sociale medier
  80. Er det altid værd at tilføje kunstig intelligens til produktudviklingsprocessen?
  81. 6 største forretningsfejl forårsaget af AI
  82. AI-strategi i din virksomhed - hvordan bygger man den?
  83. Bedste AI-kurser – 6 fantastiske anbefalinger
  84. Optimering af sociale medier lytning med AI-værktøjer
  85. IoT + AI, eller hvordan man reducerer energikostnader i en virksomhed
  86. AI i logistik. 5 bedste værktøjer
  87. GPT Store – en oversigt over de mest interessante GPT'er til erhvervslivet
  88. LLM, GPT, RAG... Hvad betyder AI-akronymer?
  89. AI-robotter – fremtiden eller nutiden for erhvervslivet?
  90. Hvad er omkostningerne ved at implementere AI i en virksomhed?
  91. Hvad laver specialister i kunstig intelligens?
  92. Hvordan kan AI hjælpe i en freelanceres karriere?
  93. Automatisering af arbejde og øget produktivitet. En guide til AI for freelancere
  94. AI til startups – bedste værktøjer
  95. At bygge en hjemmeside med AI
  96. Eleven Labs og hvad mere? De mest lovende AI-startups
  97. OpenAI, Midjourney, Anthropic, Hugging Face. Hvem er hvem i AI-verdenen?
  98. Syntetiske data og deres betydning for udviklingen af din virksomhed
  99. Top AI søgemaskiner. Hvor skal man lede efter AI-værktøjer?
  100. Video AI. De nyeste AI videogeneratorer
  101. AI til ledere. Hvordan AI kan gøre dit arbejde lettere
  102. Hvad er nyt i Google Gemini? Alt hvad du behøver at vide
  103. AI i Polen. Virksomheder, møder og konferencer
  104. AI-kalender. Hvordan optimerer du din tid i en virksomhed?
  105. AI og fremtiden for arbejde. Hvordan forbereder du din virksomhed på forandring?
  106. AI stemmekloning til erhvervslivet. Hvordan opretter man personlige stemmemeddelelser med AI?
  107. "Vi er alle udviklere". Hvordan kan borgerudviklere hjælpe din virksomhed?
  108. Faktatjek og AI-hallucinationer
  109. AI i rekruttering – udvikling af rekrutteringsmaterialer trin for trin
  110. Sora. Hvordan vil realistiske videoer fra OpenAI ændre erhvervslivet?
  111. Midjourney v6. Innovationer inden for AI-billedgenerering
  112. AI i SMV'er. Hvordan kan SMV'er konkurrere med giganter ved hjælp af AI?
  113. Hvordan ændrer AI influencer marketing?
  114. Er AI virkelig en trussel mod udviklere? Devin og Microsoft AutoDev
  115. De bedste AI-chatbots til e-handel. Platforme
  116. AI chatbots til e-handel. Case studier
  117. Hvordan holder man sig opdateret om, hvad der sker i AI-verdenen?
  118. At tæmme AI. Hvordan tager man de første skridt til at anvende AI i sin virksomhed?
  119. Perplexity, Bing Copilot eller You.com? Sammenligning af AI-søgemaskiner
  120. AI-eksperter i Polen
  121. ReALM. En banebrydende sprogmodel fra Apple?
  122. Google Genie — en generativ AI-model, der skaber fuldt interaktive verdener ud fra billeder
  123. Automatisering eller augmentation? To tilgange til AI i en virksomhed
  124. LLMOps, eller hvordan man effektivt håndterer sprogmodeller i en organisation
  125. AI videoproduktion. Nye horisonter inden for videoinholdproduktion for virksomheder
  126. De bedste AI transskriptionsværktøjer. Hvordan omdanner man lange optagelser til præcise resuméer?
  127. Sentimentanalyse med AI. Hvordan hjælper det med at drive forandring i erhvervslivet?
  128. Rollen af AI i indholdsmoderation