X
Nordic region's business magazine • januari 20, 2026
gmsa NEWS
  • Nyheter
  • Infrastruktur
  • Transport
  • Järnväg
  • Hamn
  • Kontakta oss
Prenumerera
Logga in
  • Nyheter
  • Infrastruktur
  • Transport
  • Järnväg
  • Hamn
  • Kontakta oss
  • Nyheter
  • Infrastruktur
  • Transport
  • Järnväg
  • Hamn
  • Kontakta oss

Nya innovationer från NVIDIA och Dell revolutionerar AI-prestanda

Publicerad januari 20, 2026

NVIDIA och Dell har nyligen introducerat en banbrytande metod för att förbättra hastigheten på svar från stora språkmodeller. Detta görs genom att flytta KV-cachen, som lagrar information om aktuella konversationer och dokument, från GPU:ns begränsade minneskapacitet till mer tillgängliga lagringslösningar.

Under modellens arbete skapas nycklar och värden som är avgörande för AI:s förståelse av sammanhang. När dessa data får plats i GPU:ns snabba minne genereras svar effektivt. Men när kontexten expanderar, växer också cachen, vilket leder till långsammare svar och ökad energiförbrukning. Genom att avlasta KV-cachen till större minnes- och lagringssystem kan GPU:erna fokusera på beräkningar, vilket möjliggör snabbare svar och ett bättre resursutnyttjande.

NVIDIA:s BlueField-4 och den nya plattformen Context Memory Storage (CMS), i samarbete med Dells lagringslösningar PowerScale, ObjectScale och Project Lightning, förbättrar effektiviteten i inferensen och underlättar skalning.

BlueField-4 för CMS skapar ett dedikerat minneslager som sammankopplar det snabba, men begränsade, GPU-minnet med traditionell lagring. Detta leder till förbättrad användning av GPU:er vid längre resonemang, lägre latens i realtidsdialoger och högre prestanda per watt.

Från början kan tydliga prestandaförbättringar observeras. Dells avlastning av KV-cache kan resultera i upp till 19 gånger snabbare första svar (TTFT, Time to First Token) och upp till 5,3 gånger fler förfrågningar per sekund. För organisationer som inte ännu har implementerat BlueField-4, eller som behöver mer lagringsutrymme, erbjuds en mjukvarustack som förenar LMCache och NVIDIA NIXL med Dells lagringslösningar. Detta möjliggör att KV-cachen flyttas till fil- eller objektlagring via RDMA, vilket bibehåller ett konstant dataflöde.

För organisationer innebär detta en konkret ekonomisk fördel. Kostnaderna kan reduceras genom att det inte längre är nödvändigt att investera i fler kostsamma GPU:er för att hantera minnet. Dessutom förbättrar den ökade kapaciteten att hantera kontext att modeller bättre kan minnas samtal, sammanfatta större dokument och ge mer relevanta och personliga svar över tid.

Genom att utveckla ett öppet ekosystem skapar NVIDIA och Dell en omfattande AI-fabrik som stödjer organisationer i att snabbare nå resultat från sina idéer, oavsett om fokus ligger på ultralåg latens med BlueField-4 eller på stor skala med PowerScale och ObjectScale.

Mest lästa
  1. Osäker framtid för förnybar bensin i Sverige

  2. Effektiv digital lösning för byggbranschen

  3. Hållbar masshantering i Ostlänken

my code
Fler intressanta artiklar

Advania utökar sin automationsexpertis genom förvärv av Evolv Robotics

Publicerad juni 4, 2026

Advania Group har genomfört ett förvärv av Evolv Robotics, en specialist på verksamhetsautomation från Island. Detta förvärv ger Advania tillgång till ett team av 30 automationsingenjörer och etablerar en dedikerad…

Extrem elbil från Mercedes-AMG lanseras i Sverige

Publicerad juni 3, 2026

Den senaste modellen av Mercedes-AMG GT 4-Dörrars Coupé har nyligen haft sin världspremiär och står nu redo för säljstart i Sverige. Den innovativa eldrivna bilen erbjuder imponerande 1169 hästkrafter och…

Ökning av begagnade elbilar på landsbygden

Publicerad juni 3, 2026

Försäljningen av begagnade elbilar visar nu en markant ökning på landsbygden, vilket framgår av nya data från Riddermark Bil. Kommuner utanför storstäderna uppvisar den mest signifikanta tillväxten under 2026, medan…

Stockholm Digital Sandbox: En väg mot smartare städer

Publicerad juni 3, 2026

Den nyligen invigda Stockholm Digital Sandbox markerar ett betydande steg mot en hållbar framtid för staden. Denna testmiljö syftar till att främja samarbete mellan forskare, offentlig sektor och näringsliv för…

Omoda och Jaecoo tar steget in på den nordiska marknaden med stark europeisk tillväxt

Publicerad juni 3, 2026

Omoda och Jaecoo har snabbt nått 50 000 sålda bilar i Storbritannien på bara ett år. Under 2025 översteg försäljningen i Europa 200 000 enheter. Märket planerar att lanseras under…

AI-lösningar för industrin: Ett forskningsinitiativ vid Jönköping University

Publicerad juni 3, 2026

Många företag inom industrisektorn har utmaningar med att implementera generella AI-språkmodeller. För att addressa detta problem, har forskare vid Jönköping University inlett ett nytt projekt. Syftet är att utveckla AI-lösningar…

Trejon introducerar Multicargo MC26R: Kapacitetsökning och modern design

Publicerad juni 2, 2026

Trejon fortsätter att förbättra sitt sortiment av volymvagnar med lanseringen av den nya modellen Multicargo MC26R, skapad för professionella användare med krav på kapacitet och effektivitet. Denna volymdumper breddar nu…

Nya mått för att mäta energiproduktivitet i datacenter

Publicerad juni 2, 2026

Hanna Oredsson, försäljningsansvarig Secure Power, Schneider Electric Sverige, påpekar att när datacenter kräver mer effekt, är det otillräckligt att endast mäta hur effektivt elen används. Det är nödvändigt att även…

Soltech Energy Solutions etablerar sig i Norge med jättestor batteripark

Publicerad juni 2, 2026

Soltech Energy Solutions har ingått avtal för att bygga Norges största batteripark kopplad till vindkraft utanför Stavanger. Avtalet omfattar ett batterilager på 11,3 MW/22,6 MWh samt ett tioårigt drift- och…

Förbättrade trygghetslösningar för ensamarbete krävs nu

Publicerad juni 2, 2026

Christoffer Wiklander, tf vd på Crystal Alarm, framhäver vikten av att satsa på bättre säkerhetslösningar för ensamarbete. I Sverige arbetar cirka 10 % av befolkningen regelbundet ensamma, vilket medför flera…
GMSA NEWS
  • Integritetspolicy
  • Om oss
  • Cookiepolicy

Infrastrukturen

Kategorier

mail Created with Sketch Beta.