Xilinx gör allt på en gång

Kampen står mellan CPUer, DSPer, GPUer, AI-hårdvara eller FPGAer. I det läget satsar Xilinx på – allt. Företagets nya Versal-serie kombinerar allt utom möjligen konventionella GPUer. Och i 7 nm FinFET får man plats med väldigt mycket av allt.

Versal är ett stort steg framåt, men det ställer också krav på Xilinx-organisationen. Företaget har länge haft ett stort mjukvarufokus, men det är inte mycket i jämförelse med allt det som krävs i den nya satsningen. Samtidigt är de möjliga vinsterna större än någonsin tidigare.

AI kräver accelerator
Mycket handlar förstås om artificiell intelligens, AI. AI kommer snart att finnas överallt och tekniken kräver dramatiskt ökade datorprestanda.

Alla har väl vid det här laget märkt att vanliga mikroprocessorer inte hänger med i prestandaracet. I och för sig går det bra att öka antalet processorer nästan obegränsat, men det hjälper inte. De stora förändringar i mjukvaruarkitektur som skulle ha krävts för att klara massiv parallellbearbetning blev aldrig gjorda och nu är det förmodligen för sent. Ingen orkar skriva om ”legacy”-mjukvaran.

I stället är det acceleratorer som gäller. De mest tidskritiska och prestandakrävande arbetsuppgifterna läggs över på optimerade acceleratorer. Att programmera acceleratorerna är visserligen jobbigt, men det handlar i alla fall om begränsade uppgifter.

Började med grafik
Alltsammans startade egentligen på åttiotalet, med grafikacceleratorer. Att driva en hyfsat avancerad grafik direkt från den tidens mikroprocessorer blev snabbt omöjligt. I stället kom enkla och senare mera avancerade acceleratorer som kunde avlasta huvudprocessorn.

Det här utvecklades med tiden till egna arkitekturer, baserade på massivt parallella grafikprocessorer, GPUer. Sedan var steget inte långt till att använda GPUer även för att avlasta huvudprocessorerna från andra uppgifter än grafik, till exempel AI-baserade algoritmer. Där står vi idag.

DSP och AI-hårdvara
På senare tid har kampen om acceleratorarkitekturen hettat till ordentligt. Företag som Nvidia har tagit fram nya arkitekturer och komponenter. IP-tillverkare som Tensilica och andra har utvecklat DSP-baserade lösningar, framför allt till bärbara utrustningar. FPGA-tillverkare som Xilinx och Altera insåg dessutom tidigt att deras teknik kunde användas för att skapa flexibla acceleratorer.

Xilinx satsar fullt ut
Kriget mellan de olika arkitekturerna är i och för sig intressant, men problemet är att de alla har sina fördelar och nackdelar. Därför beslutade sig Xilinx för att ta tjuren vid hornen och integrera alla de olika arkitekturerna i samma komponent.

I de nya VERSAL-komponenterna finns därför stora block av programmerbar logik, stora block av massivt parallella AI-processorer (VLIW-baserade) och massor av signalprocessorer. Alltsammans knyts ihop med ett NoC, alltså ett mycket snabbt internt nätverk. Naturligtvis finns dessutom ett antal ARM-kärnor (Cortex A-72 och R5).

Också kommunikationen utåt går via NoC-nätverket. Där finns allt från snabba DRAM-gränssnitt (t ex LPDDR-4266) och PCIe-gränssnitt till 600 Gbit Ethernet/Interlaken. Plus förstås ”vanliga” multirate 100 Gbit Ethernet.

7 nm räcker långt
För att få plats med allt använder Xilinx TSMCs senaste 7 nm-process. Då går det integrera hundratals AI-processorer och tusentals signalprocessorer tillsammans med massor av FPGA-logik och minne.

Domänspecifikt
Kommer då Xilinx att lyckas med sin satsning? Ja, tidpunkten är i alla fall väl vald. Allt större del av de krävande arbetsuppgifterna går inte längre att hantera med konventionella mikroprocessorer.

Jag hade tidigare i dag (här i San Jose) ett samtal med Salil Raje, ansvarig för mjukvara och IP hos Xilinx. Han var övertygad om att domänspecifika arkitekturer kommer att ta över en mycket stor del av databearbetningen inom en snar framtid. Enligt Salil handlar det om ganska många olika arkitekturer och dessutom möjligheten att optimera arkitekturerna för olika tillämpningar.

Det räcker alltså inte att ha en AI-arkitektur med massor av breda VLIW-processorer. Man måste kunna optimera och finputsa för att nå hela vägen.

Domänspecifik mjukvara
Tar man det hela ytterligare ett steg minskar också betydelsen av generella programspråk. Domänspecifika högnivåspråk för AI och grafik finns redan och det är inte svårt att tänka sig en fortsättning på den vägen.

Kan vara helt rätt
Så det är väl inte omöjligt att Xilinx har satsat alldeles rätt. Marknaden för acceleratorkort till datorhallar kan mycket väl explodera och då finns det mycket pengar att tjäna. Sedan har vi telekommarknaden, där Xilinx redan har en bra position. Där behövs mycket mer datakraft och dessutom AI-funktioner.

Och till slut handlar det förstås om autonoma fordon. Där finns jättevolymer och mycket stora prestandabehov.

Intressant blir det i alla fall.

One Response to “Xilinx gör allt på en gång”

  1. Jätteintressant artikel Göte. Tack!