- GPU e re Blackwell, NVLink dhe teknologjitë e elasticitetit mundësojnë modele të inteligjencës artificiale në shkallë trilion parametrash
- Bërthamat e reja tensor dhe përpiluesi TensorRT- LLM reduktojnë koston operative dhe energjinë e konkluzioneve të LLM deri në 25x
- Përshpejtuesit e rinj mundësojnë përparime në përpunimin e të dhënave, simulimin inxhinierik, automatizimin e dizajnit elektronik, dizajnimin e ilaçeve me ndihmën e kompjuterit dhe llogaritjen kuantike
- Adoptim i përhapur nga çdo ofrues kryesor i reve kompjuterike, prodhues serverësh dhe kompani udhëheqëse e AI
GTC-Duke fuqizuar një epokë të re të informatikës, NVIDIA njoftoi sot se platforma NVIDIA Blackwell ka mbërritur – duke u mundësuar organizatave kudo që të ndërtojnë dhe ekzekutojnë AI gjeneruese në kohë reale në modele të gjuhëve të mëdha me trilion parametra me deri në 25 herë më pak kosto dhe konsum energjie se paraardhësi i saj.
Arkitektura GPU Blackwell përmban gjashtë teknologji transformuese për llogaritjen e përshpejtuar, të cilat do të ndihmojnë në zhbllokimin e përparimeve në përpunimin e të dhënave, simulimin inxhinierik, automatizimin e dizajnit elektronik, dizajnin e ilaçeve me ndihmën e kompjuterit, llogaritjen kuantike dhe AI gjeneruese – të gjitha mundësitë në zhvillim të industrisë për NVIDIA.
“Për tre dekada ne kemi ndjekur llogaritjen e përshpejtuar, me qëllimin për të mundësuar përparime transformuese si mësimi i thellë dhe AI”, tha Jensen Huang, themeluesi dhe CEO i NVIDIA. “Inteligjenca artificiale gjeneruese është teknologjia përcaktuese e kohës sonë. Blackwell është motori për të fuqizuar këtë revolucion të ri industrial. Duke punuar me kompanitë më dinamike në botë, ne do të realizojmë premtimin e AI për çdo industri.”
Midis shumë organizatave që pritet të miratojnë Blackwell janë Shërbimet Ueb Amazon, Dell Technologies, Google, Meta, Microsoft, OpenAI, Oracle, Tesla dhe xAI.
Sundar Pichai, CEO i Alphabet dhe Google: “Shkallëzimi i shërbimeve si Search dhe Gmail për miliarda përdorues na ka mësuar shumë rreth menaxhimit të infrastrukturës kompjuterike. Ndërsa hyjmë në ndryshimin e platformës së AI, ne vazhdojmë të investojmë thellë në infrastrukturë për produktet dhe shërbimet tona, dhe për klientët tanë të Cloud. Ne jemi me fat që kemi një partneritet të gjatë me NVIDIA dhe presim me padurim të sjellim aftësitë përparimtare të GPU-së Blackwell te klientët tanë të Cloud dhe ekipet në të gjithë Google, duke përfshirë Google DeepMind, për të përshpejtuar zbulimet e ardhshme.
Andy Jassy, president dhe CEO i Amazon: “Bashkëpunimi ynë i thellë me NVIDIA ka më shumë se 13 vjet, kur lançuam shembullin e parë në botë të resë GPU në AWS. Sot ne ofrojmë gamën më të gjerë të zgjidhjeve GPU të disponueshme kudo në renë kompjuterike, duke mbështetur ngarkesat e punës të përshpejtuara më të avancuara teknologjikisht në botë. Kjo është arsyeja pse GPU-ja e re NVIDIA Blackwell do të funksionojë aq mirë në AWS dhe arsyeja që NVIDIA zgjodhi AWS për të bashkë-zhvilluar Projektin Ceiba, duke kombinuar Superçipet e gjeneratës së ardhshme Grace Blackwell të NVIDIA me virtualizimin e avancuar të sistemit AWS Nitro dhe rrjetin ultra të shpejtë Elastic Fabric , për kërkimin dhe zhvillimin e vetë AI të NVIDIA. Përmes kësaj përpjekjeje të përbashkët midis inxhinierëve AWS dhe NVIDIA, ne po vazhdojmë të inovojmë së bashku për ta bërë AWS vendin më të mirë për këdo që të ekzekutojë GPU-të NVIDIA në cloud.”
Michael Dell, themelues dhe CEO i Dell Technologies: “Inteligjenca artificiale gjeneruese është thelbësore për krijimin e sistemeve më të zgjuara, më të besueshme dhe efikase. Dell Technologies dhe NVIDIA po punojnë së bashku për të formuar të ardhmen e teknologjisë. Me lançimin e Blackwell, ne do të vazhdojmë t’u ofrojmë klientëve tanë gjeneratën e ardhshme të produkteve dhe shërbimeve të përshpejtuara, duke u ofruar atyre mjetet që u nevojiten për të nxitur inovacionin në të gjithë industritë.”
Demis Hassabis, bashkëthemelues dhe CEO i Google DeepMind: “Potenciali transformues i AI është i jashtëzakonshëm dhe do të na ndihmojë të zgjidhim disa nga problemet më të rëndësishme shkencore në botë. Aftësitë e reja teknologjike të Blackwell do të ofrojnë llogaritjen kritike të nevojshme për të ndihmuar mendjet më të ndritura të botës të hartojnë zbulime të reja shkencore.
Mark Zuckerberg, themelues dhe CEO i Meta: “AI tashmë fuqizon gjithçka, nga modelet tona të mëdha gjuhësore te rekomandimet tona të përmbajtjes, reklamat dhe sistemet e sigurisë, dhe kjo do të bëhet më e rëndësishme në të ardhmen. Ne mezi presim të përdorim Blackwell të NVIDIA për të ndihmuar në trajnimin e modeleve tona Llama me burim të hapur dhe për të ndërtuar gjeneratën e ardhshme të Meta AI dhe produkteve të konsumit.”
Satya Nadella, kryetar ekzekutiv dhe CEO i Microsoft: “Ne jemi të përkushtuar t’u ofrojmë klientëve tanë infrastrukturën më të avancuar për të fuqizuar ngarkesat e tyre të AI. Duke sjellë procesorin GB200 Grace Blackwell në qendrat tona të të dhënave globalisht, ne po ndërtojmë historinë tonë të gjatë të optimizimit të GPU-ve NVIDIA për cloud-in tonë, pasi ne e bëjmë premtimin e AI të vërtetë për organizatat kudo”.
Sam Altman, CEO i OpenAI: “Blackwell ofron kërcime masive të performancës dhe do të përshpejtojë aftësinë tonë për të ofruar modele të avancuara. Jemi të entuziazmuar që vazhdojmë të punojmë me NVIDIA për të përmirësuar llogaritjen e AI.”
Larry Ellison, kryetar dhe CTO i Oracle: “Bashkëpunimi i ngushtë i Oracle me NVIDIA do të mundësojë përparime cilësore dhe sasiore në AI, mësimin e makinerive dhe analitikën e të dhënave. Në mënyrë që klientët të zbulojnë njohuri më të zbatueshme, nevojitet një motor edhe më i fuqishëm si Blackwell, i cili është ndërtuar me qëllim për llogaritjen e përshpejtuar dhe AI gjeneruese.”
Elon Musk, CEO i Tesla dhe xAI: “Aktualisht nuk ka asgjë më të mirë se hardueri NVIDIA për AI.”
E emëruar për nder të David Harold Blackwell – një matematikan i specializuar në teorinë dhe statistikat e lojërave, dhe studiuesi i parë me ngjyrë i futur në Akademinë Kombëtare të Shkencave – arkitektura e re pason arkitekturën NVIDIA Hopper™, e lançuar dy vjet më parë.
Inovacionet e Blackwell për të ushqyer kompjuterin e përshpejtuar dhe AI gjeneruese
Gjashtë teknologjitë revolucionare të Blackwell, të cilat së bashku mundësojnë trajnimin e AI dhe konkluzionet LLM në kohë reale për modelet që shkallëzojnë deri në 10 trilion parametra, përfshijnë:
- Çipi më i fuqishëm në botë — Të mbushura me 208 miliardë tranzistorë, GPU-të e arkitekturës Blackwell prodhohen duke përdorur një proces 4NP TSMC të ndërtuar me porosi me GPU me kufi me dy rrjeta të lidhura nga 10 TB/sekondë lidhje çip-to-çip në një GPU të vetme, të unifikuar.
- Motori transformator i gjeneratës së dytë — E ushqyer nga mbështetja e re për shkallëzimin e mikro-tensorit dhe algoritmet e avancuara të menaxhimit të diapazonit dinamik të NVIDIA të integruara në kornizat NVIDIA TensorRT™-LLM dhe NeMo Megatron, Blackwell do të mbështesë dyfishin e madhësive të llogaritjes dhe modelit me aftësi të reja konkluzionesh AI me pikë lundruese 4-bit.
- NVLink i Gjeneratës së Pestë — Për të përshpejtuar performancën për modelet e inteligjencës artificiale me shumë miliardë parametra dhe me përzierje ekspertësh, përsëritja më e fundit e NVIDIA NVLink® jep xhiro novator 1,8 TB/s dydrejtimëshe për GPU, duke siguruar komunikim pa ndërprerje me shpejtësi të lartë midis deri në 576 GPU për më komplekset LLM.
- Motori RAS — GPU-të me fuqi Blackwell përfshijnë një motor të dedikuar për besueshmërinë, disponueshmërinë dhe shërbimin. Për më tepër, arkitektura Blackwell shton aftësi në nivelin e çipit për të përdorur mirëmbajtjen parandaluese të bazuar në AI për të kryer diagnostikimin dhe parashikimin e çështjeve të besueshmërisë. Kjo maksimizon kohën e funksionimit të sistemit dhe përmirëson elasticitetin për vendosjet në shkallë masive të AI për të funksionuar pa ndërprerje për javë apo edhe muaj në një kohë dhe për të reduktuar kostot e funksionimit.
- AI i sigurt — Aftësitë e avancuara konfidenciale informatike mbrojnë modelet e AI dhe të dhënat e klientëve pa kompromentuar performancën, me mbështetje për protokollet e reja të kriptimit të ndërfaqes vendase, të cilat janë kritike për industritë e ndjeshme ndaj privatësisë si kujdesi shëndetësor dhe shërbimet financiare.
- Motori i dekompresionit — Një motor dekompresimi i dedikuar mbështet formatet më të fundit, duke përshpejtuar kërkesat e bazës së të dhënave për të ofruar performancën më të lartë në analitikën e të dhënave dhe shkencën e të dhënave. Në vitet e ardhshme, përpunimi i të dhënave, për të cilin kompanitë shpenzojnë dhjetëra miliarda dollarë në vit, do të përshpejtohet gjithnjë e më shumë nga GPU.
Një superçip masiv
NVIDIA GB200 Grace Blackwell Superchip lidh dy GPU NVIDIA B200 Tensor Core me CPU-në NVIDIA Grace mbi një ndërlidhje 900 GB/s NVLink-çip me çip me fuqi ultra të ulët.
Për performancën më të lartë të AI, sistemet me fuqi GB200 mund të lidhen me platformat NVIDIA Quantum-X800 InfiniBand dhe Spectrum™-X800 Ethernet, të shpallura gjithashtu sot, të cilat ofrojnë rrjete të avancuara me shpejtësi deri në 800 Gb/s.
GB200 është një komponent kyç i NVIDIA GB200 NVL72, një sistem me shumë nyje, i ftohur me lëng, në shkallë rafti për ngarkesat e punës më intensive llogaritëse. Ai kombinon 36 Superchips Grace Blackwell, të cilat përfshijnë 72 GPU Blackwell dhe 36 CPU Grace të ndërlidhura nga NVLink i gjeneratës së pestë. Për më tepër, GB200 NVL72 përfshin njësi të përpunimit të të dhënave NVIDIA BlueField®-3 për të mundësuar përshpejtimin e rrjetit cloud, ruajtjen e kompozueshme, sigurinë me zero besim dhe elasticitetin e llogaritjes së GPU-së në retë AI në shkallë të lartë. GB200 NVL72 siguron një rritje të performancës deri në 30 herë në krahasim me të njëjtin numër GPU-je NVIDIA H100 Tensor Core për ngarkesat e punës së konkluzionit LLM dhe redukton koston dhe konsumin e energjisë deri në 25x.
Platforma vepron si një GPU e vetme me 1.4 ekzaflops të performancës së AI dhe 30 TB memorie të shpejtë, dhe është një bllok ndërtimi për DGX SuperPOD më të ri.
NVIDIA ofron HGX B200, një bord serveri që lidh tetë GPU B200 përmes NVLink për të mbështetur platformat gjenerative AI të bazuara në x86. HGX B200 mbështet shpejtësinë e rrjetit deri në 400 Gb/s përmes platformave të rrjetit NVIDIA Quantum-2 InfiniBand dhe Spectrum-X Ethernet.
Rrjeti Global i Partnerëve Blackwell
Produktet me bazë Blackwell do të jenë të disponueshme nga partnerët duke filluar nga fundi i këtij viti.
AWS, Google Cloud, Microsoft Azure dhe Oracle Cloud Infrastructure do të jenë ndër ofruesit e parë të shërbimeve cloud që do të ofrojnë shembuj të fuqizuar nga Blackwell, siç do të bëjnë kompanitë e programeve NVIDIA Cloud Partner, Applied Digital, CoreWeave, Crusoe, IBM Cloud dhe Lambda. Retë sovrane të AI do të ofrojnë gjithashtu shërbime dhe infrastrukturë cloud të bazuara në Blackwell, duke përfshirë Indosat Ooredoo Hutchinson, Nebius, Nexgen Cloud, Oracle EU Sovereign Cloud, Oracle SHBA, MB dhe Retë e Qeverisë Australiane, Scaleway, Singtel, Taiga Cloud e Northern Data Group. Shakti Cloud dhe YTL Power International i Yotta Data Services.
GB200 do të jetë gjithashtu i disponueshëm në NVIDIA DGX™ Cloud, një platformë AI e bashkë-inxhinieruar me ofruesit kryesorë të shërbimeve cloud që u jep zhvilluesve të ndërmarrjeve akses të dedikuar në infrastrukturën dhe softuerin e nevojshëm për të ndërtuar dhe vendosur modele të avancuara gjeneruese të AI. AWS, Google Cloud dhe Oracle Cloud Infrastructure planifikojnë të presin raste të reja të bazuara në NVIDIA Grace Blackwell më vonë këtë vit.
Cisco, Dell, Hewlett Packard Enterprise, Lenovo dhe Supermicro pritet të ofrojnë një gamë të gjerë serverësh të bazuar në produktet Blackwell, siç janë Aivres, ASRock Rack, ASUS, Eviden, Foxconn, GIGABYTE, Inventec, Pegatron, QCT, Wistron, Wiwynn dhe Sistemet ZT.
Për më tepër, një rrjet në rritje i krijuesve të softuerëve, duke përfshirë Ansys, Cadence dhe Synopsys – liderë globalë në simulimin inxhinierik – do të përdorin procesorë të bazuar në Blackwell për të përshpejtuar softuerin e tyre për projektimin dhe simulimin e sistemeve dhe pjesëve elektrike, mekanike dhe prodhuese. Klientët e tyre mund të përdorin AI gjeneruese dhe informatikë të përshpejtuar për të sjellë produktet në treg më shpejt, me kosto më të ulët dhe me efikasitet më të lartë të energjisë.
Mbështetje e softuerit NVIDIA
Portofoli i produkteve Blackwell mbështetet nga Ndërmarrja NVIDIA AI, sistemi operativ nga fundi në fund për AI të shkallës së prodhimit. NVIDIA AI Enterprise përfshin Mikroshërbimet e konkluzionit NVIDIA NIM™ – u njoftua gjithashtu sot – si dhe kornizat, bibliotekat dhe mjetet e AI që ndërmarrjet mund të vendosin në retë e përshpejtuara nga NVIDIA, qendrat e të dhënave dhe stacionet e punës.
Për të mësuar më shumë rreth platformës NVIDIA Blackwell, shikoni Kryefjala e GTC dhe regjistrohuni për të marrë pjesë në seancat nga NVIDIA dhe udhëheqësit e industrisë në GTC, e cila zgjat deri më 21 mars.