Oracle har utökat sitt samarbete med NVIDIA för att inkludera körning av strategiska NVIDIA AI-applikationer på den nya Oracle Cloud Infrastructure (OCI) Supercluster.
NVIDIA har valt OCI som den första hyperskaliga molnleverantören som erbjuder NVIDIA DGX Cloud, en AI superdatortjänst, i massiv skala.
Dessutom kör NVIDIA AI Foundations, sina nya generativa AI-molntjänster, som är tillgängliga via DGX Cloud, på OCI.
“OCI är den första plattformen som erbjuder en AI-superdator i stor skala till tusentals kunder inom alla branscher. Detta är en kritisk kapacitet eftersom allt fler organisationer behöver datorresurser för sina unika AI-användningsfall. För att stödja denna efterfrågan fortsätter vi att utöka vårt samarbete med NVIDIA”, säger Clay Magouyrk, Executive Vice President, Oracle Cloud Infrastructure.
“De gränslösa möjligheterna till AI-driven innovation bidrar till att omvandla praktiskt taget alla företag. NVIDIAs samarbete med Oracle Cloud Infrastructure gör att den extraordinära superdatorprestandan i NVIDIAs accelererade beräkningsplattform är inom räckhåll för varje företag“, säger Manuvir Das, vice president för enterprise computing, NVIDIA.
OCI:s nya superkluster
NVIDIA DGX Cloud och NVIDIA AI Foundations-tjänsterna som körs på den utnyttjar OCI:s unika Supercluster som certifierades av NVIDIA för att säkerställa att den uppfyller de höga standarderna för DGX Cloud.
OCI:s Supercluster omfattar OCI Compute Bare Metal, ett RoCE-kluster med extremt låg latenstid baserat på NVIDIA-nätverk och ett val av HPC-lagring. Det har installerats och validerats av NVIDIA för att stödja tusentals OCI Compute Bare Metal-instanser som effektivt kan bearbeta massivt parallella tillämpningar. OCI Supercluster-nätverk kan nu skalas upp till 4 096 OCI Compute Bare Metal-instanser med 32 768 A100 GPU:er. OCI Compute Bare Metal-instanser med NVIDIA H100 GPU:er finns nu i begränsad omfattning.
Dessutom meddelade NVIDIA att Oracle lägger till NVIDIA BlueField-3 DPU:er i sin nätverksstack.
Generativa AI-tjänster för att bygga skräddarsydda företagsmodeller
NVIDIA AI Foundations modelleringstjänster omfattar språk, bilder, video och 3D samt biologi. Företag kan använda språktjänsten NVIDIA NeMo™ och bild-, video- och 3D-tjänsterna NVIDIA Picasso för att bygga egna, domänspecifika, generativa AI-applikationer för intelligent chatt och kundsupport, skapande av professionellt innehåll, digital simulering med mera. För utbildning och inferens av AI-modeller inom biologi erbjuder molntjänsten NVIDIA BioNeMo™ verktyg för att snabbt anpassa och driftsätta generativa AI-applikationer.
På OCI drar anpassade modeller som byggs med NVIDIA AI Foundations och modellfamiljer som GPT-3 nytta av OCI Supercluster, som innehåller specialbyggt RDMA-nätverk som ger prestanda nära linjeläget med mikrosekunders latenstid och eliminerar blockeringsproblem för RDMA-beroende arbetsbelastningar.