Νέα Γενιά Επεξεργαστικών Μονάδων: Η Απίστευτη Διαδρομή της Nvidia με την Κυκλοφορία του Blackwell B200 GPU

19 Μαρτίου, 2024
by
A Leap Forward: Nvidia Unveils the Blackwell B200 GPU

Η Nvidia έχει σημειώσει σημαντικές προόδους στην αγορά των επεξεργαστικών μονάδων τεχνητής νοημοσύνης με το πολύ ζητούμενο H100 AI chip της, ξεπερνώντας την αξία της εταιρείας προς τα εμπρός από τιτάνες της τεχνολογίας όπως η Alphabet και η Amazon. Τώρα, η Nvidia είναι έτοιμη να διευρύνει ακόμη περισσότερο την προηγούμενή της με την εισαγωγή του νέου Blackwell B200 GPU και του GB200 “superchip.”

Το Blackwell B200 GPU διαθέτει εντυπωσιακά 208 δισεκατομμύρια μεταγωγείς, προσφέροντας έως 20 petaflops απόδοσης FP4. Η Nvidia υποστηρίζει ότι σε συνδυασμό με ένα μόνο CPU Grace, ο GB200 superchip μπορεί να προσφέρει έως και 30 φορές την απόδοση για τις εργασίες φόρτισης LLM ενώ ταυτόχρονα παρέχει σημαντική ενεργειακή αποδοτικότητα. Αναφέρεται ότι μειώνει το κόστος και την κατανάλωση ενέργειας έως και 25 φορές σε σύγκριση με το H100.

Η εκπαίδευση ενός μοντέλου με 1,8 τρισεκατομμύρια παραμέτρους απαιτούσε προηγουμένως 8.000 Hopper GPUs και 15 μεγαβάτ ρεύματος, αλλά η Nvidia υποστηρίζει ότι με μόλις 2.000 Blackwell GPUs, η ίδια εργασία μπορεί να εκτελεστεί με μόλις τέσσερα μεγαβάτ ρεύματος. Ο GB200 επίσης επιδεικνύει σημαντικές βελτιώσεις στην απόδοση, με επτά φορές την απόδοση και τέσσερις φορές την ταχύτητα εκπαίδευσης σε σύγκριση με το H100, σύμφωνα με τις δοκιμές αναφοράς της Nvidia σε ένα GPT-3 benchmark LLM με 175 δισεκατομμύρια παραμέτρους.

Η Nvidia αποδίδει αυτές τις προόδους σε δύο κύριους παράγοντες. Πρώτον, οι Blackwell GPUs χρησιμοποιούν μια μηχανή μετασχηματισμού δεύτερης γεννεάς που διπλασιάζει τον υπολογισμό, της θώρακα και το μέγεθος του μοντέλου χρησιμοποιώντας τέσσερα bits για κάθε νευρώνα αντί για οκτώ. Δεύτερον, ένας μεταγωγέας NVLink επόμενης γενιάς επιτρέπει άκαμπτη επικοινωνία μεταξύ μεγάλου αριθμού GPUs. Αυτή η εναλλαγή επιτρέπει σε 576 GPUs να αλληλεπιδρούν μεταξύ τους, επιδεικνύοντας τα 1,8 terabytes ανά δευτερόλεπτο δικόδιες ροές επικοινωνίας. Για να επιτύχει αυτό, η Nvidia ανέπτυξε ένα νέο chip μεταγωγής δικτύου με 50 δισεκατομμύρια μεταγωγείς και τις δικές του υπολογιστικές ικανότητες.

Προηγουμένως, η Nvidia αντιμετώπιζε φραγμούς επικοινωνίας, με μόλις 16 GPUs που ξόδευαν το 60% του χρόνου τους ανταλλάσοντας δεδομένα αντί να υπολογίζουν. Ωστόσο, η αρχιτεκτονική Blackwell αντιμετωπίζει αυτήν την πρόκληση, επιτρέποντας καλύτερη χρήση της υπολογιστικής ισχύος.

Η Nvidia προβλέπει σημαντική ζήτηση για αυτά τα GPUs και έχει σχεδιάσει μεγαλύτερα πακέτα για να την φιλοξενήσει. Για παράδειγμα, ο GB200 NVL72 ενσωματώνει 36 CPUs και 72 GPUs σε ένα μόνο rack, ψύχος υγρού, παρέχοντας εντυπωσιακή απόδοση φόρτισης AI ή ενδείξεις διάγνωσης. Σημαντικοί παροχείς υπηρεσιών Cloud όπως η Amazon, το Google, το Microsoft και η Oracle έχουν εκφράσει ενδιαφέρον να προσφέρουν αυτά τα ράφια.

Η Nvidia στοχεύει επίσης να παρέχει ολοκληρωμένες λύσεις στις εταιρείες με το DGX Superpod for DGX GB200. Αυτό το σύστημα συνδυάζει οκτώ μονάδες σε μία, παρουσιάζοντας 288 CPUs, 576 GPUs, 240TB μνήμη και εντυπωσιακή δύναμη υπολογισμού 11,5 exaflops FP4.

Η προοπτική της Nvidia ξεπερνά τις μεμονωμένες μονάδες GPU. Αυτήν είναι σημαντική ζήτηση για αυτά τα GPUs και έχει σχεδιάσει μεγαλύτερες συσκευασίες για να το υποστηρίξει. Για παράδειγμα, ο GB200 NVL72 ενσωματώνει 36 CPUs και 72 GPUs σε ένα μόνο ψυγείο υγρού ψύξης, παρέχοντας εντυπωσιακή απόδοση εκπαίδευσης AI και απόδοσης διαγνωστικών δεικτών. Σημαντικοί παροχείς υπηρεσιών Cloud όπως η Amazon, το Google, το Microsoft και η Oracle έχουν ήδη εκφράσει το ενδιαφέρον τους να προσφέρουν αυτές τις οθόνες.

Η Nvidia στοχεύει επίσης να παρέχει ολοκληρωμένες λύσεις στις εταιρείες με το DGX Superpod for DGX GB200. Αυτό το σύστημα συνδυάζει οκτώ μονάδες σε μία, που παρουσιάζει 288 CPUs, 576 GPUs, 240TB μνήμη και 11,5 exaflops της FP4 ισχύς υπολογισμού.

Η προοπτική της Nvidia ξεπερνά τις μεμονωμένες μονάδες GPU. Αυτήν είναι σημαντική ζήτηση για αυτά τα GPUs και έχει σχεδιάσει μεγαλύτερες συσκευασίες για να το υποστηρίξει. Για παράδειγμα, ο GB200 NVL72 ενσωματώνει 36 CPUs και 72 GPUs σε ένα μόνο ράφι υγρής ψύξης, προσφέροντας εντυπωσιακή απόδοση εκπαίδευσης AI ή ενδείξεις διάγνωσης. Σημαντικοί πάροχοι υπηρεσιών Cloud, όπως η Amazon, το Google, το Microsoft και η Oracle, έχουν εκφράσει το ενδιαφέρον τους για την προσφορά τους.

Η προοπτική της Nvidia ξεπερνά τις μεμονωμένες μονάδες GPU. Αυτήν είναι σημαντική ζήτηση για αυτά τα GPUs και έχει σχεδιάσει μεγαλύτερες συσκευασίες για να την φιλοξενήσει.

Συχνές Ερωτήσεις

Τι είναι το Blackwell B200 GPU;
Το Blackwell B200 GPU είναι η τελευταία μονάδα επεξεργασίας γραφικών της Nvidia σχεδιασμένη για να παρέχει εξαιρετική απόδοση στον τομέα της τεχνητής νοημοσύνης.

Ποιά είναι η πλεονεκτική πλευρά του GB200 superchip;
Το GB200 superchip συνδυάζει δύο Blackwell B200 GPUs με ένα μόνο CPU Grace, προσφέροντας σημαντικές βελτιώσεις στην απόδοση και την ενεργειακή αποδοτικότητα για τις φόρτισης LLM.

Πώς η αρχιτεκτονική Blackwell ενισχύει την επικοινωνία μεταξύ των GPUs;
Η μηχανή μετασχηματισμού δεύτερης γενιάς των Blackwell GPUs διπλασιάζει τον υπολογισμό, το εύρος θώρακα, και το μέγεθος του μοντέλου χρησιμοποιώντας τέσσερα bits

The source of the article is from the blog zaman.co.at

Privacy policy
Contact

Don't Miss