Wprowadzenie
Nowoczesne operacje obliczeniowe na krzemie - i GPU stały się nowym złotem. Czy dla gier, badania AI, VFX, renderowanie 3D, kryptogórnictwo, lub centrum danych, popyt na potężne procesory graficzne wybuchł w ciągu ostatnich kilku lat. Efektem tego jest długotrwały, globalny niedobór GPU, który dotknął wszystkich, od indywidualnych konsumentów po dostawców chmur hiperskalowych.
To, co zaczęło się jako zakłócenie dostaw, przekształciło się w złożony, wielowarstwowy globalny kryzys obejmujący zaawansowane ograniczenia produkcji półprzewodników, ograniczenia geopolityczne, ogromne inwestycje w sztuczną inteligencję, popyt na gry, gwałtownie rosnącą konsumpcję w chmurze oraz przejścia technologiczne.
Ten artykuł się załamuje. dlaczego globalny niedobór GPU utrzymuje się, dlaczego nowe żetony pozostają drogiei - co najważniejsze -kiedy (i jeśli) ten niedobór w końcu się skończy.

1. Dlaczego GPUs są różne od innych żetonów
GPU to nie CPU.
Wymagają one:
-
więcej tranzystorów na mm ²
-
bardziej zaawansowana litografia (do 3nm / 5nm)
-
integracja pamięci o dużej przepustowości (HBM)
-
opakowania zaawansowane (CoWoS, EMIB, 3D- układanie)
-
bardzo niska tolerancja wad
-
specjalistyczne linie produkcyjne
-
ograniczeni dostawcy globalni
Oznacza to:
-
Produkcja GPU nie może być po prostu "skalowana"
-
nowych fabryk nie można włączyć przez noc
-
tylko kilka firm może je w ogóle
95% + produkcji GPU z krwawiącą krawędzią zależy od TSMCTajwański gigant półprzewodników.
Jest to jeden punkt globalnej porażki.
2. Co pobudziło niedobór? (Wiele fal)
Niedobór GPU nie jest jednym wydarzeniem - to nakładająca się seria fal:
Fala 1 - Zakłócenie dostaw pandemii (2020- 2021)
Fabryki zamknięte.
Przesyłka zamarzła.
Zapotrzebowanie wzrosło.
Wynik: zerowa inwentaryzacja przy uruchomieniu dla większości GPU konsumentów.
Fala 2 - Krypto górnictwo Frenzy
Górnictwo Ethereum wysłało popyt na GPU przez dach.
Gracze rywalizowali z przemysłowymi farmami górniczymi.
Ceny wzrosły o 200% -400%.
Fala 3 - Eksplozja w chmurze obliczeniowej
Hyperskalery znacznie zwiększyły pojemność GPU dla AI:
-
AWS
-
Google Cloud
-
Microsoft Azure
-
Oracle Cloud
-
Chmura napięcia
-
Alibaba Cloud
Każdy hiperskaler zamówił miliony jednostek.
Fala 4 - AI Gold Rush (2023- 2025)
Wzrost:
-
ChatGPT
-
Rodzina GPT- 4
-
Modele lamowe
-
Stabilna dyfuzja
-
MidJourney
-
Wszędzie szkolenia w zakresie ptasiej grypy
przekształcił GPU w strategiczną infrastrukturę.
Korporacje, rządy i obrońcy przystąpili do licytacji.
Fala 5 - Opakowanie półprzewodnikowe Bottleneck
Opakowania CoWoS wąskie gardło opóźnione dostawy o miesiące.
Nie ma znaczenia, czy zgon GPU jest gotowy - jeśli nie można go powiązać z HBM, jest bezużyteczny.
3. Dlaczego AI jest głównym kierowcą teraz
Ma to kluczowe znaczenie:
AI jest dziś konsumentem # 1 wysokiej klasy GPU.
Generacyjna AI wymaga:
-
parametry szkolenia w skali miliardowej
-
nieprzerwane obciążenia robocze
-
olbrzymia zdolność do obliczeń równoległych
-
przepustowość pamięci dużej przepustowości
Szkolenie na poziomie czołowym może wymagać dziesiątki tysięcy GPU klasy H100 / H200- i to jest dla pojedyncza Model.
Następnie, wniosek (bieżące wykorzystanie) zużywa nawet więcej sprzęt z czasem.
Popyt spadł z tysięcy → setki tysięcy → miliony jednostek na całym świecie.
Żaden przemysł wytwórczy nie może natychmiast wchłonąć tego szoku.
4. Dominacja NVIDIA = Bottleneck Market
Kontrola NVIDIA:
-
80- 90% światowego rynku AI GPU
-
prawie wszystkie sprzęt treningowy hiperskali
-
Blokada ekosystemu CUDA
Ilość GPU jest ograniczona.
Alternatywy GPU są ograniczone.
Koszty zmiany GPU są ogromne.
Firmy nie mają wyboru, muszą czekać i płacić.
5. Dlaczego konsumenci i gaming GPU pozostają drogie
Można by pomyśleć, że konsumpcyjne GPU byłyby teraz tanie.
Jednakże:
1. Produkcja priorytetyzuje GPU
(H100, GH200, B200 itd.)
Bo...
marża zysku na chip:
$2000 + → $30,000 +
vs.
karta konsumencka:
$200 → $1600
Producenci wolą opłacalne żetony.
2. Popyt na gry pozostaje wysoki
Nowe tytuły AAA wymagają większej mocy.
3. Używany rynek jest suchy
Upadek górnictwa zalane dostawy raz- ale ta dostawa zniknęła.
4. Hobbyści AI konkurują teraz z graczami
Więcej konkurencji → wyższe ceny.
6. Zaopatrzenie Bottlenecks Wyjaśnione
Największe ograniczenia dzisiaj:
• Litografia
Tylko TSMC, Samsung i Intel mogą budować zaawansowane węzły.
• Wydajność opakowania
CoWoS jest ograniczony i złożony.
• Produkcja HBM
Tylko kilku dostawców dostaw:
-
SK Hynix
-
Samsung
-
Mikron
a wydajność jest niska.
• Zmniejszenie zapasów
Nie ma już zapasów magazynowych.
• Logistyka wysyłki
sprzęt podróżuje przez dziesiątki kroków:
fab → pakowanie → pamięć → montaż płyt → testowanie → walidacja → dystrybucja
7. Geopolityczne ryzyko Wzmacnia wszystko
Produkcja GPU zależy w dużej mierze od Tajwanu.
Czynniki ryzyka obejmują:
-
China- Tajwan napięcia
-
US export control
-
sankcje
-
ograniczenia handlowe
-
Polityka embarga na chipy
USA kontroluje dostęp do chipów SI dla Chin.
Chiny gromadzą teraz agresywnie.
To powoduje dodatkowy niedobór.
8. Kiedy niedobór GPU faktycznie się skończy?
Krótka odpowiedź:
Nie wkrótce.
Realistyczne rozważania dotyczące osi czasu:
2025
-
ograniczenia dostaw nieznacznie się rozluźniają
-
nowe fabs rozpocząć ograniczoną rampę
-
większa dostępność HBM
-
ale popyt na AI rośnie szybciej niż podaż
2026
-
uzupełnione dodatkowe linie opakowaniowe
-
Niektóre regiony widzą stabilizację cen
-
zmniejszenie zaległości korporacyjnych
2027 +
-
next- gen fabs come online
-
globalna podaż znacznie się rozszerza
-
niedobór znacząco zmniejsza się
Większość analityków projekt znaczący normalizacja między 2026- 2028.
Nie w 2025.
Na pewno nie w 2024- 2025.
9. Czy ceny GPU spadnie?
Oni będzie, ale powoli - ponieważ:
-
Przedsiębiorstwa nadal będą płacić składki
-
wysokie marże są teraz normalne
-
Zapotrzebowanie na AI nie zawali się.
-
cykle gry kontynuować
-
coroczne odnawianie technologii przyspiesza
Spadek cen następuje tylko wtedy, gdy:
podaż > popyt
Daleko nam do tego.
10. Czy może powtórzyć się kolejny niedobór?
Tak - i łatwo.
Wyłączniki najwyższego ryzyka:
-
konflikt na Tajwanie
-
AI race race eskalacja
-
Zakazy wywozu
-
Brak HBM
-
zapaść logistyczna
-
nowy boom górniczy
-
cyberatak łańcucha dostaw
Niestabilność półprzewodnikowa pozostaje niezwykle wysoka.
Wniosek
Globalny niedobór GPU nie jest tymczasową niedogodnością - jest to wynik braku równowagi strukturalnej, który przekształcił przemysł komputerowy.
Po raz pierwszy w historii:
GPU są bardziej strategiczne niż CPU.
Popyt od AI, cloud computing, gaming i symulacja przemysłowa przerosła światową zdolność produkcyjną do dostarczania zaawansowanych procesorów graficznych. Niedobór ten prawdopodobnie utrzyma się w drugiej połowie dekady, ustępując jedynie w miarę dojrzewania i stabilizacji na całym świecie nowych fabryk, zakładów pakowania oraz zakładów pamięci.
Czy niedobór się skończy?
Tak.
Ale nie w tym roku.
Nie w przyszłym roku.
Jesteśmy na wieloletniej osi czasu - a światowy apetyt na SI wciąż rośnie.
Dopóki produkcja ostatecznie nie przewyższa popytu, GPUs pozostanie jednym z najcenniejszych - i najdroższych - aktywów w świecie technologii.


12184
IT Pro 



















