מבוא
העלייה של מחשוב ענן ואינטליגנציה מלאכותית (AI) עוררה שינוי דרמטי בתשתיות המתבססות על הכלכלה הדיגיטלית. מה שלעתים קרובות נשאר חבוי מאחורי ההתרגשות הקהילתית של "AI בכל מקום" ו"הגינות עננים" הוא עצום. אנרגיה ו תשתיות כוח נטל על כך שריכוזי נתונים מודרניים כופים כעת. במאמר זה אני בוחן את "משבר הכוח" המתעורר במרכזי נתונים - מה זה, למה זה קורה, מה העלויות שלו הן (כלכלה, סביבתית, חברתית), ומה זה אומר לארגונים (כולל אלה המפעילים עומסי עבודה כבדים כגון מדד GPU/CPU, וירטואליזציה ותשתיות ענן בעלות ביצועים גבוהים).

סולם הבעיה
1.1 צריכת חשמל בקנה מידה עולמי
-
על פי סוכנות האנרגיה הבינלאומית (IEA), צריכת החשמל העולמית ממרכזי נתונים נמצאת כיום סביב 415 teraוואט-שעה (TWh) כ-1.5% מצריכת החשמל העולמית ב-2024. סבא+2המחלקה לאנרגיה.gov+2
-
תחזיות מראות כי זה יכול כמעט כפול כפול עד 2030 (ל-945 TWh) בתרחיש הבסיסי של סבא"א - המייצג רק כ-3% מצריכת החשמל העולמית באותה עת. סבא+ 1 1
-
בארה"ב, לדוגמה, מרכזי נתונים שנשרפו עד שנת 183 TWh בשנת 2024 (≈ 4 אחוזים מצריכת החשמל בארה"ב) וזה צפוי ליותר מכפליים עד 2030 (ל- 426 TWh). מרכז המחקר Pew+ 1 1
1.2 1.2 1.2 1.2 הצמיחה המהירה של עומסי העבודה של AI
-
הגידול אינו רק מ"מרכזי נתונים נוספים" אלא מ"יותר" עומסי עבודה מואצים - GPU / TPU אשכולs, גדול שפה מודל הדרכה, בקנה מידה. עבור שרתים מואצים (AI ספציפית) IEA פרויקטים צמיחה של - 30% בשנה לעומת - 99% עבור שרתים קונבנציונליים. סבא
-
דו"ח של גולדמן זאקס מארגן את הביקוש העולמי לעוצמה העולה עד 165% עד סוף העשור (הופנה מהדף 2023), מונע על ידי תשתיות בינה מלאכותית וענן. גולדמן זאקס
-
בארצות הברית, מורגן סטנלי מזהיר על כוח קצר של עד 20% עבור ריכוזי נתונים עד 2028, מונע על ידי בניית AI זו. Yahoo Finance
1.3 השלכות על רשתות חשמל ותשתיות
-
ככל שספיציפי הביקוש, הזן על שידור, דור, אינרציה רשת ושירותים מקומיים גדל. לדוגמה, מדינות רבות וכלי רכב כבר רואים אשכולות של נתונים הדורשים שדרוגים ל substations וחיבורי רשת. מכון משאבי העולם+ 1 1
-
באזורים מסוימים, ריכוזי נתונים כבר צורכים מניות משמעותיות של אספקת חשמל מקומית - אשר יש אפקטים דפוק על משקי בית מקומיים, תעשייה ותכנון תשתיות. מרכז המחקר Pew
למה זה קורה: הנהגים
2.1 Hyperscale AI ועומסי ענן
-
המעבר לבינה מלאכותית, אימון מודל גדול, הקצוץ בקנה מידה (זמן אמת, 24/7) מטיל הרבה יותר גבוה כוחות יותר מדורות קודמים של עבודת השרת. לדוגמה, מדף שרת hyperscale דיור GPUs רבים עשוי לצייר עשרות קילווואט ולא כמה. ArXiv+ 1 1
-
בגלל כלכלות בקנה מידה ואת הצורך בביצועים, מתקנים אלה לעתים קרובות לדחוף את המעטפה של קירור, כוח משלוח, undancy, Uptime - כולם להגדיל את העלות והמורכבות.
2.2 דרוג מבוסס מיקום ומקבץ
-
מרכזי נתונים רבים נאספים באזורים עם תנאים מועדפים (למשל, עלות נמוכה של כוח, אקלים קריר, תמריצים במס). אבל כל כך מקבץ יוצר מתח מקומי ברשת – גם אם התמונה העולמית עשויה להיראות מוצלחת. מרכז המחקר Pew
-
התשתית לתמיכה באתרים גדולים אלה - תחזיות כוח, ממירים בעלי יכולת גבוהה, קווי שידור ארוכים - לעתים קרובות מפגרים מאחורי קצב הבנייה.
2.3 יעילות אנרגיה וקירור מעל ראשים
-
מעבר למגירה כוחית מותאמת, חלק משמעותי של חשמל ממוקד נתונים נכנס לתוך קירור, אוורור, אובדן חלוקת חשמל. ככל יותר כוח-לחזק את המתקן, כך גדול יותר ה-Acillary Overhead. מרכז המחקר Pew+ 1 1
-
כמה מערכות קירור יכולות לצרוך עד - 30% (או יותר) של כוח ריכוז נתונים הכולל במתקנים פחות יעילים. התגברות על יעילות גבוהה יותר מפחיתה את זה, אך ככל שהדונות עולים, דרישות הקירור עולות. מרכז המחקר Pew
2.4 אינטגרציה מחדש ואתגרי גומלין
-
מפעילי רבים שואפים להשתמש באנרגיה מתחדשת (wind/solar) או אפילו גרעינית כדי לכפות את מרכזי הנתונים שלהם. עם זאת, מתחדשים הם לסירוגיןהדרישות בזמן אמת של AI לעתים קרובות דורשות כוח יציב ואיכותי. Utilities מדווחות על זמני להוביל ארוכים כדי להוסיף קיבולת או קווי שידור, אישור מסובך, וקשה להתאים מתחדשים עם עומס. Business Insider
-
לכן, בפועל מתקנים רבים עדיין מסתמכים על גיבוי של דלק מאובנים או על כוח רשת ממקורות מסורתיים - אשר מעלה פליטות ומסבך נרטיבי קיימות.
עלויות נסתרות - Beyond the Server Bill
3.1 השפעות כלכליות / רשת
-
כאשר Data-centres דורש חלקים גדולים של יכולת הרשת, העלות של שדרוגים (דור, שידור, תת-קרקעיות) לעתים קרובות מועברת לקוחות אחרים משקי בית ועסקים קטנים יותר לדוגמה, משקי בית במדינות מסוימות בארה"ב רואים חשבונות גבוהים יותר, משום שהשימושים חייבים להעלות את הריבית כדי לכסות שינויים בתשתיות. מרכז המחקר Pew+ 1 1
-
באזורים בהם יכולת הרשת הדוקה, זמני ההמתנה לחיבורים של נתונים יכולים למתוח שנים - עיכוב שיגורים עסקיים או אילץ החלפה. MLQ
3.2 השלכות סביבתיות וטביעת רגל
-
החשמל המגביל את ריכוזי הנתונים עדיין מגיע בחלק גדול מדלקים מאובנים באזורים רבים. אם השימוש כפול ומתחדשים לא בקנה מידה בהתאם, הפליטה עולה. כמה הרחבת נתונים סיכון לנעול תשתיות תלויות דלק מאובנים במשך שנים. זמנים פיננסיים+ 1 1
-
קירור ותשתיות כוח משתמשים במים (במיוחד קירור evaporative) – כלומר ריכוזי נתונים באזורים בעלי מתח במים יוצרים לחץ סביבתי משני. ויקיפדיה Wikipedia
3.3 תחרות עלויות ותשתית
-
אדמה, כוח, מים ומשאבים קירור בשימוש על ידי מרכזי נתונים ענקיים יכול אחרת לשרת ייצור, קהילות מקומיות או עסקים קטנים יותר. זה מעלה שאלות על הון אזוריבמיוחד אם הטבות מקומיות (משרות, הכנסות מס) מוגבלות יחסית לצריכת משאבים.
-
עבור עסקים אשר מסתמכים על זרימות עבודה אינטנסיביות כוח (למשל, מדד מבוסס GPU, וירטואליזציה גבוהה באמצעות חישוב), התחרות הגוברת של כוח וקירור עלולה לגרום:
-
עלות גבוהה יותר של אירוח / ענן
-
זמנים ארוכים יותר לקיבולת
-
ייתכן שגישה נמוכה יותר ל-"premium" Power/low-latency Infrastructure
-
3.4 אחריות וסיכון עמידות
-
יתר על המידה או קרוב ל-capacity Networks סיכון מופחת slack, פחות עמידות לכשלים או מזג אוויר קיצוני, וסיכוי גבוה יותר של טמפרטורות חום או ירידה באדום. שניהם עבור הנתונים עצמם ו תשתיות סביבות (בתי חולים וכו'). העדויות כבר מזהירות על נקודות הלחץ הללו. Business Insider+ 1 1
מה זה אומר עבור עומסי עבודה כבדים: Benchmarking, Virtualization & Cloud Architecture
בהתחשב המיקוד שלך על GPU / CPU ציון, וירטואליזציה, אריזה ופריסות היברידיות / עננים, ממד מבנה כוח-infra רלוונטי יותר ויותר. הנה איך:
4.1 מסגרות Benchmark צריכות לכלול עלויות תשתית
-
כאשר אתה מעצב סוויטות ציון או מחסניות וירטואליזציה (למשל, GPU off-load, רב-נודה אשכולות, וירטואליזציה עם VMware /VirtualBox, AI inference צינורות), לשקול לא רק מדדים חד-פעמיים גולמיים (GFLOPS, רוחב פס) אבל גם כן) אבל גם עם VMware /VirtualBox, AI צינורות הנית), לא רק לשקול לא רק מדדים חד-מיים חד-פעמיים זעירים (GFLOPS). עלויות כוח, קירור מעל הראש, ויעילות אנרגיה לעבודה.
-
עבור פריסות ענן (למשל, על Microsoft Azure / AWS / GCP), העלות מושפעת יותר ויותר על ידי מגבלות תשתית בסיסיות (כוח וקירור) - אשר עשוי להשפיע על מחירים, זמינות וביצועים.
4.2 וירטואליזציה והשלכות חדות
-
אם אתה מפיץ מודלים היברידיים או על-prem + ענן (למשל, Windows VMs, GPU / CPU מחוץ לעומס מקופסאות מקומיות לענן), אתה רוצה להעריך את ה-Windows VMs, GPU/CPU מחוץ לעומס מקופסאות מקומיות לענן), אתה רוצה להעריך את ה- עלויות שוליות ו טביעת רגל באנרגיה של ה-Data-centre Hops. כמה עומסי עבודה עשויים להיות יעילים יותר באופן מקומי (תלויים עלות קירור / כוח) מאשר על ענן אם אירח באזור עם כוח מוגבל.
-
תזמורת וירטואלית צריכה לפקח מכסות כוחבמיוחד בסביבות מרובות-tenant/hyperscale. תזמון עומס העבודה עשוי להיות צורך לבחור פעמים/מיקום כאשר שיעורי חשמל / זמינות הם נוחים.
4.3 החלטות מיקור אנרגיה ואנרגיה
-
בעת בחירת ענן או מרכזי נתונים עבור פריסה, מקור אנרגיה לערבב, יכולת רשת, סיכון להסלמה בעלויות כוח, סוגיות קירור. אזורים מסוימים עשויים להיות בסיכון מאוחר יותר של קוצר חשמל או עלות עתידית גבוהה יותר עקב חדירה של נתונים.
-
לדוגמה, אזור עלייה של נתונים עם שולי הדור הקטן של הדור החופשי עשוי לעמוד בפני העלאת ריבית או צמצום. זה עשוי להשפיע על SLAs, עלות וביצועים של עומסי העבודה הכבדים שלך.
4.4 אחריות ושיווק זווית
-
אם אתה מפרסם תוצאות ציון, מאמרים, או מודולים (כפי שאתה עושה לעתים קרובות), ולאחר מכן הוספת מימד אנרגיה / יעילות (למשל, "X GFLOPS per קילוואטה באזור זה") עשויים להפוך לעניין עבור הקהל שלך - במיוחד ככל שהלחץ הסביבתי גדל.
-
עבור הקהילה של אנשי IT וחובבי ביצועים, הדגשה עלויות אנרגיה למשימה, יעילות קירור, המונחים: server-powerמשוך per Indexמוסיף חוקר אחר.
אסטרטגיות למניעת המשבר
הנה כמה אסטרטגיות ניתנות לפעולה הן ברמת המאקרו (industry/utility) ומיקרו (enterprise/deployment).
5.1 ברמת התעשייה /utility
-
תוכניות ניהול דרישות• ריכוזי נתונים גדולים יכולים להשתתף בתוכניות בעלות דרישות רשת (הפחתת העומס במהלך השיאים) כדי להקל על לחץ הרשת. לדוגמה, Google LLC חתמה על הסכמים בארה"ב כדי להגדיל את השימוש בכוח AI-data-centre שלה במהלך הביקוש לרשת שיא. רויטרס
-
חברת Grid and Broadcast Investment: כדי לתמוך בבנייה, הכלים צריכים להוסיף יכולת דור, קווי שידור ו substations - לעתים קרובות תהליך ארוך עשרות שנים. עיכובים כאן מגבירים את הסיכון לצוואר בקבוק. Deloitte
-
מקור חשמל ירוק + microgrids• Data-centres יכול מקור מתחדשים, לבנות על הדור, אחסון סוללות או microgrids כדי להפחית את ההסתמכות על רשתות מתוחות.
-
שקיפות ודיווח: המפעילים צריכים לדווח על שימוש בכוח בפועל, מדדי קירור, PUE (יעילות השימוש בכוח), וכו ', כדי לאפשר הרגולטורים והקהילות להעריך את ההשפעה. אנליסטים רבים קוראים למחסור בחשיפה. זמנים פיננסיים
5.2 ברמת הפריסה / Enterprise
-
מקור אזור ואנרגיה נבחרים בקפידה: בחר אזורים בעלי יכולת רשת טובה, יחסי חשמל נוחים, תערובת מתחדשת חזקה וסיכון נמוך של מגבלות.
-
תזמון עומס עבודה: עבור עומסי עבודה כבדים (benchmark רץ, אימון מודל), לוח הזמנים בשעות מחוץ ל-peak או כאשר עלות החשמל נמוכה יותר. השתמש בהבדלים אזוריים בעלות/זמן.
-
Power-aware Indexing & Architect design: למדוד לא רק זמן מקביל, אלא אנרגיה נצרכת (kWh) לאינדקס. אופטימיזציה לאנרגיה כתוצאה מכך, לא רק עבור מהירות גולמית.
-
שיפור קולי ויעילות: עבור פריסות On-prem או קצה, לשקול קירור יעילות גבוהה, נוזל-cooling, rack-density סחר-offs, בחירת שרת עבור יעילות אנרגיה.
-
לגלות חלופות היברידיות / חדשניות: בתרחישים שבהם ריכוזי נתונים בענן עשויים להתמודד עם מגבלות או עלות גבוהה יותר, מקומי או קצה compute עשוי להיות משחק טוב יותר.
סיכונים ו- Outlook
6.1. מה אם הצמיחה תימשך ללא בדיקה?
-
אנליסטים מזהירים מחסור ביכולת הרשתבמיוחד באזורים בעלי עוצמה. מורגן סטנלי מעריך כי מחסור של 20% בכוח של נתונים בארה"ב עד 2028 הוא אינדיקטור מפוכח. Yahoo Finance
-
אם הכוח נשאר מוגבל, סיכונים פוטנציאליים כוללים:
-
עלויות תפעול גבוהות יותר (מחיר כוח עולה)
-
-
שעות ארוכות יותר לפריסת נתונים
-
צמצום תכופים יותר או הגבלות על עומסי עבודה compute-intensive
-
איטי יותר של תשתיות בינה מלאכותית (בניגוד לציפיות צמיחה ורודות)
-
אולי טביעת רגל סביבתית גבוהה יותר אם דלקים מאובנים משמשים כדי למלא פערים
6.2 תחזיות חיוביות / מצוקות לשינוי
-
רווחי יעילות: גם כאשר הביקוש הנייח עולה, שיפורים באדריכלות השבבים, הקירור ותזמון עומס העבודה יכולים להגדיל את כוח מתון.
-
בנייה מחדש של כוח גרעיני: כמה חברות טכנולוגיה גדולות כבר חותמות על הסכמי טיהור חשמל עם חידושים גרעיניים או בקנה מידה גדול כדי להמשיך. לדוגמה, כמה ריכוזי נתונים נצמדים למפעלים גרעיניים בעלי חיים כדי לענות על הביקוש. Le Monde
-
שילוב רשת חכם יותר: Data-centres עשוי להיות עומסים גמישים, שינוי מקביל לזמנים כאשר כוח הוא זול או מתחדשים בשפע (response).
-
מורכבות ושקיפות: כבעלי עניין (ממשלות, משקיעים, קהילות) שואלים שאלות נוספות, עלייה בנתונים תפרסם ככל הנראה יותר מדדי אנרגיה / שימוש באנרגיה - מה שמאפשר תכנון והתאמה חכמים יותר.
פעולה מומלצת עבורך ועבור הקהל שלך
בהתחשב בהתעניינותך ולעבוד בהתאמת, וירטואליזציה, אריזה, תוכן קהילתי IT, הנה פעולות ספציפיות שאתה עשוי לשקול:
-
כולל מדד אנרגיה בדוחות שלך
-
בעת הפעלת מדדי GPU/CPU, לכידת לא רק "זמן ריצה" אלא "אנרגיה נצרכת (kWh)" ו-"GFLOPS per קילוואטה" או מדד יעילות דומה.
-
השוואת עננים / אזורים שונים לא רק עלות אלא על יעילות אנרגיה.
-
-
כתיבת תוכן עבור האתר שלך /forum
-
יצירת מאמר או סדרה שכותרתו "עלות האנרגיה של מחשוב ענן: מה כל IT Pro צריך לדעת" - מגבלות כוח פרופיל, לחץ רשת אזורי, דאגות קירור, סיכון עלות.
-
-
להציע מדריך ל-"Selecting cloud Zone by Power & Performance" אשר משלים את התוכן השני שלך - / וירטואליזציה ממוקדת.
-
וירטואליזציה ושימוש היברידי
-
גלה כיצד על-prem GPU / CPU מחוץ לעומס (GPU שלך compute off-loading עם GTX 770 + Quadro K420, וכו ') משווה אנרגיה חכם לעומת באמצעות אשכול ענן בקנה מידה יתר באזור מוגבל.
-
דיאטות או כלי (למשל, Power פרופילr, Plug-in למדידת אנרגיית אשכול GPU) עבור הקהילה שלך.
-
-
דרישות אריזה ופריסה
-
בעת תכנון מודולים / plugins /apps (למשל, המודולים של ג'ומלה שלך, GPU / AI benchmarking יישומים), לשקול הוספת אפשרויות "eco-mode": למשל, לוחות זמנים במהלך שעות מחוץ ל-peak, throttle עבור כוח נמוך יותר, metrics צריכת חשמל.
-
-
עבור וירטואליזציה (VMware /VirtualBox וכו '), מסמך מיטב-practices כדי להפחית את נסיגת החשמל, למשל, להימנע משיפוץ יתר, לגבש עומסי עבודה idle, לאפשר קירור / Host Power-features.
-
מעורבות בשקיפות של ספקי ענן
-
המשיכו לעקוב אחר אילו ספקי ענן/נתונים מפרסמים מדדים (PUE, תערובת אנרגיה, שימוש במים) ולהדגיש אותם בתוכן שלכם.
-
לעודד את חברי הקהילה לשאול: "מה מקור האנרגיה של האזור הזה? מהו יכולת הרשת הפנויה? האם יש מכסות חשמל או סיכונים? "
-
מסקנה
העלות הנסתרת של הענן והבינה המלאכותית היא לא רק הדולרים ששילמו בתשלומים - זה המחיר החבוי של הענן והבינה המלאכותית הוא לא רק הדולרים ששולמו בתשלומים של המנויים - זה המחיר מסיבי, במהירות מאיץ כוח ותשתיות זה מאחורי כל ה"מחזורים המתוקים". ריכוזי נתונים אינם עוד חדרי גב פסיביים של האינטרנט; הם לקוחות כוח תעשייתי הצמיחה שלהם יש השלכות מרחיקות לכת על שירותים, רשתות, משקי בית, תעשיות, הסביבה - ועל אנשי IT מוכווני ביצועים כמו עצמכם.
המשבר (או אולי מאתגר) הוא אמיתי: ביקוש גובר, אספקה מחוספסת, רשתות ההזדקנות, קירור ועומס סביבתי מצביעים על הצורך. תכנון אחראי יותר, פריסת האזור-aware, אדריכלות יעילה באנרגיהו מדדים שקוף. עבור כל אחד בונה עומסי עבודה כבדים - ציון GPU / CPU, וירטואליזציה, מודולי אריזה, פריסות ענן - ממד זה כבר לא ניתן להתעלם.


10484
IT Pro 



















