كانت المنافسة بين InfiniBand وEthernet موجودة دائمًا في مجال الحوسبة عالية الأداء. تحتاج الشركات والمؤسسات إلى الموازنة بين مزايا وعيوب هاتين التقنيتين لاختيار تقنية الشبكة التي تناسب احتياجاتها على أفضل وجه. يعد وجود خيارات متعددة عند تحسين الأنظمة أمرًا جيدًا، لأن البرامج المختلفة تتصرف بشكل مختلف، والمؤسسات المختلفة لديها ميزانيات مختلفة. ولذلك نرى استخدام مختلف الترابطات والبروتوكولات في أنظمة الحوسبة عالية الأداء، ونعتقد أن هذا التنوع لن ينقص بل قد يزيد، خاصة أننا نقترب تدريجياً من نهاية قانون مور.
من المثير للاهتمام دائمًا إلقاء نظرة عميقة على اتجاهات الترابط في تصنيفات Top500 لأجهزة الكمبيوتر العملاقة، والتي يتم إصدارها مرتين سنويًا. لقد قمنا بتحليل الأنظمة الجديدة في القائمة وجميع مؤشرات الحوسبة المنعكسة في التصنيف، والآن حان الوقت لإلقاء نظرة على الروابط البينية. جلعاد شاينر، نائب الرئيس الأول ومدير المنتج لشركة Quantum بتقنية InfiniBand تقوم المحولات في Nvidia (التي كانت سابقًا جزءًا من Mellanox Technology) بتحليل الوصلات البينية لـ Top500 وتشاركها معنا. الآن، يمكننا أن نشارك تحليله معك. هيا بنا نتعمق. لنبدأ بالنظر إلى اتجاه تطوير تقنيات التوصيل البيني في قائمة Top500 من نوفمبر 2007 إلى يونيو 2021.
تتضمن قائمة Top500 أنظمة حوسبة عالية الأداء من الأوساط الأكاديمية والحكومية والصناعية، بالإضافة إلى الأنظمة التي أنشأها مقدمو الخدمات ومنشئو السحابة ومنصات الحوسبة فائقة الحجم. لذلك، هذه ليست قائمة "حواسيب عملاقة" خالصة، كما يطلق الناس عادة على الأجهزة التي تقوم بتشغيل المحاكاة التقليدية وأحمال عمل النمذجة أجهزة الكمبيوتر العملاقة.
شهدت InfiniBand وEthernet التي تعمل بسرعة 10 جيجابت/ثانية أو بسرعات أقل صعودًا وهبوطًا خلال الثلاثة عشر عامًا ونصف الماضية. يشهد InfiniBand ارتفاعًا، في حين انخفض متغير Omni-Path (الذي كانت تسيطر عليه شركة Intel سابقًا، والمملوكة الآن لشركة Cornelis Networks) قليلاً في تصنيف يونيو 2021.
كورنيليس تطلق خريطة طريق OMNI-PATH Interconnect
ومع ذلك، فإن شبكة إيثرنت التي تعمل بسرعة 25 جيجابت/ثانية أو سرعات أعلى آخذة في الارتفاع، خاصة في ظل النمو السريع بين عامي 2017 و2019، وذلك لأن محولات 100 جيجابت/ثانية (عادةً محولات Mellanox Spectrum-2) أرخص من تقنيات 100 جيجابت/ثانية السابقة، والتي تعتمد على أوضاع نقل أكثر تكلفة، لذلك لن تفكر معظم مراكز الحوسبة عالية الأداء في استخدامها. مثل العديد من منشئي النطاق الفائق والسحابي، فقد تخطوا جيل إيثرنت بسرعة 200 جيجابت/ثانية، باستثناء التوصيلات الأساسية ومراكز البيانات، وانتظروا انخفاض تكلفة المحولات بسرعة 400 جيجابت/ثانية، حتى يتمكنوا من استخدام أجهزة بسرعة 400 جيجابت/ثانية.
في تصنيفات يونيو 2021، إذا قمنا بجمع بيانات Nvidia InfiniBand وIntel Omni-Path، فستجد أن هناك 207 جهازًا مزودًا بوصلات InfiniBand البينية، وهو ما يمثل 41.4 بالمائة من القائمة. نحن نشك بقوة في أن بعض الوصلات البينية المسماة "ملكية" في القائمة، ومعظمها من الصين، هي أيضًا أنواع مختلفة من InfiniBand. أما بالنسبة لشبكة إيثرنت، وبغض النظر عن السرعة، فقد تباينت حصة وصلات إيثرنت في قائمة Top500 من أدنى مستوى بلغ 248 جهازًا في يونيو 2021 إلى أعلى مستوى بلغ 271 جهازًا في يونيو 2019 في السنوات الأربع الماضية. في السنوات الأخيرة، أدى InfiniBand إلى تآكل مكانة Ethernet، وهو أمر ليس مفاجئًا بالنسبة لنا، لأن أحمال عمل الحوسبة عالية الأداء (والذكاء الاصطناعي الآن) حساسة جدًا لزمن الوصول، وقد انخفضت تكلفة InfiniBand بمرور الوقت مع انخفاض مبيعاتها. زادت تدريجيا. (يساعد اعتماد InfiniBand من قبل منشئي النطاق الواسع والسحابة على خفض الأسعار.)
يمكن تسمية معظم أنظمة Top100 وأنظمة Top10 بالحواسيب الفائقة الحقيقية، مما يعني أنها تشارك بشكل أساسي في أعمال الحوسبة التقليدية عالية الأداء. ومع ذلك، فإن المزيد والمزيد من الأجهزة تقوم أيضًا بتشغيل بعض أعباء عمل الذكاء الاصطناعي. هنا هو توزيع الترابط بين هذه الأجهزة العليا.
كما يتبين من الشكل أعلاه، لا تهيمن شبكة Ethernet هنا، ولكنها ستنمو مع بدء HPE في شحن Slingshot بسرعة 200 جيجابت/ثانية (نوع مختلف من شبكة Ethernet مُحسّنة للحوسبة عالية الأداء تم تطويرها بواسطة Cray)، والتي يتم استخدامها بالفعل من قبل " Perlmutter" في مختبر لورانس بيركلي الوطني مع منفذين بسرعة 100 جيجابت/ثانية لكل عقدة. كما نشك بقوة في أن جهاز Sunway TaihuLight (الموجود في المركز الوطني للحوسبة الفائقة في ووشي، الصين) يستخدم نسخة مختلفة من InfiniBand (على الرغم من أن Mellanox لم يؤكد ذلك أبدًا، ولا المختبر). يستخدم "Fugaku" رقم واحد سابقًا (في معهد RIKEN في اليابان) الجيل الثالث من تقنية التوصيل البيني Tofu D التي طورتها شركة Fujitsu، والتي تنفذ طوبولوجيا وبروتوكول توروس 6D خاص. يعتمد "Tianhe-2A" (الموجود في المركز الوطني للحوسبة الفائقة في قوانغتشو، الصين) تقنية التوصيل البيني الخاصة بـ TH Express-2، وهي فريدة من نوعها.
في تصنيف Top100 للكمبيوتر، لا تتضمن وصلات Cray البينية أول آلة Slingshot فحسب، بل تشمل أيضًا مجموعة من الآلات التي تستخدم الجيل السابق من وصلات "Aries". في تصنيف يونيو 2021، كانت هناك خمس آلات Slingshot وتسعة آلات برج الحمل في قائمة Top100. إذا تم اعتبار Slingshot كإيثرنت، فستكون حصة Ethernet 6%، وتنخفض حصة Cray الخاصة إلى 9%. إذا تم دمج Mellanox/Nvidia InfiniBand مع Intel Omni-Path، فإن InfiniBand لديه 79 جهازًا في قائمة Top100.
عند التوسع من Top100 إلى Top500، يكون توزيع الترابطات كما يلي بإضافة 100 جهاز في كل مرة:
ومن المتوقع أن يزداد انتشار إيثرنت مع توسع القائمة، لأن العديد من أنظمة الحوسبة الأكاديمية والصناعية عالية الأداء لا تستطيع تحمل تكلفة InfiniBand، أو أنها غير راغبة في التحول من إيثرنت. ويقوم مقدمو الخدمات ومنشئو السحابة والمشغلون ذوو النطاق الواسع بتشغيل Linpack على جزء صغير من مجموعاتهم، لأسباب سياسية أو تجارية. تحظى شبكة Ethernet الأبطأ نسبيًا بشعبية في النصف السفلي من قائمة Top500، بينما ينخفض انتشار InfiniBand من 70% في قائمة Top10 إلى 34% في قائمة Top500 الكاملة.
الشكل التالي هو مخطط آخر، يجمع معظم InfiniBand وEthernet في قائمة Top500، وهو يفسر جزئيًا سبب قيام Nvidia بدفع 6.9 مليار دولار للاستحواذ على Mellanox.
تمتلك InfiniBand من Nvidia حصة 34% من وصلات Top500 البينية، مع 170 نظامًا، لكن ظهور محولات Mellanox Spectrum وSpectrum-2 Ethernet في Top500 ليس واضحًا، حيث أنها تضيف 148 نظامًا آخر. وهذا يمنح Nvidia حصة 63.6% من جميع الوصلات البينية في تصنيف Top500. وهذا إنجاز تمتعت به شركة Cisco Systems لمدة 20 عامًا في مركز بيانات المؤسسة.
المنتجات ذات الصلة:
- NVIDIA MMS4X00-NM متوافق مع 800Gb / s ثنائي المنفذ OSFP 2x400G PAM4 1310nm 500m DOM Dual MTP / MPO-12 SMF وحدة الإرسال والاستقبال البصرية $2000.00
- 10 متر (33 أقدام) 12 ألياف أنثى إلى أنثى MPO جذع كابل قطبية B LSZH OS2 9/125 وضع فردي $32.00
- NVIDIA MMA4Z00-NS متوافق مع 800Gb / s ثنائي المنافذ OSFP 2x400G SR8 PAM4 850nm 100m DOM Dual MPO-12 MMF وحدة الإرسال والاستقبال الضوئية $1400.00
- NVIDIA MFP7E10-N015 متوافق مع 15 متر (49 قدم) 8 ألياف فقدان إدخال منخفض أنثى إلى أنثى MPO كابل جذع قطبية B APC إلى APC LSZH متعدد الأوضاع OM3 50/125 $54.00
- NVIDIA MCP4Y10-N00A متوافق مع 0.5m (1.6ft) 800G ثنائي المنفذ 2x400G OSFP إلى 2x400G OSFP InfiniBand NDR Passive Direct Attach Copper Cable $175.00
- NVIDIA MFA7U10-H015 متوافق مع 15m (49ft) 400G OSFP إلى 2x200G QSFP56 ثنائي المنافذ HDR Breakout Active Optical Cable $925.00
- NVIDIA MCP7Y60-H001 متوافق مع 1 متر (3 أقدام) 400 جرام OSFP إلى 2x200G QSFP56 كابل التوصيل المباشر السلبي $123.00
- NVIDIA MMS4X00-NM-FLT متوافق مع 800G Twin-port OSFP 2x400G Flat Top PAM4 1310nm 500m DOM Dual MTP / MPO-12 SMF وحدة الإرسال والاستقبال البصرية $2000.00
- NVIDIA MMA4Z00-NS-FLT متوافق مع 800Gb / s ثنائي المنفذ OSFP 2x400G SR8 PAM4 850nm 100m DOM Dual MPO-12 MMF وحدة الإرسال والاستقبال البصرية $1400.00
- NVIDIA MCP4Y10-N00A-FLT متوافق مع 0.5 م (1.6 قدم) 800 جيجا ثنائي المنفذ 2x400G OSFP إلى 2x400G OSFP InfiniBand NDR Passive DAC ، قمة مسطحة من طرف وأعلى مزعنفة على أخرى $175.00
- NVIDIA MCA4J80-N003-FTF متوافق مع 3m (10ft) 800G ثنائي المنفذ 2x400G OSFP إلى 2x400G OSFP InfiniBand NDR كابل نحاسي نشط، جزء علوي مسطح من أحد الطرفين وجزء علوي زعانف من الطرف الآخر $600.00
- NVIDIA MMA4Z00-NS400 متوافق مع 400G OSFP SR4 مسطح علوي PAM4 850 نانومتر 30 متر على OM3 / 50m على وحدة الإرسال والاستقبال البصرية OM4 MTP / MPO-12 Multimode FEC $1100.00
- بطاقة مهايئ NVIDIA Mellanox MCX75510AAS-NEAT ConnectX-7 InfiniBand / VPI ، NDR / 400G ، منفذ واحد OSFP ، PCIe 5.0x 16 ، حامل طويل $1650.00
- بطاقة مهايئ NVIDIA Mellanox MCX653105A-HDAT-SP ConnectX-6 InfiniBand / VPI ، HDR / 200GbE ، منفذ واحد QSFP56 ، PCIe3.0 / 4.0 x16 ، حامل طويل القامة $1400.00
- NVIDIA MCP7Y50-N001-FLT متوافق مع 1 متر (3 قدم) 800 جيجا InfiniBand NDR ثنائي المنافذ OSFP إلى 4x200G Flat Top OSFP Breakout DAC $485.00
- NVIDIA MCA7J70-N004 متوافق مع 4 أمتار (13 قدمًا) 800 جيجا بايت InfiniBand NDR Twin-port OSFP إلى 4x200G OSFP Breakout ACC $1100.00
- NVIDIA MCA7J60-N004 متوافق مع 4 أمتار (13 قدمًا) 800 جيجابت ثنائي المنافذ OSFP إلى 2x400 جيجابت OSFP InfiniBand NDR Breakout Active Copper Cable $800.00
- NVIDIA MCP7Y00-N001-FLT متوافق مع 1m (3ft) 800G ثنائي المنفذ OSFP إلى 2x400G Flat Top OSFP InfiniBand NDR Breakout DAC $300.00