مبادئ التصميم الأساسية لمجموعات الذكاء الاصطناعي: الحجم والكفاءة والمرونة

في عصر نماذج الذكاء الاصطناعي ذات التريليونات من المعاملات، أصبح بناء مجموعات الذكاء الاصطناعي عالية الأداء ميزة تنافسية أساسية لمزودي الخدمات السحابية وشركات الذكاء الاصطناعي. تحلل هذه المقالة بعمق متطلبات الشبكة الفريدة لأحمال عمل الذكاء الاصطناعي، وتقارن الاختلافات المعمارية بين مجموعات الذكاء الاصطناعي ومراكز البيانات التقليدية، وتقدم نموذجين رئيسيين لتصميم الشبكات اقترحتهما شركة أريستا. مُجدولة نقطة النهاية (NSF) و التبديل المجدول (DSF) — مع تقديم إرشادات عملية حول اختيار الطوبولوجيا و الربط البيني بسرعة 800 جيجابت تكنولوجيا لمختلف الأحجام.

متطلبات الشبكة وخصائص حركة البيانات لمجموعات الذكاء الاصطناعي

المتطلبات الأساسية: نطاق واسع للغاية، وكفاءة عالية، ومرونة فائقة

متطلبات الشبكة وخصائص حركة البيانات لمجموعات الذكاء الاصطناعي

مع التوسع السريع لنماذج الذكاء الاصطناعي لتشمل تريليونات من المعلمات، تفرض مجموعات التدريب والاستدلال متطلبات غير مسبوقة على الشبكة الأساسية:

  • توسعة واسعة النطاق للغايةيجب أن يدعم الحوسبة التعاونية عبر مئات الآلاف إلى ملايين وحدات المعالجة المتوازية (وحدات معالجة الرسومات/وحدات معالجة الشبكات)، ويغطي كل شيء من سيناريوهات الرف الواحد إلى سيناريوهات مراكز البيانات المتعددة.
  • كفاءة عالية وزمن استجابة منخفض للغاية: تتطلب عمليات الاتصال الجماعي المتكررة (مثل AllReduce و AllGather) بين وحدات المعالجة المتوازية زمن انتقال يصل إلى مستوى الميكروثانية واستخدام عرض النطاق الترددي بنسبة 90% أو أكثر.
  • التكيف غير المتجانسيجب أن يدعم بسلاسة وحدات المعالجة المتغيرة من مختلف الموردين، وميزانيات الطاقة المتفاوتة للرفوف، وأحمال العمل المختلطة (التدريب + الاستدلال)، وتجنب تدهور الأداء بسبب "تأثير البرميل الخشبي" (الأداء العام محدود بأبطأ عقدة).

أربع خصائص فريدة لحركة مرور الذكاء الاصطناعي

بالمقارنة مع حركة مرور مراكز البيانات التقليدية، تُظهر حركة مرور الذكاء الاصطناعي أنماطًا مختلفة تمامًا تؤثر بشكل مباشر على قرارات تصميم الشبكة:

  • التزامن العالي: تقوم وظائف التدريب بتبادل التدرجات والمعلمات في دورات ثابتة، مما يؤدي إلى حركة مرور "طويلة ومتزامنة للغاية" والتي تتسبب بسهولة في ازدحام Incast.
  • الاعتماد الكبير على تقنية RDMAيتطلب شبكة بدون فقدان البيانات: RDMA عبر إيثرنت متقارب (RoCEv2) هو المعيار الفعلي؛ أي فقدان للحزم يؤدي إلى إعادة الإرسال وارتفاعات كبيرة في زمن الوصول.
  • خصائص التدفق المستقر: تتميز التدفقات الفردية بفترات عمر طويلة (من بداية المهمة إلى اكتمالها)، ومعدلات عالية للغاية، وإنتروبيا منخفضة (مسارات ثابتة نسبيًا)، مما يجعل موازنة الأحمال التقليدية لـ ECMP غير فعالة.
  • تم نقل مسؤولية الموثوقية إلى الشبكة: تطبيقات الذكاء الاصطناعي تنقل مسؤولية الموثوقية بالكامل إلى الشبكة - حتى فقدان حزمة واحدة يمكن أن يفسد دورة التدريب بأكملها.

الاختلافات المعمارية بين مجموعات الذكاء الاصطناعي ومجموعات مراكز البيانات التقليدية

تُعتبر المجموعات الحاسوبية التقليدية "محورية حول خوادم وحدة المعالجة المركزية"، حيث تخدم الشبكة بشكل أساسي حركة البيانات الأفقية بين استيعاب البيانات وتخزينها ومعالجتها. في المقابل، تُعتبر مجموعات الذكاء الاصطناعي الحديثة "محورية حول وحدات المعالجة المتوسعة" وتفصل بوضوح بين:

  • شبكة الواجهة الأمامية – حركة البيانات من وحدة المعالجة المركزية إلى وحدة المعالجة المركزية ومن وحدة المعالجة المركزية إلى وحدة التخزين (على غرار مركز البيانات التقليدي).
  • شبكة الواجهة الخلفية (السكك الحديدية) – وصلة ربط عالية النطاق الترددي ومنخفضة زمن الوصول بين وحدات المعالجة المركزية، والتي تصبح عنق الزجاجة في الأداء والتركيز الأساسي للتصميم.

تؤدي بنية الشبكة المزدوجة هذه إلى زيادة التعقيد الإجمالي بشكل كبير.

نموذجان أساسيان لتصميم الشبكات لمجموعات الذكاء الاصطناعي

تصنف شركة أريستا شبكات الذكاء الاصطناعي الحالية في الواجهة الخلفية إلى نموذجين رئيسيين بناءً على مكان وجود مسؤولية الجدولة:

بنية مجدولة لنقاط النهاية (NSF - نسيج الشبكة المجدول)

المبدأ الأساسي

تتركز جميع وظائف جدولة المهام في نقاط النهاية (بطاقة الشبكة/وحدة معالجة البيانات/وحدة معالجة التعليمات). أما بنية الشبكة فتقتصر على توجيه الحزم الأساسي - وهو في الأساس امتداد مُحسَّن لشبكة الإيثرنت التقليدية.

الخصائص التقنية الرئيسية

  • الطوبولوجيا: Spine-Leaf الكلاسيكية المسطحة أو Super-Spine Clos، تحتاج المفاتيح فقط إلى radix عالي ومنافذ 800G.
  • متطلبات نقطة النهاية: يجب أن تدعم بطاقات الشبكة موازنة التحميل الديناميكي (DLB) والتوجيه التكيفي ورش الحزم والتحكم في الازدحام من طرف إلى طرف (ECN/WRED).
  • المزايا: بنية بسيطة، كابلات مرنة، متوافقة تمامًا مع نظام إيثرنت الحالي، مثالية للمجموعات الصغيرة والمتوسطة (≤10K XPUs).
  • القيود: احتكار قوي من قبل المورد على مستوى بطاقة الشبكة؛ تعقيد الجدولة يتضاعف بشكل كبير على نطاق واسع للغاية، مما يؤدي إلى عدم توازن الحمل ونقاط ساخنة.

بنية التبديل المجدولة (DSF - نسيج التبديل المباشر)

المبدأ الأساسي

تُنقل مسؤولية جدولة المهام بالكامل إلى محولات الشبكة. تستخدم نقاط النهاية بطاقات شبكة قياسية، بينما تحقق البنية التحتية نقلًا عالي الأداء دون فقدان للبيانات من خلال التبديل القائم على الخلايا والتحكم في التدفق القائم على الرصيد.

الخصائص التقنية الرئيسية

  • الطوبولوجيا: تتعامل محولات Leaf مع تجزئة الخلايا، و VOQ (قائمة انتظار الإخراج الافتراضية)، والجدولة، وإدارة الائتمان؛ محولات Spine / Super-Spine هي أجهزة توجيه بسيطة منخفضة الطاقة.
  • آلية بدون فقدان: يضمن بروتوكول طلب/منح الائتمان + PFC + ECN عدم حدوث أي تجاوز في سعة المخزن المؤقت من البداية إلى النهاية.
  • قدرة التوسع: يدعم نظام واحد 4.6K × 800G أو 9.2K × 400G XPUs؛ ويصل التوسع ذو الطبقتين إلى 32K+ GPUs.
  • المزايا: لا يعتمد على بائع بطاقة الشبكة، أداء مستقر للغاية على نطاق واسع للغاية، تحكم دقيق في الازدحام.
  • القيود: زيادة تعقيد وتكلفة أجهزة التبديل؛ يجب أن تتوافق الكابلات مع متطلبات تبديل الخلايا.

اختيار الطوبولوجيا وتقنية الربط البيني بسرعة 800 جيجابت في الثانية

طوبولوجيا متعددة المستويات - الأساس لوحدات المعالجة المتوسعة (XPUs) ذات النطاق المليوني

لتحقيق قابلية التوسع الخطي إلى مئات الآلاف أو ملايين وحدات المعالجة المتوازية (XPUs)، توصي شركة أريستا بشدة بـ متعدد المستويات هندسة معمارية:

  • كل مستوى عبارة عن نسيج Spine-Leaf مستقل (عادةً 4K–10K XPUs).
  • تعمل مستويات متعددة بالتوازي وترتبط فيما بينها عبر طبقة تجميع.
  • يمكن لعشر طائرات أن تتجاوز بسهولة 100 ألف وحدة معالجة متبادلة مع الحفاظ على عزل الأعطال وتوسيع النطاق الترددي الخطي.

اختيار تقنية الربط البيني 800G حسب السيناريو

اختيار تقنية الربط البيني 800G حسب السيناريو
سيناريوالتكنولوجيا الموصى بهاالمسافاتاستهلاك الطاقةالتكلفةملاحظة
داخل الرف (<2 متر)DAC / ACC≤2 ممنخفضة للغايةأدنىكابل نحاسي للتوصيل المباشر / كابل نحاسي نشط
داخل الصف / قصير المدىLPO / LRO≤50 ممنخفض جدامنخفضبصريات قابلة للتوصيل ذات محرك خطي - توفير كبير في الطاقة مقارنةً بمعالجة الإشارات الرقمية
مدى متوسط ​​(≤500 متر)معالجة الإشارات الرقمية المتماسكة≤500 ممعتدل
متوسطالبصريات التقليدية لمعالجة الإشارات الرقمية، نظام بيئي ناضج
مدى طويل (2-100 كم)معالجة الإشارات الرقمية + تقسيم الطول الموجي الرقمي≤100 كم+أكثرأكثرمطلوب للمجموعات متعددة المباني أو على مستوى الحرم الجامعي

الخاتمة والاتجاهات المستقبلية

أهم النقاط التي يجب مراعاتها عند اختيار التصميم المعماري

  • ≤10 آلاف وحدة معالجة مركزية → مفضل مُجدولة نقطة النهاية (NSF) من أجل التكلفة ومرونة النشر.
  • ≥32 ألف وحدة معالجة رسومات XPU → يجب اعتمادها التبديل المجدول (DSF) لضمان الأداء المستقر والقضاء على الاختناقات في نقاط النهاية.
  • على نطاق الملايين → متعدد المستويات + DSF وهو حاليًا الحل الوحيد المثبت فعاليته على مستوى الإنتاج.

اتجاهات المستقبل

  • تحسين أعمق لأساسيات الاتصال الجماعي (AllReduce، AllGather، إلخ) على مستوى الشبكة.
  • معايير قياس الأداء الموحدة لـ MPI/NCCL/RCCL على شبكات الذكاء الاصطناعي الحقيقية.
  • دمج المعايير الناشئة مثل Ultra Ethernet Consortium (UEC) و UALink لدفع الصناعة من "العزل المخصص" نحو وصلات مفتوحة وموحدة ومنخفضة زمن الوصول للغاية.

لم يعد بناء الجيل التالي من الحواسيب العملاقة للذكاء الاصطناعي مجرد شراء المزيد من وحدات معالجة الرسومات - فقد أصبحت الشبكة ساحة المعركة الحاسمة للأداء وقابلية التوسع والتكلفة الإجمالية للملكية.

انتقل إلى الأعلى