كما نعلم جميعًا ، أدى النمو الهائل لبيانات الإنترنت إلى ظهور تحديات كبيرة لقدرة معالجة مراكز البيانات.
الحوسبة والتخزين والشبكة هي القوى الدافعة الثلاثة التي تقود تطوير مراكز البيانات.
مع تطوير CPU و GPU و FPGA ، تم تحسين قوة الحوسبة بشكل كبير. التخزين مع إدخال محرك الحالة الصلبة (SSD) ، تم تقليل زمن الوصول إلى البيانات بشكل كبير.
ومع ذلك ، من الواضح أن تطوير الشبكة متأخر ، وتأخر الإرسال مرتفع ، وأصبح تدريجياً عنق الزجاجة لأداء مركز البيانات.
في مركز البيانات ، 70٪ من حركة المرور هي حركة المرور بين الشرق والغرب (حركة المرور بين الخوادم). تعالج حركة المرور هذه عمومًا تدفق البيانات أثناء الحوسبة المتوازية الموزعة عالية الأداء في مراكز البيانات ويتم نقلها عبر شبكات TCP / IP.
إذا زاد معدل نقل TCP / IP بين الخوادم ، سيزداد أداء مركز البيانات أيضًا.
نقل TCP / IP بين الخوادم
عملية الخادم A لإرسال البيانات إلى الخادم B في مركز البيانات هي كما يلي:
- يتم نسخ بيانات التحكم في وحدة المعالجة المركزية من APP Buffer الخاص بـ A إلى المخزن المؤقت لنظام التشغيل.
- بيانات التحكم في وحدة المعالجة المركزية أضف رؤوس TCP و IP إلى المخزن المؤقت لنظام التشغيل (OS).
- أضف رؤوس حزم TCP و IP لإرسال البيانات إلى NIC ، وإضافة رؤوس حزم Ethernet.
- يتم إرسال الحزمة بواسطة محول الشبكة وإرسالها إلى محول الشبكة للخادم B عبر شبكة Ethernet.
- يقوم محول الشبكة للخادم B بتفريغ رأس Ethernet للحزمة ونقله إلى المخزن المؤقت لنظام التشغيل.
- تقوم وحدة المعالجة المركزية بتفريغ رؤوس حزم TCP و IP في المخزن المؤقت لنظام التشغيل.
- تتحكم وحدة المعالجة المركزية في نقل البيانات غير المثبتة إلى APP Buffer.
كما يتضح من عملية نقل البيانات ، يتم نسخ البيانات عدة مرات في المخزن المؤقت للخادم ، وتحتاج رؤوس TCP و IP إلى إضافتها أو إلغاء تثبيتها في نظام التشغيل. لا تؤدي هذه العمليات إلى زيادة تأخير إرسال البيانات فحسب ، بل تستهلك أيضًا الكثير من موارد وحدة المعالجة المركزية ، والتي لا يمكنها تلبية متطلبات الحوسبة عالية الأداء.
لذا ، كيف يمكن إنشاء شبكة مركز بيانات عالية الأداء ذات إنتاجية عالية ، وزمن انتقال منخفض للغاية ، ونفقات منخفضة لوحدة المعالجة المركزية؟
يمكن لتقنية RDMA أن تفعل ذلك.
ما هو RDMA
يعد الوصول المباشر للذاكرة عن بُعد (RDMA) تقنية جديدة للوصول إلى الذاكرة تسمح للخوادم بقراءة وكتابة بيانات الذاكرة من الخوادم الأخرى بسرعة عالية دون معالجة تستغرق وقتًا طويلاً بواسطة نظام التشغيل / وحدة المعالجة المركزية.
RDMA ليست تقنية جديدة وقد تم استخدامها على نطاق واسع في الحوسبة عالية الأداء (HPC). مع تطور الطلب على النطاق الترددي العالي والتأخير المنخفض في مراكز البيانات ، تم تطبيق RDMA تدريجيًا في بعض السيناريوهات التي تتطلب أن تتمتع مراكز البيانات بأداء عالٍ.
على سبيل المثال ، في عام 2021 ، وصل حجم معاملات مهرجان التسوق لمركز تجاري كبير عبر الإنترنت إلى رقم قياسي جديد بأكثر من 500 مليار يوان ، بزيادة قدرها 10٪ تقريبًا مقارنة بعام 2020. وراء هذا الحجم الضخم من المعاملات معالجة البيانات الضخمة. يستخدم المركز التجاري عبر الإنترنت تقنية RDMA لدعم شبكة عالية الأداء وضمان مهرجان تسوق سلس.
دعنا نلقي نظرة على بعض حيل RDMA من أجل زمن انتقال منخفض.
ينقل RDMA بيانات تطبيق الخادم مباشرة من الذاكرة إلى بطاقة الشبكة الذكية (INIC) (بروتوكول RDMA المقوى) ، ويكمل جهاز INIC تغليف حزمة إرسال RDMA ، مما يحرر نظام التشغيل ووحدة المعالجة المركزية.
هذا يعطي RDMA ميزتين رئيسيتين:
- نسخة صفرية: عملية تلغي الحاجة إلى نسخ البيانات إلى نواة نظام التشغيل ومعالجة رؤوس الحزم ، مما يؤدي إلى تقليل زمن انتقال الإرسال بشكل كبير.
- تجاوز النواة والبروتوكول Offتحميل: نواة نظام التشغيل غير متضمنة ولا يوجد منطق رأس معقد في مسار البيانات. هذا يقلل من زمن الوصول ويوفر بشكل كبير موارد وحدة المعالجة المركزية.
ثلاث شبكات RDMA رئيسية
في الوقت الحاضر، هناك ثلاثة أنواع من شبكات RDMA، وهي بتقنية InfiniBandوRoCE (RDMA عبر Ethernet المتقاربة) وiWARP (RDMA عبر TCP).
كان RDMA في الأصل مقصورًا على بنية شبكة Infiniband لضمان النقل الموثوق به على مستوى الأجهزة ، في حين أن RoCE و iWARP هما من تقنيات RDMA المستندة إلى Ethernet.
بتقنية InfiniBand
- InfiniBand هي شبكة مصممة خصيصًا لـ RDMA.
- تم اعتماد وضع إعادة التوجيه القاطع لتقليل تأخير إعادة التوجيه.
- تضمن آلية التحكم في التدفق القائمة على الائتمان عدم فقدان الحزمة.
- يتطلب محولات ومحولات وأجهزة توجيه شبكة مخصصة من InfiniBand ، والتي تتميز بأعلى تكلفة لبناء الشبكة.
RoCE
- طبقة النقل هي بروتوكول InfiniBand.
- تأتي RoCE في نسختين: يتم تنفيذ RoCEv1 على طبقة ارتباط Ethernet ولا يمكن نقلها إلا في Layer L2 ؛ يستضيف RoCEv2 RDMA استنادًا إلى UDP ويمكن نشره على شبكات الطبقة الثالثة.
- دعم محول الشبكة الذكي المخصص RDMA ، لا حاجة لمحول وجهاز توجيه مخصصين (يدعم تقنية ECN / PFC ، ويقلل من معدل فقدان الحزمة) ، بأقل تكلفة لبناء الشبكة.
iWARP
- طبقة النقل هي بروتوكول iWARP.
- يتم تنفيذ iWARP في طبقة TCP لبروتوكول Ethernet TCP / IP ويدعم الإرسال في طبقة L2 / L3. تستهلك اتصالات TCP على الشبكات واسعة النطاق الكثير من وحدة المعالجة المركزية ، لذلك نادرًا ما يتم استخدامها.
- لا يتطلب iWARP سوى محولات الشبكة لدعم RDMA ، بدون محولات وأجهزة توجيه خاصة ، والتكاليف بين InfiniBand و RoCE.
مع التكنولوجيا المتقدمة ولكن السعر المرتفع ، يقتصر Infiniband على الحوسبة عالية الأداء HPC. مع ظهور RoCE و iWARPC ، انخفضت تكاليف RDMA وانتشرت تقنية RDMA.
يمكن أن يؤدي استخدام هذه الأنواع الثلاثة من شبكات RDMA في مراكز بيانات الحوسبة والتخزين عالية الأداء إلى تقليل زمن انتقال البيانات بشكل كبير وتوفير موارد أكبر لوحدة المعالجة المركزية للتطبيقات.
توفر شبكة InfiniBand أداءً فائقًا لمراكز البيانات ، مع زمن انتقال منخفض يصل إلى 100 نانوثانية ، وهو ترتيب واحد من حيث الحجم أقل من أجهزة Ethernet.
توفر شبكات RoCE و iWARP أداءً عالي التكلفة لمراكز البيانات وتستضيف RDMA عبر Ethernet ، مع الاستفادة الكاملة من أداء RDMA العالي والاستخدام المنخفض لوحدة المعالجة المركزية ، بينما لا يكلف بناؤها الكثير.
تعمل RoCE المستندة إلى UDP بشكل أفضل من iWARP المعتمد على بروتوكول TCP ، بالإضافة إلى تقنية التحكم في تدفق Ethernet غير المفقودة ، تحل مشكلة حساسية فقدان الحزمة. تم استخدام شبكة RoCE على نطاق واسع في مراكز البيانات عالية الأداء في مختلف الصناعات.
وفي الختام
مع تطور شبكات الجيل الخامس ، والذكاء الاصطناعي ، والإنترنت الصناعي ، وغيرها من المجالات الجديدة ، سيصبح تطبيق تقنية RDMA أكثر شيوعًا ، وسيساهم RDMA بشكل كبير في أداء مراكز البيانات.
المنتجات ذات الصلة:
- NVIDIA MMA4Z00-NS400 متوافق مع 400G OSFP SR4 مسطح علوي PAM4 850 نانومتر 30 متر على OM3 / 50m على وحدة الإرسال والاستقبال البصرية OM4 MTP / MPO-12 Multimode FEC $1100.00
- NVIDIA MMA4Z00-NS-FLT متوافق مع 800Gb / s ثنائي المنفذ OSFP 2x400G SR8 PAM4 850nm 100m DOM Dual MPO-12 MMF وحدة الإرسال والاستقبال البصرية $1400.00
- NVIDIA MMA4Z00-NS متوافق مع 800Gb / s ثنائي المنافذ OSFP 2x400G SR8 PAM4 850nm 100m DOM Dual MPO-12 MMF وحدة الإرسال والاستقبال الضوئية $1400.00
- NVIDIA MMS4X00-NM متوافق مع 800Gb / s ثنائي المنفذ OSFP 2x400G PAM4 1310nm 500m DOM Dual MTP / MPO-12 SMF وحدة الإرسال والاستقبال البصرية $2000.00
- NVIDIA MMS4X00-NM-FLT متوافق مع 800G Twin-port OSFP 2x400G Flat Top PAM4 1310nm 500m DOM Dual MTP / MPO-12 SMF وحدة الإرسال والاستقبال البصرية $2000.00
- NVIDIA MMS4X00-NS400 متوافق 400G OSFP DR4 Flat Top PAM4 1310nm MTP / MPO-12m SMF FEC وحدة الإرسال والاستقبال البصرية $1450.00
- Mellanox MMA1T00-HS متوافق 200G Infiniband HDR QSFP56 SR4 850nm 100m MPO-12 APC OM3/OM4 FEC PAM4 وحدة الإرسال والاستقبال الضوئية $300.00
- NVIDIA MCA7J60-N004 متوافق مع 4 أمتار (13 قدمًا) 800 جيجابت ثنائي المنافذ OSFP إلى 2x400 جيجابت OSFP InfiniBand NDR Breakout Active Copper Cable $800.00
- Cisco QDD-400G-SR8-S متوافق مع 400G QSFP-DD SR8 PAM4 850nm 100m OM4 MPO-16 DDM MMF وحدة الإرسال والاستقبال الضوئية $300.00
- وحدة الإرسال والاستقبال الضوئية Arista Networks QDD-400G-SR8 400G QSFP-DD SR8 PAM4 850nm 100m MTP / MPO OM3 FEC $300.00
- وحدة الإرسال والاستقبال الضوئية Arista Networks QDD-400G-DR4 400G QSFP-DD DR4 PAM4 1310nm 500m MTP / MPO SMF FEC $550.00
- وحدة الإرسال والاستقبال البصرية من جونيبر نتوركس QDD-400G-FR4 400G QSFP-DD FR4 PAM4 CWDM4 2 كم LC SMF FEC $750.00