ما هو RDMA؟

كما نعلم جميعًا ، أدى النمو الهائل لبيانات الإنترنت إلى ظهور تحديات كبيرة لقدرة معالجة مراكز البيانات.

الحوسبة والتخزين والشبكة هي القوى الدافعة الثلاثة التي تقود تطوير مراكز البيانات.

مع تطوير CPU و GPU و FPGA ، تم تحسين قوة الحوسبة بشكل كبير. التخزين مع إدخال محرك الحالة الصلبة (SSD) ، تم تقليل زمن الوصول إلى البيانات بشكل كبير.

ومع ذلك ، من الواضح أن تطوير الشبكة متأخر ، وتأخر الإرسال مرتفع ، وأصبح تدريجياً عنق الزجاجة لأداء مركز البيانات.

تم تحسين قوة الحوسبة بشكل كبير

في مركز البيانات ، 70٪ من حركة المرور هي حركة المرور بين الشرق والغرب (حركة المرور بين الخوادم). تعالج حركة المرور هذه عمومًا تدفق البيانات أثناء الحوسبة المتوازية الموزعة عالية الأداء في مراكز البيانات ويتم نقلها عبر شبكات TCP / IP.

إذا زاد معدل نقل TCP / IP بين الخوادم ، سيزداد أداء مركز البيانات أيضًا.

70٪ من حركة المرور هي حركة مرور شرق-غرب

نقل TCP / IP بين الخوادم

عملية الخادم A لإرسال البيانات إلى الخادم B في مركز البيانات هي كما يلي:

نقل TCP / IP بين الخوادم

  1. يتم نسخ بيانات التحكم في وحدة المعالجة المركزية من APP Buffer الخاص بـ A إلى المخزن المؤقت لنظام التشغيل.
  2. بيانات التحكم في وحدة المعالجة المركزية أضف رؤوس TCP و IP إلى المخزن المؤقت لنظام التشغيل (OS).
  3. أضف رؤوس حزم TCP و IP لإرسال البيانات إلى NIC ، وإضافة رؤوس حزم Ethernet.
  4. يتم إرسال الحزمة بواسطة محول الشبكة وإرسالها إلى محول الشبكة للخادم B عبر شبكة Ethernet.
  5. يقوم محول الشبكة للخادم B بتفريغ رأس Ethernet للحزمة ونقله إلى المخزن المؤقت لنظام التشغيل.
  6. تقوم وحدة المعالجة المركزية بتفريغ رؤوس حزم TCP و IP في المخزن المؤقت لنظام التشغيل.
  7. تتحكم وحدة المعالجة المركزية في نقل البيانات غير المثبتة إلى APP Buffer.

كما يتضح من عملية نقل البيانات ، يتم نسخ البيانات عدة مرات في المخزن المؤقت للخادم ، وتحتاج رؤوس TCP و IP إلى إضافتها أو إلغاء تثبيتها في نظام التشغيل. لا تؤدي هذه العمليات إلى زيادة تأخير إرسال البيانات فحسب ، بل تستهلك أيضًا الكثير من موارد وحدة المعالجة المركزية ، والتي لا يمكنها تلبية متطلبات الحوسبة عالية الأداء.

لذا ، كيف يمكن إنشاء شبكة مركز بيانات عالية الأداء ذات إنتاجية عالية ، وزمن انتقال منخفض للغاية ، ونفقات منخفضة لوحدة المعالجة المركزية؟

يمكن لتقنية RDMA أن تفعل ذلك.

ما هو RDMA

يعد الوصول المباشر للذاكرة عن بُعد (RDMA) تقنية جديدة للوصول إلى الذاكرة تسمح للخوادم بقراءة وكتابة بيانات الذاكرة من الخوادم الأخرى بسرعة عالية دون معالجة تستغرق وقتًا طويلاً بواسطة نظام التشغيل / وحدة المعالجة المركزية.

RDMA ليست تقنية جديدة وقد تم استخدامها على نطاق واسع في الحوسبة عالية الأداء (HPC). مع تطور الطلب على النطاق الترددي العالي والتأخير المنخفض في مراكز البيانات ، تم تطبيق RDMA تدريجيًا في بعض السيناريوهات التي تتطلب أن تتمتع مراكز البيانات بأداء عالٍ.

على سبيل المثال ، في عام 2021 ، وصل حجم معاملات مهرجان التسوق لمركز تجاري كبير عبر الإنترنت إلى رقم قياسي جديد بأكثر من 500 مليار يوان ، بزيادة قدرها 10٪ تقريبًا مقارنة بعام 2020. وراء هذا الحجم الضخم من المعاملات معالجة البيانات الضخمة. يستخدم المركز التجاري عبر الإنترنت تقنية RDMA لدعم شبكة عالية الأداء وضمان مهرجان تسوق سلس.

دعنا نلقي نظرة على بعض حيل RDMA من أجل زمن انتقال منخفض.

ينقل RDMA بيانات تطبيق الخادم مباشرة من الذاكرة إلى بطاقة الشبكة الذكية (INIC) (بروتوكول RDMA المقوى) ، ويكمل جهاز INIC تغليف حزمة إرسال RDMA ، مما يحرر نظام التشغيل ووحدة المعالجة المركزية.

يكمل جهاز INIC تغليف حزمة إرسال RDMA ، مما يحرر نظام التشغيل ووحدة المعالجة المركزية

هذا يعطي RDMA ميزتين رئيسيتين:

  • نسخة صفرية: عملية تلغي الحاجة إلى نسخ البيانات إلى نواة نظام التشغيل ومعالجة رؤوس الحزم ، مما يؤدي إلى تقليل زمن انتقال الإرسال بشكل كبير.
  • تجاوز النواة والبروتوكول Offتحميل: نواة نظام التشغيل غير متضمنة ولا يوجد منطق رأس معقد في مسار البيانات. هذا يقلل من زمن الوصول ويوفر بشكل كبير موارد وحدة المعالجة المركزية.

RDMA له ميزتان رئيسيتان

ثلاث شبكات RDMA رئيسية

في الوقت الحاضر، هناك ثلاثة أنواع من شبكات RDMA، وهي بتقنية InfiniBandوRoCE (RDMA عبر Ethernet المتقاربة) وiWARP (RDMA عبر TCP).

كان RDMA في الأصل مقصورًا على بنية شبكة Infiniband لضمان النقل الموثوق به على مستوى الأجهزة ، في حين أن RoCE و iWARP هما من تقنيات RDMA المستندة إلى Ethernet.

بتقنية InfiniBand

  • InfiniBand هي شبكة مصممة خصيصًا لـ RDMA.
  • تم اعتماد وضع إعادة التوجيه القاطع لتقليل تأخير إعادة التوجيه.
  • تضمن آلية التحكم في التدفق القائمة على الائتمان عدم فقدان الحزمة.
  • يتطلب محولات ومحولات وأجهزة توجيه شبكة مخصصة من InfiniBand ، والتي تتميز بأعلى تكلفة لبناء الشبكة.

RoCE

  • طبقة النقل هي بروتوكول InfiniBand.
  • تأتي RoCE في نسختين: يتم تنفيذ RoCEv1 على طبقة ارتباط Ethernet ولا يمكن نقلها إلا في Layer L2 ؛ يستضيف RoCEv2 RDMA استنادًا إلى UDP ويمكن نشره على شبكات الطبقة الثالثة.
  • دعم محول الشبكة الذكي المخصص RDMA ، لا حاجة لمحول وجهاز توجيه مخصصين (يدعم تقنية ECN / PFC ، ويقلل من معدل فقدان الحزمة) ، بأقل تكلفة لبناء الشبكة.

iWARP

  • طبقة النقل هي بروتوكول iWARP.
  • يتم تنفيذ iWARP في طبقة TCP لبروتوكول Ethernet TCP / IP ويدعم الإرسال في طبقة L2 / L3. تستهلك اتصالات TCP على الشبكات واسعة النطاق الكثير من وحدة المعالجة المركزية ، لذلك نادرًا ما يتم استخدامها.
  • لا يتطلب iWARP سوى محولات الشبكة لدعم RDMA ، بدون محولات وأجهزة توجيه خاصة ، والتكاليف بين InfiniBand و RoCE.

مع التكنولوجيا المتقدمة ولكن السعر المرتفع ، يقتصر Infiniband على الحوسبة عالية الأداء HPC. مع ظهور RoCE و iWARPC ، انخفضت تكاليف RDMA وانتشرت تقنية RDMA.

يمكن أن يؤدي استخدام هذه الأنواع الثلاثة من شبكات RDMA في مراكز بيانات الحوسبة والتخزين عالية الأداء إلى تقليل زمن انتقال البيانات بشكل كبير وتوفير موارد أكبر لوحدة المعالجة المركزية للتطبيقات.

توفر شبكة InfiniBand أداءً فائقًا لمراكز البيانات ، مع زمن انتقال منخفض يصل إلى 100 نانوثانية ، وهو ترتيب واحد من حيث الحجم أقل من أجهزة Ethernet.

توفر شبكات RoCE و iWARP أداءً عالي التكلفة لمراكز البيانات وتستضيف RDMA عبر Ethernet ، مع الاستفادة الكاملة من أداء RDMA العالي والاستخدام المنخفض لوحدة المعالجة المركزية ، بينما لا يكلف بناؤها الكثير.

تعمل RoCE المستندة إلى UDP بشكل أفضل من iWARP المعتمد على بروتوكول TCP ، بالإضافة إلى تقنية التحكم في تدفق Ethernet غير المفقودة ، تحل مشكلة حساسية فقدان الحزمة. تم استخدام شبكة RoCE على نطاق واسع في مراكز البيانات عالية الأداء في مختلف الصناعات.

وفي الختام

مع تطور شبكات الجيل الخامس ، والذكاء الاصطناعي ، والإنترنت الصناعي ، وغيرها من المجالات الجديدة ، سيصبح تطبيق تقنية RDMA أكثر شيوعًا ، وسيساهم RDMA بشكل كبير في أداء مراكز البيانات.

اترك تعليق

انتقل إلى الأعلى