تطوير تكنولوجيا DPU

ومع تطور تقنيات الحوسبة السحابية والمحاكاة الافتراضية، تطورت أيضًا بطاقات الشبكة، ويمكن تقسيمها إلى أربع مراحل من حيث الوظيفة وبنية الأجهزة.

بطاقة الشبكة الأساسية التقليدية (NIC)

مسؤول عن إرسال واستقبال حزم البيانات باستخدام أجهزة أقل offقدرات التحميل. يقوم الجهاز بتنفيذ طبقة الارتباط المادي للشبكة ومعالجة حزم طبقة MAC باستخدام منطق أجهزة ASIC، كما تدعم بطاقات NIC القياسية الأحدث أيضًا وظائف مثل فحص CRC. ليس لديه قدرات البرمجة.

بطاقة الشبكة الذكية (SmartNIC)

يحتوي على أجهزة معينة لمستوى البيانات offإمكانية التحميل، مثل أجهزة OVS/vRouter offتحميل. يستخدم هيكل الأجهزة FPGA أو معالج متكامل مع FPGA ونواة المعالج (هنا تكون وظيفة المعالج ضعيفة) لتحقيق أجهزة مستوى البيانات offجار التحميل.

وحدة معالجة البيانات المستندة إلى FPGA

هذه بطاقة شبكة ذكية تدعم مستوى البيانات ومستوى التحكم offالتحميل، فضلا عن درجة معينة من البرمجة للتحكم وطائرات البيانات. فيما يتعلق بتطوير هيكل الأجهزة، فهو يضيف معالج وحدة المعالجة المركزية (CPU) للأغراض العامة استنادًا إلى FPGA، مثل Intel CPU.

وحدة معالجة البيانات أحادية الشريحة

هذه شريحة DPU قابلة للبرمجة للأغراض العامة ذات شريحة واحدة، والتي تحتوي على أجهزة غنية offقدرات تسريع التحميل وقابلية البرمجة، ويدعم سيناريوهات الحوسبة السحابية المختلفة وميزات إدارة الموارد الموحدة. ومن ناحية الأجهزة، فهو يعتمد شكل SoC أحادي الشريحة، مما يحقق التوازن بين الأداء واستهلاك الطاقة. التحديات الرئيسية التي تواجه DPU المستندة إلى FPGA في تصميم الأجهزة تأتي من مساحة الشريحة واستهلاك الطاقة. من حيث المساحة، فإن حجم هيكل واجهة PCIe يحد من مساحة الشريحة على اللوحة؛ من حيث استهلاك الطاقة، يرتبط تصميم تبديد الحرارة للوحة ارتباطًا وثيقًا باستهلاك الطاقة للرقاقة واللوحة بأكملها. هذان العاملان يقيدان التطوير المستمر لحلول FPGA. يعتمد حل DPU SoC على خبرة البرامج والأجهزة والإنجازات من NIC إلى DPU المستندة إلى FPGA، وهو مسار تطور مهم لبنية مركز البيانات المتمركزة على DPU.

تعتمد وحدة DPU، باعتبارها ممثلًا نموذجيًا للرقائق المعرفة بالبرمجيات، على مفهوم "محددة بالبرمجيات، ومتسارعة بالأجهزة"، وهي معالج للأغراض العامة يدمج معالجة البيانات باعتبارها الوظيفة الأساسية على الشريحة. يتم استخدام وحدة المعالجة للأغراض العامة DPU للتعامل مع أعمال مستوى التحكم، وتضمن وحدة المعالجة المخصصة أداء معالجة مستوى البيانات، وبالتالي تحقيق التوازن بين الأداء والعمومية. يتم استخدام وحدة المعالجة المخصصة DPU لحل اختناق أداء المحاكاة الافتراضية للبنية التحتية العامة، وتضمن وحدة المعالجة للأغراض العامة عمومية DPU، مما يجعل DPU قابلة للتطبيق على نطاق واسع على سيناريوهات مختلفة للبنية التحتية السحابية، وتحقيق الانتقال السلس لإطار برامج المحاكاة الافتراضية إلى DPU.

تطوير وتطبيق NIC

تعد بطاقة الشبكة الأساسية التقليدية NIC، والمعروفة أيضًا باسم محول الشبكة، جهاز الاتصال الأساسي والأكثر أهمية في نظام شبكة الكمبيوتر. وتتمثل وظيفتها الرئيسية في تحويل البيانات التي يجب إرسالها إلى تنسيق يمكن لجهاز الشبكة التعرف عليه. نظرًا لتطور تكنولوجيا الشبكة، تتمتع بطاقة الشبكة الأساسية التقليدية أيضًا بوظائف أكثر وقد امتلكت في البداية بعض الأجهزة البسيطة offإمكانات التحميل (مثل فحص CRC، وTSO/UF0، وLSO/LR0، وVLAN، وما إلى ذلك)، ودعم SR-IOV وجودة الخدمة لإدارة حركة المرور. تم أيضًا تطوير النطاق الترددي لواجهة الشبكة لبطاقة الشبكة الأساسية التقليدية من 100 ميجا و1000 ميجا إلى 10 جيجا و25 جيجا وحتى 100 جيجا.

تطوير وتطبيق NIC

في شبكة المحاكاة الافتراضية للحوسبة السحابية، توفر بطاقة الشبكة الأساسية التقليدية إمكانية الوصول إلى الشبكة إلى الجهاز الظاهري بثلاث طرق رئيسية.

(1) تستقبل بطاقة الشبكة حركة المرور وتعيد توجيهها إلى الجهاز الظاهري من خلال مكدس بروتوكول kernel لنظام التشغيل.

(2) يتولى برنامج تشغيل وضع المستخدم DPDK بطاقة الشبكة، مما يسمح لحزم البيانات بتجاوز مكدس بروتوكول kernel لنظام التشغيل والنسخ مباشرة إلى ذاكرة الجهاز الظاهري.

(3) باستخدام تقنية SR-IOV، يتم تحويل بطاقة الشبكة الفعلية PF إلى عدة VFs افتراضية مع وظائف بطاقة الشبكة، ثم يتم تمرير VF مباشرة إلى الجهاز الظاهري.

مع بروتوكولات النفق مثل VxLAN وتقنيات التبديل الافتراضية مثل OpenFlow و0VS وما إلى ذلك، يتزايد تعقيد معالجة الشبكة تدريجيًا، وهناك حاجة إلى المزيد من موارد وحدة المعالجة المركزية. ولذلك، ولدت SmartNIC.

تطوير وتطبيق SmartNIC

SmartNIC، بالإضافة إلى وظيفة نقل الشبكة الخاصة ببطاقة الشبكة الأساسية التقليدية، توفر أيضًا أجهزة غنية offإمكانات تسريع التحميل، والتي يمكنها تحسين معدل إعادة التوجيه لشبكة الحوسبة السحابية وتحرير موارد حوسبة وحدة المعالجة المركزية المضيفة.

تطوير وتطبيق SmartNIC

لا يحتوي SmartNIC على وحدة معالجة مركزية (CPU) للأغراض العامة، ويحتاج إلى وحدة المعالجة المركزية المضيفة لإدارة مستوى التحكم. الرئيسي offتحميل كائن تسريع SmartNIC هو مستوى البيانات، مثل Fastpath مستوى البيانات offتحميل المحولات الافتراضية 0VS/vRouter، شبكة RDMA offالتحميل وتخزين NVMe-oF offالتحميل وأمن مستوى بيانات IPsec/TLS offالتحميل، الخ.

ومع ذلك، مع استمرار زيادة سرعة الشبكة في تطبيقات الحوسبة السحابية، لا يزال المضيف يستهلك الكثير من موارد وحدة المعالجة المركزية القيمة لتصنيف حركة المرور وتتبعها والتحكم فيها. أصبحت كيفية تحقيق "الاستهلاك الصفري" لوحدة المعالجة المركزية المضيفة هي الاتجاه البحثي التالي لموردي الخدمات السحابية.

تطوير وتطبيق DPU القائم على FPGA

بالمقارنة مع SmartNIC، تضيف وحدة DPU المستندة إلى FPGA وحدة معالجة وحدة المعالجة المركزية للأغراض العامة إلى بنية الأجهزة، مما يشكل بنية FPGA+CPU، مما يسهل التسريع و offتحميل البنية التحتية العامة مثل الشبكة والتخزين والأمن والإدارة. في هذه المرحلة، يكون شكل منتج DPU هو FPGA+CPU بشكل أساسي. تتمتع وحدة DPU المستندة إلى بنية أجهزة FPGA + CPU بقابلية برمجة جيدة للبرامج والأجهزة.

تطوير وتطبيق DPU القائم على FPGA

في المرحلة المبكرة من تطوير DPU، اختارت معظم الشركات المصنعة لـ DPU هذا المخطط. يتمتع هذا المخطط بوقت تطوير قصير نسبيًا وتكرار سريع، ويمكنه إكمال تطوير الوظائف المخصصة بسرعة، وهو مناسب لمصنعي DPU لإطلاق المنتجات بسرعة والاستيلاء على السوق. ومع ذلك، مع ترحيل النطاق الترددي للشبكة من 25 جيجا إلى 100 جيجا، فإن وحدة المعالجة المركزية (DPU) المستندة إلى بنية أجهزة FPGA+CPU محدودة بعملية الشريحة وبنية FPGA، مما يجعل من الصعب تحقيق تحكم جيد في منطقة الشريحة واستهلاك الطاقة عند السعي لتحقيق إنتاجية أعلى. ، مما يحد من التطوير المستمر لبنية DPU هذه.

تطوير وتطبيق DPU SoC NIC

DPU SoC عبارة عن بنية أجهزة تعتمد على ASIC، والتي تجمع بين مزايا ASIC ووحدة المعالجة المركزية وتوازن بين الأداء الممتاز للمسرعات المخصصة والمرونة القابلة للبرمجة للمعالجات ذات الأغراض العامة. إنه حل تكنولوجيا DPU أحادي الشريحة الذي يدفع تطوير تكنولوجيا الحوسبة السحابية.

كما ذكرنا في الفقرة السابقة، على الرغم من أن DPU تلعب دورًا مهمًا في الحوسبة السحابية، إلا أن حلول DPU التقليدية يتم تقديمها في الغالب في المخططات المستندة إلى FPGA. مع ترحيل الخادم من 25G إلى خادم 100G من الجيل التالي، تواجه التكلفة واستهلاك الطاقة والوظائف والجوانب الأخرى تحديات خطيرة. لا تتمتع شريحة DPU SoC أحادية الشريحة بمزايا هائلة من حيث التكلفة واستهلاك الطاقة فحسب، بل تتمتع أيضًا بإنتاجية عالية وقدرات برمجة مرنة. وهو لا يدعم فقط إدارة التطبيقات ونشر الأجهزة والحاويات الافتراضية، بل يدعم أيضًا التطبيقات المعدنية.

تطوير وتطبيق DPU SoC NIC

مع التطوير المستمر لتقنية DPU، أصبحت DPU SoC القابلة للبرمجة للأغراض العامة مكونًا رئيسيًا في بناء مراكز البيانات لموردي الخدمات السحابية. يمكن لـ DPU SoC تحقيق إدارة اقتصادية وفعالة لموارد الحوسبة وموارد الشبكة في مركز البيانات. يمكن لوحدة DPU SoC ذات الوظائف الغنية والإمكانيات القابلة للبرمجة أن تدعم سيناريوهات الحوسبة السحابية المختلفة وإدارة الموارد الموحدة، وتحسين استخدام موارد الحوسبة في مركز البيانات.

في تصميم وتطوير واستخدام DPU، استثمر عمالقة الرقائق ومقدمو الخدمات السحابية الرائدون في الداخل والخارج الكثير من موارد البحث والتطوير، وحققوا فعالية جيدة من حيث التكلفة من خلال الاستكشاف والممارسة المستمرين.

DPU في AWS (Amazon Cloud)

AWS هي الشركة الرائدة عالميًا في مجال توفير خدمات الحوسبة السحابية وحلولها. أصبح نظام AWS Nitro DPU حجر الزاوية الفني لخدمة AWS السحابية. تستخدم AWS نظام Nitro DPU لتحليل ونقل وظائف الشبكة والتخزين والأمن والمراقبة إلى أجهزة وبرامج مخصصة، وتوفر جميع الموارد تقريبًا على الخادم لمثيلات الخدمة، مما يقلل التكاليف بشكل كبير. يمكن لتطبيق Nitro DPU في Amazon Cloud أن يجعل الخادم يكسب آلاف الدولارات سنويًا. يتكون نظام Nitro DPU بشكل أساسي من الأجزاء التالية.

تطبيق DPU في AWS (Amazon Cloud)

(1) بطاقة نيترو. سلسلة من الأجهزة المخصصة للشبكة والتخزين والتحكم لتحسين الأداء العام للنظام.

(2) شريحة أمان نيترو. قم بنقل وظائف المحاكاة الافتراضية والأمان إلى أجهزة وبرامج مخصصة، وتقليل سطح الهجوم، وتحقيق نظام أساسي سحابي آمن.

(3) برنامج مراقبة نيترو. برنامج إدارة Hypervisor خفيف الوزن يمكنه إدارة الذاكرة وتخصيص وحدة المعالجة المركزية، وتوفير أداء لا يمكن تمييزه عن الأداء العادي.

يوفر نظام Nitro DPU وظائف المفاتيح والشبكة والأمان والخادم والمراقبة، ويطلق موارد الخدمة الأساسية للأجهزة الافتراضية للعملاء، ويمكّن AWS من توفير المزيد من أنواع المثيلات المعدنية، بل وحتى زيادة أداء الشبكة لمثيلات محددة 100Gbps.

نفيديا دي بي يو

NVIDIA هي شركة لأشباه الموصلات تعمل بشكل أساسي على تصميم وبيع وحدات معالجة الرسومات (GPUs)، المستخدمة على نطاق واسع في مجالات الذكاء الاصطناعي والحوسبة عالية الأداء (HPC). في أبريل 2020، استحوذت NVIDIA على شركة Mellanox، وهي شركة متخصصة في شرائح وأجهزة الشبكات، مقابل 6.9 مليار دولار، ثم أطلقت سلسلة BlueField من وحدات DPU.

ترث NVIDIA BlueField-3 DPU (كما هو موضح في الشكل 7) الميزات المتقدمة لـ BlueField-2 DPU وهي أول وحدة DPU مصممة للذكاء الاصطناعي والحوسبة المتسارعة. يوفر BlueField-3 DPU ما يصل إلى شبكة 400 جيجابت في الثانية اتصال ويمكن offالتحميل والتسريع والعزل ودعم وظائف الشبكة والتخزين والأمن والإدارة المحددة بالبرمجيات.

إنتل الاتحاد البرلماني الدولي

Intel IPU هو جهاز شبكة متقدم مزود بمسرعات معززة واتصالات Ethernet، والتي يمكنها استخدام نوى مخصصة قابلة للبرمجة مقترنة بإحكام لتسريع وظائف البنية التحتية وإدارتها. يوفر الاتحاد البرلماني الدولي بنية تحتية كاملة offالتحميل، ويعمل كنقطة تحكم مضيفة لتشغيل تطبيقات البنية التحتية، مما يوفر طبقة إضافية من الأمان. باستخدام Intel IPU، يمكن أن تكون جميع خدمات البنية التحتية offيتم تحميلها من الخادم إلى IPU، مما يؤدي إلى تحرير موارد وحدة المعالجة المركزية للخادم، وكذلك تزويد موفري الخدمات السحابية بنقطة تحكم مستقلة وآمنة.

خارطة طريق إنتل

في عام 2021، أعلنت إنتل عن منتجات Oak Springs Canyon وMount Evans IPU في يوم Intel Architecture Day. من بينها، Oak Springs Canyon هو منتج IPU قائم على FPGA، وMount Evans IPU هو منتج IPU قائم على ASIC.

تم تجهيز Intel Oak Springs Canyon IPU بوحدة المعالجة المركزية Intel Agilex FPGA وXeon-D. Intel Mount Evans IPU عبارة عن SoC (System-on-a-Chip) تم تصميمه بشكل مشترك بين Intel وGoogle. ينقسم Mount Evans بشكل أساسي إلى قسمين: النظام الفرعي I0 والنظام الفرعي للحوسبة. يستخدم جزء الشبكة ASIC لمعالجة الحزم، والذي يتميز بأداء أعلى بكثير واستهلاك أقل للطاقة من FPGA. يستخدم النظام الفرعي للحوسبة 16 نواة ARM Neoverse N1، والتي تتمتع بقدرات حوسبة قوية للغاية.

DPU في علي بابا كلاود

تستكشف Alibaba Cloud أيضًا تقنية DPU باستمرار. في قمة Alibaba Cloud في عام 2022، Alibaba Cloud offتم إصدار معالج البنية التحتية السحابية رسميًا CIPU، والذي يعتمد على بنية Shenlong. سلف CIPU هو بطاقة MoC (Micro Server on a Card)، والتي تلبي تعريف DPU من حيث الوظيفة وتحديد المواقع. تحتوي بطاقة MoC على وحدات I0 وتخزين ومعالجة مستقلة، وتتولى أعمال الشبكة والتخزين والمحاكاة الافتراضية للأجهزة. لقد حلت بطاقات MoC من الجيل الأول والثاني المعنى الضيق المتمثل في حوسبة المحاكاة الافتراضية بدون أي مشاكل عامة، ولا يزال البرنامج ينفذ جزء الشبكة والتخزين من المحاكاة الافتراضية. تدرك بطاقة MoC من الجيل الثالث تقوية بعض وظائف إعادة توجيه الشبكة، كما تم تحسين أداء الشبكة بشكل كبير. تدرك بطاقة MoC من الجيل الرابع الأجهزة الكاملة offتحميل الشبكة والتخزين ويدعم أيضًا قدرة RDMA.

باعتباره نظام معالج مركز بيانات مصممًا لنظام Feitian، فإن Alibaba Cloud CIPU له معنى كبير لـ Alibaba Cloud لبناء جيل جديد من أنظمة هندسة الحوسبة السحابية الكاملة للبرامج والأجهزة.

DPU في محرك البركان

يستكشف Volcano Engine أيضًا باستمرار طريق DPU المطور ذاتيًا. تعتمد وحدة DPU المطورة ذاتيًا تقنية المحاكاة الافتراضية المتكاملة الناعمة والصلبة، بهدف تزويد المستخدمين بخدمات حوسبة عالية الأداء مرنة وقابلة للتطوير. في منتجات الحوسبة المرنة لـ Volcano Engine، تم تجهيز الجيل الثاني من الخادم المعدني المرن والخادم السحابي من الجيل الثالث بوحدات DPU ذاتية التطوير، والتي تم التحقق منها على نطاق واسع في قدرات المنتج وسيناريوهات التطبيق. مثيل EBM من الجيل الثاني لمحرك البركان، والذي كان offتم تسويقه تجاريًا رسميًا في عام 2022، وكان أول محرك يحمل وحدة DPU المطورة ذاتيًا لمحرك Volcano Engine. إنها لا تحتفظ فقط بمزايا الاستقرار والأمن التي تتمتع بها الأجهزة المادية التقليدية، ويمكنها تحقيق عزل مادي آمن، ولكنها تتمتع أيضًا بمزايا المرونة والمرونة التي تتمتع بها الأجهزة الافتراضية. إنه جيل جديد من الخوادم السحابية عالية الأداء ذات المزايا المتعددة. يجمع مثيل ECS من الجيل الثالث من Volcano Engine، والذي تم إصداره في النصف الأول من عام 2023، أيضًا بين بنية وحدة DPU الأحدث التي تم تطويرها ذاتيًا من Volcano Engine وتقنية التبديل الظاهري والمحاكاة الافتراضية المطورة ذاتيًا، وأداء الشبكة والتخزين IO. تم تحسينها بشكل كبير.

اترك تعليق

انتقل إلى الأعلى