Qu'est-ce que RDM ?

Comme nous le savons tous, la croissance explosive des données Internet a posé de grands défis à la capacité de traitement des centres de données.

L'informatique, le stockage et le réseau sont les trois moteurs du développement des centres de données.

Avec le développement du CPU, du GPU et du FPGA, la puissance de calcul a été considérablement améliorée. Stockage Avec l'introduction du lecteur à état solide (SSD), la latence d'accès aux données a été considérablement réduite.

Cependant, le développement du réseau est évidemment à la traîne, le délai de transmission est élevé, devenant progressivement le goulot d'étranglement des performances du centre de données.

la puissance de calcul a été grandement améliorée

Dans un datacenter, 70% du trafic est du trafic est-ouest (trafic entre serveurs). Ce trafic traite généralement le flux de données pendant le calcul parallèle distribué haute performance dans les centres de données et est transmis sur les réseaux TCP/IP.

Si le taux de transmission TCP/IP entre les serveurs augmente, les performances du centre de données augmenteront également.

70% du trafic est du trafic est-ouest

Transfert TCP/IP entre serveurs

Le processus permettant au serveur A d'envoyer des données au serveur B dans le centre de données est le suivant :

Transfert TCP/IP entre serveurs

  1. Les données de contrôle du processeur sont copiées du tampon APP de A vers le tampon du système d'exploitation.
  2. Données de contrôle du processeur Ajoutez les en-têtes TCP et IP au tampon du système d'exploitation (OS).
  3. Ajoutez des en-têtes de paquet TCP et IP pour envoyer les données à la carte réseau et ajoutez des en-têtes de paquet Ethernet.
  4. Le paquet est envoyé par la carte réseau et transmis à la carte réseau du serveur B via le réseau Ethernet.
  5. L'adaptateur réseau du serveur B décharge l'en-tête Ethernet du paquet et le transfère au tampon du système d'exploitation.
  6. Le CPU décharge les en-têtes de paquets TCP et IP dans le tampon du système d'exploitation.
  7. Le CPU contrôle le transfert des données désinstallées vers le tampon APP.

Comme le montre le processus de transmission des données, les données sont copiées plusieurs fois dans le tampon du serveur et les en-têtes TCP et IP doivent être ajoutés ou désinstallés dans le système d'exploitation. Ces opérations augmentent non seulement le délai de transmission des données, mais consomment également beaucoup de ressources CPU, qui ne peuvent pas répondre aux exigences du calcul haute performance.

Alors, comment construire un réseau de centre de données hautes performances avec un débit élevé, une latence ultra-faible et une faible surcharge CPU ?

La technologie RDMA peut le faire.

Qu'est-ce que le RDM

L'accès direct à la mémoire à distance (RDMA) est une nouvelle technologie d'accès à la mémoire qui permet aux serveurs de lire et d'écrire des données en mémoire à partir d'autres serveurs à grande vitesse sans traitement fastidieux par le système d'exploitation/CPU.

RDMA n'est pas une nouvelle technologie et a été largement utilisé dans le calcul haute performance (HPC). Avec la demande de développement d'une bande passante élevée et d'un faible délai dans les centres de données, RDMA a été progressivement appliqué dans certains scénarios qui nécessitent des centres de données à hautes performances.

Par exemple, en 2021, le volume de transactions du festival de shopping d'un grand centre commercial en ligne a atteint un nouveau record de plus de 500 milliards de yuans, soit une augmentation de près de 10 % par rapport à 2020. Derrière un volume de transactions aussi énorme se cache un traitement massif de données. Le centre commercial en ligne utilise la technologie RDMA pour prendre en charge un réseau haute performance et assurer un festival de shopping fluide.

Jetons un coup d'œil à certaines des astuces de RDMA pour une faible latence.

RDMA transfère directement les données d'application du serveur de la mémoire à la carte réseau intelligente (INIC) (protocole RDMA solidifié), et le matériel INIC complète l'encapsulation des paquets de transmission RDMA, libérant le système d'exploitation et le CPU.

le matériel INIC complète l'encapsulation des paquets de transmission RDMA, libérant le système d'exploitation et le CPU

Cela donne à RDMA deux avantages majeurs :

  • Copie zéro : Processus qui élimine le besoin de copier les données vers le noyau du système d'exploitation et de traiter les en-têtes de paquet, ce qui réduit considérablement la latence de transmission.
  • Contournement du noyau et protocole Offcharge: Le noyau du système d'exploitation n'est pas impliqué et il n'y a pas de logique d'en-tête compliquée dans le chemin des données. Cela réduit la latence et économise considérablement les ressources du processeur.

RDMA a deux avantages majeurs

Trois grands réseaux RDMA

Il existe actuellement trois types de réseaux RDMA, à savoir InfiniBand, RoCE (RDMA sur Ethernet convergé) et iWARP (RDMA sur TCP).

RDMA était à l'origine exclusif à l'architecture de réseau Infiniband pour assurer un transport fiable au niveau matériel, tandis que RoCE et iWARP sont des technologies RDMA basées sur Ethernet.

InfiniBand

  • InfiniBand est un réseau conçu spécifiquement pour RDMA.
  • Le mode de transfert Cut-Through est adopté pour réduire le délai de transfert.
  • Le mécanisme de contrôle de flux basé sur le crédit garantit l'absence de perte de paquets.
  • Il nécessite des adaptateurs réseau dédiés, des commutateurs et des routeurs d'InfiniBand, qui a le coût de construction de réseau le plus élevé.

ROCE

  • La couche transport est le protocole InfiniBand.
  • RoCE existe en deux versions : RoCEv1 est implémenté sur la couche de liaison Ethernet et ne peut être transmis qu'au niveau de la couche L2 ; RoCEv2 héberge RDMA basé sur UDP et peut être déployé sur des réseaux de couche 3.
  • Prise en charge de l'adaptateur réseau intelligent dédié RDMA, pas besoin de commutateur et de routeur dédiés (prise en charge de la technologie ECN/PFC, réduction du taux de perte de paquets), le coût de construction du réseau le plus bas.

iWARP

  • La couche transport est le protocole iWARP.
  • iWARP est implémenté au niveau de la couche TCP du protocole Ethernet TCP/IP et prend en charge la transmission au niveau de la couche L2/L3. Les connexions TCP sur les réseaux à grande échelle consomment beaucoup de CPU, elles sont donc rarement utilisées.
  • iWARP ne nécessite que des adaptateurs réseau pour prendre en charge RDMA, sans commutateurs ni routeurs privés, et coûte entre InfiniBand et RoCE.

Avec une technologie de pointe mais un prix élevé, Infiniband se limite au calcul haute performance HPC. Avec l'émergence de RoCE et d'iWARPC, les coûts RDMA sont réduits et la technologie RDMA est popularisée.

L'utilisation de ces trois types de réseaux RDMA dans des centres de données de stockage et de calcul hautes performances peut réduire considérablement la latence de transfert de données et fournir une plus grande disponibilité des ressources CPU pour les applications.

Le réseau InfiniBand offre des performances extrêmes aux centres de données, avec une latence de transmission aussi faible que 100 nanosecondes, soit un ordre de grandeur inférieur à celui des périphériques Ethernet.

Les réseaux RoCE et iWARP apportent des performances coûteuses aux centres de données et hébergent RDMA sur Ethernet, tirant pleinement parti des hautes performances et de la faible utilisation du processeur de RDMA, tout en ne coûtant pas cher à construire.

Le RoCE basé sur UDP fonctionne mieux que l'iWARP basé sur TCP et, combiné à la technologie de contrôle de flux Ethernet sans perte, résout le problème de sensibilité à la perte de paquets. Le réseau RoCE a été largement utilisé dans les centres de données hautes performances de diverses industries.

Conclusion

Avec le développement de la 5G, de l'intelligence artificielle, de l'Internet industriel et d'autres nouveaux domaines, l'application de la technologie RDMA sera de plus en plus populaire, et RDMA apportera une grande contribution à la performance des centres de données.

Laisser un commentaire

Remonter en haut