Wie passt man optische Module in Rechenzentren an?

Der 11. Network Platform Department Technology Summit endete am 6. Juli 2022 erfolgreich in Shenzhen. Dieser Gipfel konzentrierte sich auf die vier Hauptbereiche Hardwareforschung und -entwicklung, Hardwarebeschleunigung, Netzwerkprodukte und Netzwerkbetrieb. Es demonstrierte umfassend die kontinuierliche Verbesserung der Forschungs- und Entwicklungskapazitäten und Explorationsergebnisse der Netzwerkplattformabteilung.

Optische Module und Anwendungen

Erstmals ist das optische Modul auf der Technologiekonferenz zu sehen. Auf der Konferenz wurde der Entwicklungsprozess optischer Modulprodukte von der kommerziellen Nutzung bis zur kundenspezifischen Anpassung untersucht. Es konzentrierte sich auf die Zukunft, beschritt kritische Technologiepfade und erforschte gleichzeitig neue Entwicklungsmodelle.

Ein optisches Modul ist ein kleines System mit vollständiger Funktion und Struktur. Der elektrische Signaleingang wird von Chips wie DSP analysiert, tritt dann in den Treiberchip ein und steuert dann den optischen Chip zur Modulation an. Das modulierte Licht tritt zur Kopplung in das passive optische System ein, und schließlich tritt das gekoppelte Licht zur Übertragung in das optische Fasersystem ein.

Optische Module sind nicht nur in Rechenzentren zu finden, sondern werden zunächst in Telekommunikationsnetzen, insbesondere Fernübertragungsnetzen, eingesetzt. Mit der Entwicklung von Datenzentren, einschließlich der Erhöhung der Bandbreite von Geräten, sind jedoch optische Module in den Datenzentren verwendet worden. Da die Entwicklungsgeschwindigkeit von Rechenzentren viel schneller ist als die der traditionellen Telekommunikationsindustrie, hat auch das Nachfragewachstum nach optischen Modulen in Rechenzentren das der letzteren bei weitem übertroffen.

Anwendungen optischer Module

Abbildung 1: Anwendungen optischer Module

Von der gewerblichen Nutzung bis zur Beschaffung

Für das Rechenzentrum ist das frühe 40G-Netz ein geschlossenes System. Was das Rechenzentrum beispielsweise kauft, ist das gesamte Netzwerksystem des traditionellen Geräteherstellers, einschließlich Software, Switching-Equipment und optischen Modulen. Die Kosten kommerzieller Systeme sind hoch, und sie sind nicht einfach zu bedienen und zu warten, wenn ein Problem auftritt. Dies sind wichtige Gründe für die Rechenzentren, von der kommerziellen Nutzung auf die Beschaffung umzustellen.

Kombiniert mit der Online-Anwendung von 25G-Servern, 25G SFP28, und optische 100G-QSFP28-Module werden zu Beginn der Beschaffung unweigerlich vor Herausforderungen stehen. Die erste Herausforderung ist die Anpassung zwischen den Geräten. Obwohl es beim Test einzelner optischer Module keine Probleme gibt, ist das Rechenzentrum in der Beschaffungsphase auf viele Gerätekompatibilitätsprobleme gestoßen.

Das Rechenzentrum stellte fest, dass die Module verschiedener Hersteller an jedem Port auf verschiedenen Geräten unterschiedliche Leistungen erbringen, und auch die Leistung auf verschiedenen Geräten unterschiedlich ist. Um sicherzustellen, dass verschiedene Module gut kommunizieren können, muss ein perfektes Anpassungsschema erstellt werden, um ein komplexes Testsystem zu bilden. Oft ist es notwendig, Portparameter eins zu eins zu optimieren.

End-to-End-Qualitäts-/Kostenkontrolle

Abbildung 2: End-to-End-Qualitäts-/Kostenkontrolle

Aber es wird rentabel, wenn die gekauften optischen Module sehr fein verwaltet werden können. Eine große Anzahl von optischen 40G-QSFP-Modulen fiel zwischen 2015 und 2017 im Rechenzentrum aus. Das liegt hauptsächlich daran, dass der Systemintegrator alle optischen Module ausgelagert hat, der nur ein geringes Verständnis für optische Module hatte. Außerdem ist der Integrator darauf angewiesen, dass der Modulhersteller das Qualitätsproblem des optischen Moduls abfängt.

Wenn Sie Ihre Anwendungsszenarien kombinieren, die technische Lösung der End-to-End-Module verwalten, deren Prozesse steuern und optimieren und die Qualitätsmanagementlösung des Systems richtig implementieren, können Sie die oben genannten Probleme vollständig vermeiden. Durch die kontinuierliche Optimierung und Kontrolle des selbstleuchtenden Moduls für 2 bis 3 Jahre sind nicht nur die Kosten im Rechenzentrum Jahr für Jahr gestiegen, sondern auch die Qualität wurde systematisch verbessert, und die Ausfallrate der Produktionsumgebung hat zugenommen kontinuierlich reduziert worden.

Von der Beschaffung bis zur Individualisierung

Ein weiterer Vorteil des Selbstkaufs von optischen Modulen besteht darin, dass sie die vielfältigen Anpassungsanforderungen erfüllen können, die durch die diversifizierte Entwicklung von Rechenzentrumsnetzwerken entstehen. Beispielsweise erfordern 10-km-Spektrumüberwachungsszenarien, dass 10-km-Module miteinander verbunden werden. Aufgrund des hohen Preises integrierter Transceiver-Module nutzen Rechenzentren die vorhandene Modulplattform, um einige kleinere Verbesserungen vorzunehmen, um kostengünstige Lösungen zu erzielen.

Ein weiteres Beispiel ist die Anforderung von DCI für 2 km Lichtteilung. Das ganze Projekt ist sehr profitabel, aber die technische Lösung ist sehr herausfordernd. Es ist notwendig, die Netzwerkumgebung des Rechenzentrums zu kombinieren und eine tiefgreifende Designoptimierung von Modulen durchzuführen, die eine Reihe von Upgrades auf dem optischen Teil des Moduls und auf Chipebene umfasst.

Erfüllen Sie eine Vielzahl von individuellen Anforderungen

Abbildung 3: Erfüllen Sie eine Vielzahl von kundenspezifischen Anforderungen

Mit der Einführung von 100G-Servern in Chargen beginnt das 200G-Netzwerk mit Massenproduktionsanwendungen. Die im gesamten Netzwerk verwendeten optischen Module werden von 100G QSFP28 auf 200G QSFP56 bzw 200 G QSFP-DD. Die gesamte Industriekette ähnelt einem „Rugby“, mit einem großen Mittel- und einem kleinen Ende. Es gibt mehr als 200 Unternehmen in der gesamten Branche, die behaupten, optische Module herstellen zu können, aber an der Spitze der Industriekette stehen möglicherweise nicht mehr als 10 Chiphersteller, insbesondere diejenigen mit erstklassigen Techniken wie DSP.

Die Zahl der nachgelagerten Anwendungsparteien oder Endverbraucher ist weit geringer als die Zahl der Hersteller optischer Module, was auf eine chaotische Industriestruktur hinweist. Dies impliziert auch einige andere Probleme: unklare und unspezifische Nachfrage und unklarer Wert des Chips. Das erste Ziel von optischen Modulen besteht darin, diese Ökologie zu durchbrechen, dh Rechenzentren und Chiphersteller diskutieren direkt Anforderungen an Spezifikation und Kosten (Verbrauch), um eine echte End-to-End-Kostenwettbewerbsfähigkeit zu erreichen.

Das Rechenzentrum hat auch den Mehrparteien-JDM-Modus gestartet, d. h. das Rechenzentrum stellt dem Chiphersteller direkt Spezifikationen zur Verfügung, und einige kundenspezifische Funktionen werden vom Hersteller entsprechend den Anforderungen des Rechenzentrums optimiert oder neu entwickelt. Das Modulschema wird gemeinsam von Rechenzentrum und Modulhersteller entworfen, letzterer ist für die Produktion verantwortlich.

„Die Ökologie brechen“

Abbildung 4: „Die Ökologie brechen“

Beim Eintritt in die Selbstforschungsphase ist die wichtigste Frage, die Rechenzentren berücksichtigen müssen, wie sie bei der Gestaltung und Auswahl von Lösungen maximalen Wert erzielen können. „Licht“ und „Strom“ unterscheiden sich grundlegend in den Übertragungseigenschaften. Licht hat einige spezielle Eigenschaften, wie z. B. optische Leistungseigenschaften bei unterschiedlichen Temperaturen, Bandbreiteneigenschaften bei unterschiedlichen Strömen und Wellenlängeneigenschaften unter unterschiedlichen Bedingungen. Im selbstentwickelten Modus kann das Rechenzentrum die Optimierung der Lösung in Kombination mit den Systemspezifikationen kontinuierlich vorantreiben und ermöglichen, dass der elektronische Chip besser für Licht geeignet ist, um größere technische Vorteile auszuüben.

Optische Module werden oft als Standardprodukte wahrgenommen, da die Schalenform und die Spezifikationen der Eingangs- und Ausgangsschnittstelle definiert sind. Allerdings ist die interne optische Verpackung mit verschiedenen Formfaktoren etwas Besonderes. Jeder Hersteller hat ein anderes Design und kundenspezifische Fertigungsanlagen.

Wenn das Rechenzentrum schnell ein selbst entwickeltes Modul entwerfen und herstellen möchte, steht das Rechenzentrum vor dem Problem der Plattformauswahl. Im selbst entwickelten optischen Modulmodus, der die Reife voll ausnutzt 100G QSFP28 Verpackungsplattform für optische Module und gleichzeitig einige gezielte Upgrades durchzuführen, ist die beste Lösung, um die Anforderungen an Qualitätsstabilität, Entwicklungseffizienz und niedrige Kosten zu erfüllen.

Erkundung der nächsten Stufe

Das Netzwerk des Rechenzentrums iteriert alle 2 bis 3 Jahre. Den Verkehrszeichen des Switching-Chips nach zu urteilen, wird das umfassende 112G-Netzwerk im Jahr 2023 kommen. In letzter Zeit wurde die Entwicklung des 112-Gbps-basierten Netzwerks der nächsten Generation diskutiert, einschließlich Netzwerkkarten und Switching-Equipment.

Auf der Ebene der optischen Module hat das Rechenzentrum in den letzten zwei Jahren auch einige technische Forschung betrieben. Von 100G auf 400G und 800G wird der Stromverbrauch des Moduls weiter steigen. Gleichzeitig wird auch die BER (Bitfehlerrate) einer exponentiellen Verschlechterung ausgesetzt sein. Die Lösung dieser Probleme erfordert eine Steigerung der Design- und Optimierungsarbeit auf Chipebene und sogar die Teilnahme am Chipdesign. Auch optische Verpackungen stehen vor einer Reihe von Herausforderungen, und verschiedene neue Lösungen zur Verbesserung der optischen Integration müssen erforscht werden. Im Übertragungsschema muss das Rechenzentrum auch weiterhin untersuchen, um die Anforderungen des Netzwerkszenarios des Rechenzentrums zu erfüllen.

Entwicklung der Rate

Abbildung 5: Entwicklung der Rate

Die Signalübertragungsdistanz ist ein grundlegendes Merkmal der Verbindungshardware und eine wichtige Einschränkung, die jedes Mal diskutiert werden muss, wenn Rechenzentren zukünftige technische Lösungen und Entwicklungstrends diskutieren. Mit der kontinuierlichen Verbesserung der Grundgeschwindigkeit wird sich die physische Entfernung des Computerraums oder IDC des Rechenzentrums nicht wesentlich ändern.

Daher muss bei der Auswahl eines Moduls oder einer technischen Lösung zur Verbindung zweier Geräte mit der Iteration der Übertragungstechnik iteriert werden. Es gibt drei Schnittstellen in der Evolution von „Distanz“. Von der Nahzugangsseite geht „optisch“ rein und „Kupfer“ raus. Von der internen Verbindung des IDC-Raums ist es Single-Mode statt Multi-Mode. Aus der Perspektive der DCI-Verbindung ist es das kontinuierliche Sinken der kohärenten Technologie.

In den oben genannten Aspekten hat das Rechenzentrum auch einige fortschrittliche Layouts erstellt, einschließlich des 112-Gbit/s-Netzwerkkartenzugriffs, und das Rechenzentrum wird auf der Grundlage der 112-Gbit/s-TAC-Technologie und der entsprechenden Chip-Kooperationsentwicklung bereitgestellt. In Bezug auf die Verbindung innerhalb des IDC-Raums ist das MM SR-Modul möglicherweise nicht in der Lage, die Verbindung innerhalb des Rechenzentrumsraums (Gebäudebereich) zu erfüllen, insbesondere die raumübergreifende Verbindung. Hier erforscht das Rechenzentrum auch Singlemode- statt Multimode-Lösungen, insbesondere bei der Singlemode-vollintegrierten Chiplösung wurden auch einige gemeinsame Entwicklungsversuche unternommen. Die Wahl und der Ersatz von IMDD und kohärent, das Rechenzentrum wird voraussichtlich in der 1.6T oder Einzelwellenlänge ankommen 400 G QSFP-DD Generation, so dass das zukünftige Rechenzentrum einige Arbeiten im Bereich von Coherent-lite erledigen wird, insbesondere des oDSP-Algorithmus.

Ausgehend von der Chip

Ein wesentlicher Unterschied zwischen einem optischen Modul und herkömmlichen elektrischen Geräten/Geräten besteht darin, dass es nicht nur „elektrische“, sondern auch „optische“ Eigenschaften aufweist, sodass es sowohl dem Mooreschen Gesetz der Mikroelektronik als auch dem Mooreschen Gesetz der Optoelektronik unterliegen muss. Mit dem Trend des Lichteintritts und des Kupferrückzugs integriert die Welt ständig optoelektronische Kernressourcen. Hersteller, angeführt von Giganten im Bereich traditioneller elektronischer Chips, expandieren auch im Bereich der Optoelektronik, um sich auf den zukünftigen Trend der optoelektronischen Integration vorzubereiten. Ebenso müssen auch Rechenzentren etwas tun, um eine Herausforderung nach der anderen zu meistern. Die Entwicklung von 112 Gbit/s kann ein langer Prozess sein. Das auf 400G Serdes basierende 112G-System ist die beste Gelegenheit für Rechenzentren, die jetzt bereitgestellt und in Zukunft erkundet werden können.

Hinterlasse einen Kommentar

Nach oben scrollen