400G QSFP-DD トランシーバー モジュールはどのようにテストされましたか?

400G QSFP-DD トランシーバー モジュールは、400G カスタマー インターフェイスの主流のパッケージ仕様です。 次の記事では、光ネットワーク設計者、ネットワーク コンポーネント メーカー、およびエンド ユーザー向けに、QSFP-DD モジュールのテスト、トラブルシューティング、および検証を成功させるための重要な要素を共有します。

顧客インターフェイスの速度は着実に向上しており、通常の速度は 100 年ごとに少なくとも 28 倍になっています。 400GE は QSFP1 インターフェイスを介して広く展開されており、400G 展開の初期段階にあります。 IEEE802.3 は、XNUMX.bs の一部として XNUMXG イーサネット クライアント インターフェイス標準を開発しました。 off2017 年 8 月に正式に標準化されました。アーリー アダプターは CFP-28 パッケージ仕様を使用していますが、より広範な市場は、広く採用されている QSFPXNUMX とのある程度の下位互換性を可能にする QSFP-DD に注目しています。

イーサネットには幅広いアプリケーションがあり、さまざまな PMD (物理メディア依存) で利用できるため、80 つの「QSFP-DD」スロットで数メートルのパッシブ銅線ケーブル DAC から多数のアプリケーションをサポートできます。コヒーレント ZR の XNUMX km にケーブルを接続します。 また、OSFP パッケージ仕様に重点を置いている企業もいくつかあります。 拡張性や下位互換性はありませんが、 off電気信号の完全性と熱管理の点でいくつかの利点があります。 QSFP-DD に関する以下の内容のほとんどは、OSFP と、OSFP に基づく多くのアプリケーションをサポートする VIAVI ONT ファミリーに適用されます。

400G は、電気モジュールからホストへのインターフェイスと電気または光 PMD の両方で、高次 (PAM-4) 変調に依存しています。 PAM-4 変調は、特定の帯域幅のデータ容量を最大化するために使用されますが、複雑さとパフォーマンスの点で大きな課題があります。これは、信頼性の高いデータ伝送を実装するためにリンクに前方誤り訂正 (FEC) コーディングが必要であることも意味します。

QSFP-DD を選ぶ理由

100G イーサネットは、CFP プラガブル モジュールに基づく初期設計で 2008 年に導入されました。 第 2 世代のシステムは、CFP28 (または大手機器メーカーの CPAK) に移行した後、QSFP4 を選択しました。これにより、広範で費用対効果の高い大量採用が促進されました。 CFP28 は QSFP28 の初期の課題でしたが、QSFP100 は多くの要因により 400G の大幅な成長をもたらしました。 業界はパッケージ仕様の重要性を認識しており、8G パッケージ仕様の多段階の進化に伴う複雑さとコストの課題を最小限に抑えたいと考えています。 CFP400 を使用すると、初心者は 28G を開発して検証できます。 しかし、密度、電力、コスト、および「互換性」の要件を満たしていなかったため、業界はすぐに QSFP-DD をターゲットとして採用しました。 そして、優れた技術的ソリューションを提供する代替の OSFP を誰かが思いつきましたが、従来のレガシー トランシーバーのインターフェイス サポートの緊急の必要性を満たしていませんでした。 原則として、QSFP-DD 光ポートは従来の QSFP-400 光モジュールをサポートできます。これにより、スイッチ メーカーは 100G モジュールと一緒に出荷できる XNUMXG デバイスを出荷でき、オンサイト アップグレードは簡単なモジュール交換になります。

28G への移行に伴うより高い帯域幅、電力、および冷却の要求を満たすために、既存の QSFP400 にいくつかの機能強化が行われました。 これらの拡張には、高速電気ポート チャネルの倍増 (4 チャネル 25 Gbps NRZ 拡張から 8 チャネル 56 Gbps PAM-4 への拡張) と、モジュールの「フロント エンド」の拡張が含まれ、より大きな内部負荷を提供します。ボリュームと強化された熱性能。 さらに、CMIS 4.05 標準につながるモジュール制御インターフェイスを強化するために、さらなる作業が行われました。

400G DR4 モジュール

  400G QSFP-DD DR4 は、400 年に展開された最も一般的な 2020G カスタマー光インターフェイスの 400 つです。100G を、500 つの 100G 信号の形で、個別のシングルモード ファイバーを介して送信します。 企業での幅広い用途があります。 100 m のカバレッジをサポートし、別の XNUMXG イーサネット リンクに接続できるため、ポート数密度を XNUMX 倍にすることができる高密度 XNUMXG ソリューションとして魅力的です。

400G FR4 モジュール

  400G QSFP-DD FR4 インターフェイスは、通信を含む幅広い用途にも使用されます。 シングルモード光ファイバーを介して 2km の長いリンク バジェットを提供します。 400G は、それぞれがわずかに異なる波長を持つ 100 つの XNUMXG 信号によって伝送されます。

400G は 100 つの XNUMXG 信号で運ばれ、それぞれが

400G PMD モジュール (物理媒体に依存)

PMDリーチ申し込みテクノロジー
DAC2メートルに3イントララック & サーバーパッシブ銅ケーブル、50G PAM-4 電気
SR8100 mEnterpriseパラレルマルチモード、50G/λ – PAM-4
DR4500 mデータセンターとエンタープライズパラレル シングルモード、100G/λ – PAM-4
FR42キロ大規模データセンターシングルモード、100G/λ、PAM-4
LR810キロテレコムリーチシングルモード、100G/λ、PAM-4
ZR80キロメトロと DCIシングルモード/コヒーレント、PAM-4

基準とテーマ of QSFP-DD

多くの規格と MSA が適用されます。 また、基本的な IC 評価から、モジュール ハードウェアの統合、ソフトウェア、およびファームウェア、ベンダーの選択と承認まで、開発サイクルの各段階で重要なテストを理解することも重要です。 プロダクションには、独自の一連の重要なテスト要件もあります。

プラグ可能な光モジュールおよびデバイスの設計、テスト、検証、製造、展開を成功させるには、IEEE、CMIS、QSFP-DD、MSA、OIF などの主要なドキュメントをしっかりと理解している必要があります。 QSFP-DD は、エレクトロニクス、光学、機械、熱管理、およびファームウェア統合の完璧な組み合わせです。 モジュールを正常にデプロイするには、すべてのコンポーネントが連携する必要があります。

相互運用性(インターオペラビリティ)

イーサネット カスタマー インターフェイス エコシステムの大きな利点は、「設計された」リンクに頼ることなくマルチベンダー エコシステムが相互運用できるようにする、IEEE およびその他の標準によって推進される強力で明確な一連の標準があることです。

モジュールからホストへのインターフェイスとモジュールからファイバーへのインターフェイスの両方が、この相互運用性の鍵となります。 ホストからモジュールへのインターフェースでは、次の XNUMX つの主要領域に焦点を当てています。

  • チップからモジュール (C2M) に構築された高速データ パス (AUI) は、シグナル インテグリティやシグナル バランシングなど、複数の課題に直面しています。 FEC バジェットの一部がリンクのこの部分に割り当てられますが、このインターフェイスに問題があると、リンクに重大な問題が発生する可能性があります。 リンクの「調整」が不十分な場合 (イコライザーとチャネルに関して)、ランダム バーストや最悪の場合の偶発的なビットずれなど、扱いにくい問題が発生する可能性があります。
  • モジュール管理 – この I²C インターフェイス ベースは、SFF-8636 の基本的なメモリ マッピング管理から 100G QSFP28 へ、そして複雑な状態の完全な CMIS 4.0 へと進化しました。 この進化はエコシステムにとって非常に困難であり、CMIS 4.0 ドキュメントに関する確かな知識は、堅牢で安定したモジュール管理の鍵となります。
  • モジュール電源 – プラグ可能なコヒーレント用 (QSFP-DD ZR) DCI アプリケーション用のモジュールでは、モジュールの電力要件は 100G で数ワットから、おそらく 20W 近くまで上昇しています。 これにより、電源の堅牢性と安定性に対する高い要件が求められます。 さらに、モジュールが起動されたときの電力需要の動的および過渡特性を提供できなければなりません。

これらの領域はすべて密接に絡み合っており、(特に CMIS 4.0 モジュール管理のコンテキストでは) 全体として扱われ、モジュールが障害なく動作していることを確認する必要があります。

PAM-4

電気 (ホスト インターフェイスへのモジュール) と光 (電気) リンクの両方が PAM-4 変調されます。 この高次変調方式により、単位時間あたりに送信されるビット数を 4 倍にすることができます。 NRZ テクノロジーは広く使用されており、高速化のために成熟していますが、SERDES PAM-10 は比較的新しいテクノロジーであり、より複雑で挑戦的です。 NRZ リンクのビットエラー解析には豊富な経験があります。 しかし、25GE で使用される 100G から 4G の NRZ チャネルにはまだ問題があります。 したがって、PAM-4 への移行は、業界全体にとって大きな課題になると予想されます。 これは、FEC ベースのリンクを使用することでさらに複雑になります。このリンクには、常にバックグラウンド BER があり、より複雑なチャネル イコライゼーションがあります。 公平を期すために、PAM-25 は、広く使用されている XNUMXG NRZ よりも桁違いに複雑です。

NRZ変調

PAM4 変調非グレー

PAM4 モジュレーション グレイ コーディング

FEC

エラーのない PAM-4 伝送を提供できるコンポーネントを開発するのは困難だったため、開発者は、電気モジュール インターフェイスと光モジュール間インターフェイスの両方を保護できる FEC を使用しました。 私たちは、伝送チャネルとコンポーネントのビット エラー メカニズム、および FEC ロジック (エンコードと受信) の「コスト」のバランスをどのようにとるかを注意深く理解することに多大な努力を払いました。 FEC の「コスト」には、電力を消費し、リンクの遅延を増加させる可能性のある追加の回路が含まれます。

DSP とイコライザー

400G では、「最悪のケース」の送信機と「最悪のケース」のチャネル パフォーマンスに直面するために、「強力な」電気受信イコライザーの概念を使用することが決定されました。 これにより、PAM-4 受信機の入力で PAM-4 アイ パターンが閉じられる可能性があるため、PAM-4 受信機には、送信効果とチャネル効果のバランスを取り、明確なアイ パターンを回復するために、強力でおそらく複雑な受信機が必要です。特定のシンボルの正しいデコードを達成するため。 イコライザーの複雑さは、ほとんどの場合、DSP ベースのソリューションを実装する必要があることを意味します。これは、電力、遅延、複雑さ、ビット エラー パフォーマンス、および管理または制御に影響を与える可能性があります。 DSP イコライザーは強力ですが、機能が複雑であるため、タップに最適な設定を見つけるなどの課題が生じる可能性があります。 さらに、イコライザーは多くの場合、DSP ファームウェアと制御 API の背後に隠されているため、ユーザーにとって非常に抽象的です。 TDECQ6 の測定にはさらなる課題があります。この測定は複雑で、一貫性がない可能性があるため、自由に相互運用可能なマルチベンダー エコシステムの課題がさらに大きくなります。

キーポイント

常にビット エラーが発生します。現在、リンクには常にバックグラウンドのビット エラー レートがあります。 ビット エラー統計の「フィンガープリント」は非常に重要です。 通常、真のランダム BER ストリームは、リンクの保護に使用される FEC と互換性があります。 ただし、バースト、スリップ、およびその他の決定論的な問題により、FEC のエラー訂正機能が大幅に低下する可能性があります。 実際のリンクでは、BER は、電気チャネル ノイズと光チャネル ノイズ、クロストーク、シグナル インテグリティの問題、バースト、ビット スリップ、さらには不適切に設定されたイコライザーによる BER の増殖の複雑な組み合わせになる可能性があります。

最終的に重要なのは、特定の BER フィンガープリントが与えられたときに FEC がどのように機能するかです。 マージンとは何ですか? ドロップされたパケットを受信するまでどのくらいかかりますか? リンクの劣化を理解するために、長期的なパフォーマンスを予測できますか? BER の根本的な原因は何ですか?

個々の PAM-4 コード要素のエラー バイアスからビット スリップ性質のバースト解析まで、BER 特性を調査するためにいくつかのツールを使用できます。 BER バイアスの理解は、クロック変動やスキューなどのツールによってさらに強化できます。

PAM-4 シンボル解析を使用して、ビット エラー分布に「レベル」バイアスがないことを確認できます。 主要なフォトニック要素 (レシーバーのフォトニック AGC など) の安定性は、(減衰器を介して) PAM-4 ビット エラー分布の時間パワーの変動を観察することでさらに検証できます。

ビット エラー バーストを十分に調査し、それらがバーストであり、ビット (またはシンボル) のずれではないことを確認することが重要です。 スリッページは通常、DSP (および関連するファームウェア) に関連しており、FEC では修正できません。 一般的なテストでは、従来のシグナル インテグリティまたはノイズの問題によって引き起こされるバーストの問題と、クロックおよび位相感度に関連するバーストの問題を区別できません。 その結果、QSFP-DD ビット エラーの性質と根本原因を調査するために、多くの新しいツールと手法を導入する必要があります。

最も単純なトップレベル ビューは、10 ビット FEC コードワード (KP5440 FEC) あたりの 4 ビット コード要素エラーの数を調べることによって取得できます。 通常、単調に分布するシンボルあたりのカウントは約 10 減少すると予想されます。つまり、不正なシンボル/コードワードが追加されるたびに、エラーの数が 10 減少すると予想されます。ランダムな(体系的な)原因。 また、測定時間内にエラー シンボルの数が 10 倍に増加すると予想されます。 したがって、10 秒後にコードワードごとに 10 個のエラー シンボルのカウントが観察された場合、約 11 秒後に 100 個のエラー シンボル カウントが表示されると予想されます。

このような経験則を使用して、修正不可能なエラー (コードワードごとに 16 以上のエラー) が発生するまでの時間を見積もることができます。 たとえば、100 時間のテスト時間の後、最大で 12 個のエラー シンボル/コードワードを観察した場合、次の概算が予想されます。

エラーシンボルTimeノート
12100時間測定
131000時間見積もる
14〜420日
15〜11年半
16 (訂正不能エラー)〜114年世紀を超えて最初にドロップされたパケット

FEC – エラー記号/コードワード

以下のケースでは、ONT は大幅に減衰された 400G ファイバー リンクを使用して動作しているため、10 分間隔で重大なビット エラーが発生します。 これは、準拠したリンクから期待できることです。 ご覧のとおり、分布は一般に単調です。 エラー シンボルあたりのカウントは減少しますが、12 エラー シンボル/コードワードよりもわずかに長いテールを示しています。 この場合、訂正されていないコードワードが原因で、リンクがパケットをドロップする可能性があります。

ONT は、大幅に減衰された 400G 光リンクで実行されたままになっていました

以下のスクリーンショットは、重大な問題が発生した状況を示しています。 FEC には大きなマージンがありますが (コードワードで最大 100 つのエラー シンボルを確認できます)、分布は単調ではなく、このシステムでのビット エラーの潜在的な原因を示唆しています。 この XNUMXG リンクの例は、特別な VIAVI ONT アプリケーションによって生成されたことに注意してください。このアプリケーションは、FEC ロジックと電源の完全性のストレス テストと検証のために広範な FEC エラー分布を作成します。

システムには、動作中の根本的なエラー ソースがあります

ONT は、シーケンス全体のビット エラー分布とコード タイプを分析できるだけでなく、各 PAM-4 シンボルに基づいてビット エラー特性を追跡することもできます。

ONT には、エラーの分布とパターンの両方を分析する機能があります

動的なスキュー変動は、ストレス テストと検証のための強力なツールです。 QSFP-DD モジュール. これは、IEEE802.3 規格への準拠と、DSP および関連するファームウェアの全体的な安定性を検証するために使用できます。 これは、個々の電気チャネルと光チャネルのペアが完全に異なるクロック ドメインに配置される可能性がある DR4 モジュールでは特に重要です。

動的スキュー変動は、QSFP-DD モジュールにストレスを与えて検証する強力なツールです

上のスクリーンショットは、PAM-4 の動的スキュー アプリケーションを示しています。 UI に対するトランスポート チャネルの相対タイミングを正確に制御しながら、「中断のない」位相シフトを維持できます。これは、クロストークや DSP ベースのファームウェア タイミングの問題などの困難な問題を解決する鍵となります。

動的スキュー (またはスキュー変動) は、パラレル チャネル通信システムの重要なテストです。 シグナル インテグリティ テストと検証 (クロストーク) に使用でき、PAM-4 SERDES での FIFO と CDR パフォーマンスのストレス テストと検証にも使用できます。

さまざまな程度のスキューを使用して、シグナル インテグリティとクロストークの問題を調査することもできます。これらは、ハードウェア チームと SI チームで幅広い用途があります。 チャネル タイミングを調整して、干渉源チャネルの遷移が干渉対象チャネルの PAM-4 アイ パターンの中央で発生するようにすることができます。

PAM-4 信号は (信号マージンが低いため) 従来の NRZ よりもクロストークの影響を受けやすくなっています。 の密な範囲では、 QSFP-DD (特にホスト コネクタの周囲)、高速 PAM-4 チャネルは互いに非常に接近して配線されているため、信号のクロストークの問題を回避するように注意する必要があります。 通常、BER テスターは固定位相で並列チャネルを実行するため、SI ストレス テストでは「最悪の場合のアライメント」が発生しない場合があります。 ダイナミック スキューを使用すると、ソース チャネルを相対的な位相でスキャンして、最悪の場合の位相シフト シナリオでも問題が発生しないことを完全に検証できます。 エンド ユーザーは、特定のフェーズでエラーがあるかどうかを観察するだけで済みます off設定します (通常、ソース チャネルが干渉オブジェクトの「アイ ダイアグラム」の中央にレベル遷移を持っている場合)。

最新の SERDES は、一連の FIFO バッファを使用して、IC 構造内でさらに処理する前に信号をリタイミングおよび再調整します。 再調整では、一連の FIFO バッファを使用して、メイン クロック ソース (通常は CDR を介したメイン チャネル) からクロックを回復します。

システムが正しく設計または実装されていない場合、プライマリ チャネル (CDR リファレンス チャネル) と他のチャネルとの間の位相変動および変化により、FIFO が整列されていないか、スライドすることさえある可能性があります。 これは、従来のテスト機器で見られるようなバースト エラーとしてではなく、ONT の高度なエラー解析がビット スリップとして追跡できるビット スリップとして現れます。 ダイナミック スキュー アプリケーションを使用して、ONT は意図的に SERDES の CDR/FIFO のパフォーマンスをストレス テストし、スキュー (範囲とレート) によって障害モードを強制しようとすることができます。 これを ONT の高度な BER 解析と組み合わせることで、SERDES テスト用の非常に強力で完全なテスト システムが提供され、ビット スリップを引き起こすことがある 400GE リンクの非常に困難な問題を迅速に解決するために使用できます。 ONT PAM-4 動的スキューは、これらの BER の生成を強制して、根本原因の診断と解決に役立てることができます。

一般的な 400G QSFP-DD 制御画面

モジュール管理は、非常に基本的なレジスタベースのシステム SFF 8636 から、より複雑なモジュール 4.0GE 以上のニーズを満たすように設計された完全なモジュール ステータスを備えた包括的な管理システムである CMIS 400 へと時間の経過とともに進化してきました。

モジュールの堅牢で安定した動作には、I²C 制御インターフェイス、電源ピンと制御ピン、およびデータ パスを介したモジュール間の密接な相互作用が不可欠です。 特にモジュール DSP のデータ パス バランシングでは、モジュールの複雑さが高くなり、ホストとモジュール間の制御セットアップと実行をより包括的に理解する必要があります。 CMIS 4.0 では、コマンド、操作、およびタイミング動作を正しい順序で厳密にコレオグラフ化する必要があります。 注意しないと、あるモジュールが XNUMX つのホスト スロットで正常に動作しているように見えても、別のモジュール (コマンド、電源、およびデータ パスのタイミングが微妙に異なる) が不規則に動作する場合があります。 さらに悪いことに、ビット エラー レートが増加し、ほとんどの場合、ビット スリップの可能性が高い、まれで扱いにくい問題が発生します。 ONT などのツールは、I²C で CMIS コマンドを統合し、モジュールの電源制御とデータ パス ステータスを統合します。これは、問題のデバッグと解決に役立つだけでなく、さまざまなホストでのモジュールの堅牢性のストレス テストと検証にも役立ちます。

メモリの最初のページのメモリ ダンプ

上の画面は、メモリの最初のページのメモリ ダンプを示しています。 これにより、正しい値が 400G QSFP-DD EEPROM。 空白またはランダム データは、デバイスが初期化されていないことを示している可能性があります。

モジュールの電気的パラメータを明確かつ明確な方法で正確に制御します。

モジュール管理アプリケーションの一部の高度なアプリケーションでは、モジュールの電気ポート パラメータを明確かつ明確な方法で正確に制御できます。

要約で

400G QSFP-DD モジュールは、複雑なファームウェアと組み合わされた、電子工学、フォトニック工学、機械工学、および熱工学の驚異です。 健全なマルチベンダー QSFP-DD エコシステムは、400G ネットワーキング テクノロジーの広範な展開に不可欠です。 これは、従来の 100G モジュール技術の進化と革命を表していますが、PAM-4 シグナリング (電気および光)、リンク BER 制御のための FEC、および CMIS4.0.

ハイパースケール ユーザーのスケールと展開のニーズによって価格に対する期待が変化しているため、これらの課題はさらに大きくなっています。 生産は、PAM-4 の新しい課題に対応するためのカバレッジと分析機能を備える一方で、価格の期待に応えるために歩留まりとスループットの要件を満たす必要があります。

コメント

上へスクロール