ラック内で光ケーブルを挿し替える作業は、手順だけを見るとシンプルです。コネクタを差し替えてリンクが上がり、疎通が取れれば「作業完了」としたくなります。
しかし運用現場で厄介なのは、リンクは上がっているのに「なぜか遅い」「特定の時間帯だけ不安定」「数日後にポートフラップが始まる」といった“あとから出る系トラブル”です。こうした事象の多くは、光の余裕(マージン)が薄いまま運用に入ってしまうことで起きやすくなります。
そこで重要になるのが、光レベル(送信/受信の光パワー)確認です。Ciscoの公式情報でも、光リンクのトラブルシューティングにおいてTx/Rx(dBm)やしきい値の確認が重要な観点として扱われています。
光レベルって何を見てるの?
Cisco機器で光レベルと言う場合、主にトランシーバのDOM(Digital Optical Monitoring)で確認できる次の値を指します。
Tx Power(送信光パワー):トランシーバが光として出している強さ
Rx Power(受信光パワー):対向から受け取っている光の強さ
ポイントは「現在値」だけではありません。Ciscoのコマンドリファレンスでは、show interfaces ... transceiver detail の出力において、High/LowのWarning・Alarm状態が記号(++/+/ -/ –)で示され、しきい値も併記されることが説明されています。つまり、光は“リンクUP/Down”だけでなく、しきい値に対して余裕があるかどうかを判断材料にできる作りです。
光レベル確認をサボると、どんな事故が起きる?
リンクアップは「疎通の最低条件」にすぎません。光の世界は「通る/落ちる」だけではなく、「余裕(マージン)」が運用で効いてきます。ここを見落とすと、リンクは上がるのに運用で痛い目を見るパターンに入りがちです。
1) 受信が弱すぎる(Rxが低い)
端面の汚れ、曲げ、パッチ盤や中継点での損失増、清掃不足、モジュールやケーブルの状態などが重なると、Rxが下がっても最初はリンクが上がってしまうことがあります。
ただし、余裕が薄いリンクは温度変化やラック内作業の振動、ケーブルに少し触れた程度の変化で不安定化しやすくなります。結果として、時間差でエラーやポートフラップにつながり、原因特定が難しくなります。
2) 受信が強すぎる(Rxが高い)
「弱いとダメ」は直感的ですが、短距離や条件によっては“強すぎ”も問題になり得ます。強すぎ/弱すぎのどちらも、DOMのしきい値に対する警告・アラームで兆候を拾える可能性があります。
CiscoのDOMに関する資料では、しきい値違反(threshold violation)メッセージを確認できること、そして表示にはトランシーバ監視を有効化する必要がある旨が説明されています。
3) 「今は動く」けど、切り分けが地獄になる
障害対応で必ず問われるのが「いつから」「何を変えたか」です。光パッチ作業の直後にTx/Rxとしきい値状態を記録していないと、後日トラブルが起きた際に比較材料がなくなり、切り分けが“推理ゲーム”になりがちです。
反対に、作業前後のshow interfaces ... transceiver detail出力を残しておけば、光レベルの変化が見えるため、原因箇所(端面・パッチ・経路・モジュール・対向など)の当たりを付けやすくなります。
じゃあ何を確認すればいい?(Cisco現場で使えるやり方)
Cisco(Catalyst系/IOS XE想定)での基本は、まずDOMでTx/Rxとしきい値を確認することです。Cisco公式のトラブルシューティング記事でも、光リンク確認の流れの中でトランシーバ情報の確認が扱われています。
代表的な確認コマンド(IOS XE)
show interfaces <interface-id> transceiver detail
この出力では、しきい値に対する状態が次の記号で示されることが、Ciscoのコマンドリファレンスに記載されています。
++:High alarm
+:High warning
–:Low warning
—:Low alarm
現場判断としては、Tx/Rxの現在値がしきい値の範囲内に収まっているか、そしてWarning/Alarmの兆候(記号)が付いていないかを確認します。もし記号が付いている場合は、その時点で「端面の清掃」「パッチの刺し直し」「曲げの解消」「モジュール/ケーブルの交換」など、作業中にできる手当てを優先して行うのが安全です。
「貼り替え作業」で最低限やると事故が減る流れ(Cisco版)
作業前に端面の点検と、可能な範囲での清掃を行います。挿し替え後はリンクアップだけで安心せず、show interfaces <interface-id> transceiver detail を実行してTx/Rxの現在値としきい値、Warning/Alarmの有無を確認します。最後に、その出力(あるいはTx/Rx値と状態)を作業ログに残します。
この一手間で、「リンクは上がっているのに不安定」「時間差で落ちる」といったトラブルの遭遇率を下げやすくなります。
最後に:光レベル確認は“面倒”じゃなく“保険”です
光は、刺さってリンクが上がるだけなら簡単です。しかし運用で価値があるのは、翌日も翌月も安定して動き続けることです。
Ciscoの公式情報には、DOMでしきい値違反を扱えること、show interfaces ... transceiver detailでしきい値やWarning/Alarm状態を確認できることが明記されています。つまり、光レベル確認は“こだわり”ではなく、トラブルを未然に防ぎ、切り分けを速くするための基本動作として位置づけられます。
