切替後に「片方向だけ通る」場合、最初に何を見る？

まず切替後の送信インターフェースと戻り経路の一致を疑います。送信側でrouting/SD-WANの選択結果、受信側で戻りのデフォルト/ポリシールート/SD-WANが同じ回線に寄っているかを確認し、snifferで往復が同じトンネルを通っているかを見るのが早いです。

SD-WANのSLAはどこ宛てにプローブするのが無難？

VPNの対向装置の外側（Public）IPに固定すると誤判定しやすいことがあります。回線ごとに到達してほしい宛先を2系統にし、sourceもWANインターフェース固定で設計します。揺れは試験で確認して閾値を調整します。

切替はできているのにIke SAが上がらない時の典型原因は？

NAT-Tの可否、送信元IPの変化、proposal不一致、Phase2セレクタ不整合が多いです。ログとSA一覧で差分を取るのが現実的です。

セッションが残って切替後に詰まる時、どう対処する？

セッションテーブルに旧トンネル向きが残っていないか確認し、原因なら影響範囲を絞って該当セッションだけクリアします。

複数トンネルでPhase2セレクタが同じだと何が起きる？

対向装置の実装次第で受け先が曖昧になり、不安定になることがあります。セレクタの整理や優先度設計を検討します。

FortiGate IPsec VPN 複数回線冗長化の切替失敗を切り分け｜確認手順

2026年5月30日

トラブルシューティング

現場でよくあるのが「平常時は拠点間IPsecが安定しているのに、回線切替（フェイルオーバー/フェイルバック）した瞬間だけ通信が死ぬ」「片方向だけ通る」「数分戻らない」です。
この記事は一般的なVPN不通ではなく、FortiGate IPsec VPN 複数回線冗長化で切替時だけ起きるトラブルに絞って、私が実際に使う順序で切り分けます。

対象構成の前提と、よくある3パターン

以降は「拠点AのFortiGate ↔ 拠点BのFortiGate/他社装置」を想定します。冗長化は大きく3パターンあります。

方式	切替の根っこ	切替時に詰まりやすい点
SD-WAN配下にIPsec	SLA/優先でメンバ選択	SLAプローブ設計、揺れ、戻り非対称、セッション
静的ルート優先度（距離/AD）	到達性/リンクダウン依存	リンクは生きているが上位が死んでいる時に検知できない
PBR併用	マッチ条件で経路強制	条件漏れ・優先順位・戻りが別経路になりやすい

注意（無理に断定しない）

FortiOSのバージョン、対向装置（FortiGate/他社/クラウドGW）、NAT有無、ポリシー構成で挙動が変わります。ここでは「切替で詰まる観点」と「判断基準」を示しますが、すべての環境で同じ出力になる保証はありません。

SECTION

アーキテクチャ（テキストフロー）と、切替時に起きること

想定フロー（例：SD-WAN＋2本のDialup/Static IPsec）

LAN(A) → Policy →（SD-WAN選択）→ IPsec_Tunnel_A(Primary) → Internet → 対向GW → LAN(B)
                └→ IPsec_Tunnel_B(Backup)  → Internet → 対向GW → LAN(B)
戻り: LAN(B) → 対向GWの経路/ポリシー → (同じトンネルで返す必要がある)

切替失敗の多くは、切替後に「片道はBackupトンネル、戻りはPrimaryのまま」などの非対称になり、FortiGateのステートフル処理（セッション/ポリシー）や対向側の実装で落ちます。

比較（切替のしやすさ/観測しやすさ）

SD-WAN（観測しやすさ）

静的ルートのみ（検知の確実さ）

PBR併用（設計ミスの入りやすさ）

※数値は性能評価ではなく、私が現場で「原因を追いやすい/追いにくい」と感じる傾向を棒で表現しただけです。環境差は出ます。

SECTION

切替失敗の確認手順（routing→sniffer→session→IKE/IPsec）

ここからは手順書として使える粒度で書きます。私は「切替の瞬間」だけでなく、切替後30〜60秒も含めて観測します（SLAの判定/ホールドで挙動が変わるため）。

Step 1：切替後、どのIF/トンネルから出ているか（経路の確定）

判断基準：送信元LAN→宛先LANの通信が、想定したトンネルIFに向いていること。

確認コマンド例（代表）

get router info routing-table details <対向LANセグメント>
get router info routing-table all

# SD-WAN利用時
diagnose sys sdwan health-check
diagnose sys sdwan service

NG例：routing-tableで次ホップ/デバイスがPrimaryのまま。→ SD-WANルール、静的ルート距離、PBR条件を先に直す。
NG例：SD-WAN health-checkがDownになっているのに、serviceがまだPrimaryを掴む。→ SLAのfailtime/recoverytime、hold-down相当の設定、優先度を見直す。

Step 2：snifferで「片道だけ」になっていないか（非対称の確認）

判断基準：同じ5-tupleの往復が、同じトンネルIFで観測できること（少なくとも往復が見えること）。

確認コマンド例（IFは置き換え）

# トンネルIFでLAN側→対向LANの通信を見る
diagnose sniffer packet any 'host 10.10.10.10 and host 10.20.20.20' 4 0 a

# 片方向疑いなら、LAN側IFでも同じ条件で見る
diagnose sniffer packet <lan_if> 'host 10.10.10.10 and host 10.20.20.20' 4 0 a

症状→判断：送信は見えるが戻りが見えない → 対向側の戻り経路（SD-WAN/静的/PBR/ポリシー）か、対向側が別トンネルへ返している可能性。
症状→判断：戻りは来ているのにLANへ出ていかない → FortiGate側のポリシー順序/UTM/NAT、またはセッション不整合の可能性。

Step 3：セッションが旧経路に残っていないか（切替後に詰まる定番）

判断基準：切替後の新規通信が、期待するトンネルIFのセッションとして張られること。

確認コマンド例（影響範囲を絞る）

diagnose sys session filter clear
diagnose sys session filter src 10.10.10.10
diagnose sys session filter dst 10.20.20.20
diagnose sys session list

セッションの読み方は別記事に寄せます：FortiGate session tableの確認と詰まりどころ

警告（セッションクリアの扱い）

セッションクリアは影響が出ます。まずフィルタで絞って「該当通信だけ」を落とします。広範囲クリアは、監視/業務影響の合意が取れてからにします。

Step 4：IKE/IPsec（SA/Phase2/提案）を確認する

判断基準：切替後に「期待したトンネル」にSAが張られ、Phase2が必要分だけupしていること。

確認コマンド例（途切れない形で一式）

# IKE SAの状態
diagnose vpn ike gateway list
diagnose vpn ike gateway list name <tunnel_name>

# IPsec SA（Phase2）の状態
diagnose vpn tunnel list
diagnose vpn ipsec sa

# 必要に応じてデバッグ（実施後は必ずoff）
diagnose debug reset
diagnose debug console timestamp enable
diagnose debug application ike -1
diagnose debug enable
# ...切替/再接続を実施...
diagnose debug disable

典型症状：切替後にIKE SAが別ゲートウェイで張られない／張り直しが遅い → 対向から見た送信元IP（回線のPublic IP）が変わっており、対向側のピア条件に合っていない可能性。
典型症状：IKEはupだがPhase2が不足/Down → セレクタ（proxy-id）不整合、またはトンネルごとのPhase2重複が疑い。
典型症状：ログにproposal/selector関連が出る → 既存記事のエラー別整理に逃がす：peer SA proposal対処（提案不一致）

SECTION

論点別：典型症状→確認→判断→対処（最低1セットずつ）

1) 戻り非対称（片方向）

症状	切替後にping片方向、TCPはSYNだけ見える等
確認	snifferで送信/戻りが同じトンネルIFか、対向側の戻り経路（可能なら）
判断基準	戻りが別回線/別トンネルに出ている、または戻りが来ていない
対処	対向側も同様に冗長化する場合、両側で切替条件を揃える（SLA宛先/閾値/ホールド）。片側だけSD-WANで切り替える構成は、戻り非対称になりやすいので要注意。

2) SD-WAN SLA設計ミス（Down判定がズレる/揺れる）

私がよく見る失敗は「プローブが実際の出口を通っていない」「sourceが固定されていない」「閾値が厳しすぎて揺れる」です。

設計の具体（例）

probe宛先：回線A/Bそれぞれで到達してほしい先を2つ用意（同一ASに偏らない）
source：WANインターフェースのIP（回線ごとの出口を固定）
閾値：packet loss/latency/jitterは「業務アプリが耐えられる範囲」から逆算。いきなり厳しくしない
揺れ対策：failtime/recoverytime、復旧後もしばらくPrimaryに戻さない運用（時間帯で戻す等）も検討

3) Phase2セレクタ/プロキシID（重複・不足）

冗長化でトンネルを2本作ると、同じローカル/リモートサブネットを両方に入れがちです。FortiGate同士なら成立することもありますが、対向が他社装置やクラウドゲートウェイの場合、受け側の実装で不安定になることがあります。

確認→判断

diagnose vpn tunnel list
# 出力で、どのtunnelにどのproxyid/selectorが紐づいているかを確認

対処は「セレクタを役割分担（例：通常系/バックアップ系で経路を明確化）」か、「対向仕様に寄せて1本に集約＋回線冗長はUnderlay側で行う」など。どちらが取れるかは対向依存です。

4) NAT/ポリシー順序（切替後にだけ踏む）

切替でトンネルIFが変わると、ポリシーのfrom/toが一致せず、暗黙denyに落ちることがあります。UTMを掛けているとログの見え方も変わります。

確認（ログ）

# forward traffic のdeny/accept、policyid、srcintf/dstintf を見る
# GUI: Log & Report → Forward Traffic
# CLI例（環境によりフィルタは調整）
diagnose log filter category 0
diagnose log filter field logid 0000000013
# showでも十分だが、運用ポリシーに合わせて確認

判断基準：切替後にsrcintf/dstintfが変わっているのに、ポリシーが追従していない。対処はポリシー追加/統合、またはzone化でトンネルをまとめる等（ただし既存設計への影響は要評価）。

5) セッション固定（古い経路のまま）

切替直後だけ詰まる・数分で戻る場合、セッションタイムアウト待ちのことがあります。影響を最小にするなら「該当通信だけ」落とします。

対処例（最小クリア）

diagnose sys session filter clear
diagnose sys session filter src 10.10.10.10
diagnose sys session filter dst 10.20.20.20
diagnose sys session clear

SECTION

切替テスト手順（回線断/復旧、収束時間、切り戻し条件、ログ）

実施チェックリスト（コピペ用）

事前：現行の経路（routing-table/SD-WAN service）を保存、対象フロー（IP/ポート）を決める
計測：連続ping/TCP疎通（可能なら業務アプリ）を用意し、時刻を揃える
断手順：回線Aの物理断 or 上位装置でBGP/PPPoE断（現場の手段に合わせる）
観測：切替開始〜復旧までの秒数、snifferで往復、forward trafficログのdeny有無
復旧：回線A復旧後、すぐPrimaryへ戻すか、一定時間Backup維持か（揺れ対策）
切り戻し条件：収束が長い/片方向が再発する場合は一旦固定（運用として“戻さない”判断を先に決める）
記録：SD-WAN health-checkの状態遷移、IKE/IPsec SAの張り替え時刻、sessionクリアの有無

一般的な「VPNがつながらない」観点も併用すると漏れが減ります：FortiGate VPN不通で最初に見るポイント

SECTION

関連読み（深掘りは既存記事に分離）

FortiGate IPsec VPN 複数回線冗長化の切替失敗を切り分け｜確認手順

対象構成の前提と、よくある3パターン

アーキテクチャ（テキストフロー）と、切替時に起きること

切替失敗の確認手順（routing→sniffer→session→IKE/IPsec）

論点別：典型症状→確認→判断→対処（最低1セットずつ）

1) 戻り非対称（片方向）

2) SD-WAN SLA設計ミス（Down判定がズレる/揺れる）

3) Phase2セレクタ/プロキシID（重複・不足）

4) NAT/ポリシー順序（切替後にだけ踏む）

5) セッション固定（古い経路のまま）

切替テスト手順（回線断/復旧、収束時間、切り戻し条件、ログ）

関連読み（深掘りは既存記事に分離）

まとめ（現場で迷わない最短ルート）

FAQ

まとめ