개요

TSN에서 시간 동기화의 중요성 

TSN(Time-Sensitive Networking) 환경에서는 네트워크 노드 간 정밀한 시간 동기화(ns 단위)가 필수적이다. 이를 위해 IEEE 802.1AS 표준의 gPTP(Generalized Precision Time Protocol)가 사용되며, 네트워크 내 Grand Master(GM)가 기준 시간을 제공한다.

 

GM 장애 시 발생하는 문제

gPTP는 네트워크 상의 모든 노드가 GM의 시간을 기준으로 동작하기 때문에 GM 또는 GM과의 링크에 장애가 발생하면 전체 네트워크의 시간 기준이 무너질 수 있다. 이 문제를 해결하기 위해 GM Failover 메커니즘, 즉 gPTP Redundancy가 필요하다.

 

gPTP Redundancy는 FRER(802.1CB)과 다른 기능

TSN에서는 패킷 경로 보호를 위해 경로 이중화인 802.1CB(FRER: Frame Replication and Elimination for Reliability)를 사용하지만, gPTP Redundancy의 경우에는 FRER 위에서 동작하는 기능이 아니며 802.1AS 표준 내부에서 정의된 시간 동기화 보호 메커니즘이다. 즉, GM 장애 및 링크 장애에 대응하기 위한 시간 동기화 자체의 Failover 기능이다.

 

gPTP Redundancy 관련 표준

gPTP Redundancy는 다음 IEEE 표준에서 정의된다. 

 

  • IEEE 802.1AS
    • TSN 환경에서의 시간 동기화 프로토콜(gPTP) 정의 
    • GM Failover 개념 포함 
  • IEEE 802.1ASmd-2024 
    • 기존 BMCA 기반 Failover의 한계를 개선하기 위해 Hot Standby 메커니즘을 도입 
    • Secondary GM을 사전에 지정하여 빠른 Failover 지원

 

Hot Standby(802.1ASmd-2024)

IEEE 802.1AS 기반 gPTP 환경에서 GM 장애에 대응하기 위한 전통적인 방법은 BMCA(Best Master Clock Algorithm) 를 통한 GM 재선출이다. BMCA는 네트워크에 존재하는 gPTP 노드들이 Announce 메시지를 교환하고, 메시지에 포함된 Priority, Clock Accuracy 등의 파라미터를 비교하여 최적의 GM을 결정하는 방식으로 동작한다. 이러한 방식은 네트워크 상태에 따라 GM을 동적으로 선출하는 메커니즘이라는 특징을 가진다.

 

Slave(PTPB, PTPF)가 PTP GM(PTPC, PTPD) Failover 발생 시의 시간동기화 과정을 캡쳐한 1-PPS 신호 [1]

 

그러나 BMCA는 GM 장애 발생 시 Announce Timeout 이벤트 이후에 새로운 GM을 선출하는 절차를 수행해야 하므로 Failover 시간이 길어질 수 있다. 실제 PTP 시스템을 대상으로 한 성능 평가에서는 GM 네트워크 장애 이후 Announce Timeout(3초) 발생 후 백업 GM이 동작을 시작하고, Slave가 새로운 GM에 재동기화되기까지 약 8초가 소요되는 결과가 보고되었다[1]. 이러한 결과는 GM Failover 과정에서 네트워크 전체가 새로운 시간 기준으로 재동기화되기까지 상당한 시간이 필요할 수 있음을 보여준다.

(그림의 아래 패널에서 PTPC의 GM Sync 메시지가 네트워크 상에 존재하지 않을 때, PTPD의 GM Sync가 네트워크 상에 발생하는 시간. 그리고 그림의 위 패널에서 Slave(PTPB, PTPF)가 PTPD의 GM Sync 메시지로 시간동기화가 이뤄지는 과정이 대략 12초 정도 소요됨)

 

이러한 문제를 해결하기 위해 Hot Standby 방식이 제안되었으며, 해당 메커니즘은 IEEE 802.1ASmd-2024 표준에 반영되었다. Hot Standby 방식은 BMCA와 같이 GM을 동적으로 선출하는 방식이 아니라, Primary GM과 Secondary GM을 사전에 결정해 두고 장애 발생 시 즉시 전환하는 구조를 사용한다.

 

802.1ASmd-2024 표준[2]에서 발췌

이를 위해 네트워크에서는 두 개의 gPTP Domain을 정적으로 유지한다. 하나의 Domain은 Primary GM을 기준으로 시간 동기화를 수행하고, 다른 Domain은 Secondary GM을 기준으로 동작한다. 네트워크 노드들은 두 Domain의 시간 정보를 동시에 수신하면서 Primary GM을 기준으로 동작하다가, GM 장애 또는 링크 장애가 발생하면 즉시 Secondary GM의 시간 기준으로 전환할 수 있다. 이러한 구조는 BMCA와 같이 GM을 재선출하는 과정이 필요하지 않기 때문에 Failover 지연을 크게 줄일 수 있는 특징을 가진다.

 

Hot Standby 메커니즘에 대한 성능 평가는 최근 OMNeT++ 기반 시뮬레이션 환경에서 수행되었으며, 해당 결과에 따르면 BMCA 기반 Failover 대비 약 10초 빠르게 새로운 GM과 시간 동기화를 수행할 수 있으며 장애 상황에서도 Clock Offset을 약 5ns 수준으로 유지할 수 있음이 보고되었다[3]. 다만 해당 시뮬레이션 환경에서는 모든 노드가 동일한 Clock 특성을 가진 것으로 가정되었으므로 실제 네트워크 환경에서는 더 큰 편차가 발생할 가능성이 있다.

 

Hot Standby가 적용되지 않는 환경에서의 PTP Redundancy 사례

Hot Standby와 같은 메커니즘이 존재하지 않는 환경에서도 여러 GM을 동일 네트워크에 두는 방식의 PTP Redundancy가 연구된 바 있다. IEEE 1588 PTPv1 기반 시스템에서 수행된 성능 평가에서는 세 개의 GM, 세 개의 Slave, 그리고 여러 Transparent Clock을 포함하는 테스트베드를 구성하여 GM 장애 상황에서의 동기화 동작을 분석하였다[1].

 

실험에서는 GM 중 하나에 네트워크 장애가 발생했을 때 Announce Timeout 이후 백업 GM이 동작을 시작하고 Slave가 새로운 GM에 재동기화되는 과정이 관찰되었다. 예를 들어 PTPC의 GM이 네트워크 연결이 차단된 경우, 약 3초 후 Announce Timeout이 발생하고 백업 GM이 Sync 메시지 전송을 시작하며 약 8초 후 Slave가 새로운 GM에 동기화되는 결과가 확인되었다. 또한 GM 간 Clock Offset 차이가 크지 않은 경우에는 GM 전환 과정에서도 Slave의 시간 동기화가 비교적 안정적으로 유지되는 것이 관찰되었다.

 

이러한 결과는 하나의 PTP 네트워크에 여러 GM을 두는 구조가 다양한 장애 상황(GM 장애, 네트워크 단절 등)에 대응할 수 있는 방법이 될 수 있음을 보여준다. 다만 BMCA 기반 구조에서는 GM 전환 과정 자체가 동적으로 수행되기 때문에 Failover 지연이 발생할 수 있으며, 이러한 한계가 Hot Standby와 같은 새로운 메커니즘이 등장하게 된 배경으로 볼 수 있다.

 

References

[1] D. M. E. Ingram et al., “Quantitative Assessment of Fault Tolerant Precision Timing for Electricity Substations,” IEEE Transactions on Instrumentation and Measurement, vol. 62, no. 10, pp. 2694-2703, 2013.

 

[2] "IEEE Standard for Local and Metropolitan Area Networks--Timing and Synchronization for Time‐Sensitive Applications Amendment 3: Hot Standby and Clock Drift Error Reduction," in IEEE Std 802.1ASdm‐2024 (Amendment to IEEE Std 802.1AS‐2020 as amended by IEEE Std 802.1AS‐2020/Cor 1‐2021, IEEE Std 802.1ASdr‐2024, and IEEE Std 802.1ASdn‐2024), pp.1-164, 4 Oct. 2024, doi: 10.1109/IEEESTD.2024.10707145.

 

[3] M. Ahmed, L. Haug, R. Muzaffar, D. Hamidovic, A. Hadziaganovic and H. -P. Bernhard, "First Analysis of Time Synchronization for TSN Networks with Hot Standby GM," 2025 IEEE 21st International Conference on Factory Communication Systems (WFCS), Rostock, Germany, 2025, pp. 1-4, doi: 10.1109/WFCS63373.2025.11077644.

 

'Network > TSN' 카테고리의 다른 글

10Base-T1S란?  (0) 2025.04.26
On the Reliability of IEEE 802.1CB FRER 간략히 정리  (2) 2025.01.12
gPTP(Generalized Precision Time Protocol)란?  (1) 2024.12.06
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기