AI로 교량의 건강을 진단한다: 딥러닝 기반 이상 신호 탐지
거대한 사장교는 도시의 상징이자 핵심적인 사회 기반 시설입니다. 이러한 다리의 안전을 보장하기 위해, 구조물 건전성 모니터링(SHM) 시스템이 교량 곳곳에 설치된 센서를 통해 다리의 상태를 24시간 감시합니다. 하지만 센서 자체의 노후화나 예측 불가능한 외부 환경 변화로 인해 센서 데이터에는 종종 오류가 발생하거나 비정상적인 신호가 섞여 들어옵니다. 이런 '이상 데이터'는 교량의 안전 상태를 정확히 판단하는 데 큰 방해가 됩니다. 그렇다면 수많은 데이터 속에서 어떻게 진짜 위험 신호와 단순 오류를 구분해낼 수 있을까요? 이 질문에 대한 해답을 최신 딥러닝 기술에서 찾아봅니다.
문제: 데이터의 옥석(玉石)을 가려라
교량의 가속도 센서에서 수집되는 데이터는 그야말로 '옥석'이 뒤섞인 상태입니다. 정상적인 구조물의 진동을 나타내는 유용한 데이터(玉)와 함께, 다양한 유형의 '이상 신호(石)'가 포함되어 있기 때문입니다. 이러한 이상 신호는 실제 구조물의 손상과는 무관한 경우가 많지만, 만약 이를 제대로 걸러내지 못하면 시스템이 불필요한 경보를 울리거나, 정작 중요한 위험 신호를 놓치는 심각한 결과를 초래할 수 있습니다. 대표적인 이상 신호의 종류는 다음과 같습니다.
- 결측 (Missing): 센서 통신 오류 등으로 데이터의 일부 또는 전체가 누락된 상태.
- 미소 (Minor): 정상 신호에 비해 진폭이 비정상적으로 매우 작은 상태.
- 이상치 (Outlier): 정상적인 데이터 범위를 순간적으로 크게 벗어나는 뾰족한 값.
- 사각 (Square): 센서의 고장으로 파형이 사각형 모양으로 나타나는 경우.
- 추세 (Trend): 데이터가 시간의 흐름에 따라 한쪽으로 쏠리는 경향을 보이는 현상.
- 표류 (Drift): 데이터의 기준선이 불규칙하게 흔들리는 비정상적인 움직임.
이처럼 다양한 이상 신호가 존재하는 상황에서, 엔지니어가 수작업으로 모든 데이터를 검토하고 분류하는 것은 현실적으로 불가능합니다. 바로 이 지점에서 인공지능, 특히 딥러닝을 활용한 자동 분류 기술이 필수적입니다.
AI 기반의 새로운 해법: 3단계 지능형 분류 시스템
최근 연구에서는 이러한 문제를 해결하기 위해 '딥러닝(Deep Learning)' 기술을 활용한 새로운 데이터 분류 방법을 제시했습니다. 이 방법의 핵심은 데이터에 나타나는 다양한 이상 신호 패턴을 AI에게 학습시켜, 마치 전문가가 데이터를 판별하듯 자동으로 이상 신호를 식별하고 분류하게 하는 것입니다. 이 과정은 '데이터 스케일링', '특징 추출', '딥러닝 분류'의 세 단계로 체계적으로 이루어집니다.
1단계: 데이터의 스케일을 맞추다 (데이터 스케일링)
각기 다른 센서에서 측정된 데이터는 그 단위나 값의 범위가 제각각일 수 있습니다. 예를 들어, 어떤 센서는 0에서 1 사이의 값을, 다른 센서는 1000에서 2000 사이의 값을 가질 수 있습니다. 이렇게 스케일이 다른 데이터를 그대로 사용하면 모델이 특정 데이터에만 과도하게 영향을 받을 수 있습니다. 따라서 '표준화(Standardization)'라는 과정을 통해 모든 데이터의 단위를 통일하고 평균 0, 분산 1을 갖도록 변환합니다. 이는 모든 데이터를 동일한 출발선에 세워, 모델이 데이터의 절대적인 크기가 아닌 패턴 자체에 집중하여 공정하게 학습할 수 있도록 만드는 중요한 전처리 과정입니다.
$$ d_{standardized} = \frac{d_i - \mu_d}{\sigma_d} $$
여기서 \(d_i\)는 원본 데이터, \(\mu_d\)와 \(\sigma_d\)는 각각 데이터셋의 평균과 표준편차를 의미합니다. 이 과정을 통해 데이터의 '키'를 맞춰주는 것과 같습니다.
2단계: 데이터의 핵심을 뽑아내다 (특징 추출)
최신 딥러닝 기술은 원본 데이터에서 스스로 특징을 학습하는 능력이 뛰어나지만, 데이터의 양이 충분하지 않거나 복잡할 경우, 엔지니어가 직접 데이터의 핵심 특징을 뽑아내어 제공하면 훨씬 더 좋은 성능을 발휘할 수 있습니다. 이를 '특징 공학(Feature Engineering)'이라 합니다. 연구에서는 원본 데이터의 특징을 가장 잘 나타내는 핵심 정보만을 간추려 모델에 전달하기 위해 두 가지 영역에서 특징을 추출했습니다.
- 시간 영역(Time Domain): 데이터의 파형 모양 자체를 분석합니다. 평균, 표준편차, 왜도(분포가 치우친 정도), 첨도(분포가 뾰족한 정도) 등 12가지의 통계적 특징을 계산하여 신호의 전반적인 형태와 특성을 파악합니다.
- 주파수 영역(Frequency Domain): 데이터를 주파수 성분으로 분해하여 분석합니다. '푸리에 변환'을 통해 얻어진 스펙트럼에서 평균 주파수, 주파수 중심 등 10가지 특징을 추출하여 신호가 어떤 진동수 성분으로 구성되어 있는지 파악합니다.
이렇게 추출된 총 22개의 특징들 중에서도 정말 중요한 정보만을 정제하기 위해 '주성분 분석(PCA, Principal Component Analysis)'을 추가로 사용합니다. PCA는 여러 특징들을 조합하여 데이터를 가장 잘 설명하는 새로운 축(주성분)을 찾아내고, 정보의 손실을 최소화하면서 데이터의 차원을 획기적으로 줄여주는 강력한 기법입니다. 이 연구에서는 시간 영역 특징을 6개의 주성분(PCt1~PCt6)으로, 주파수 영역 특징을 3개의 주성분(PCf1~PCf3)으로 압축하여 총 9개의 핵심 특징만을 딥러닝 모델의 최종 입력으로 사용했습니다. 이를 통해 모델은 더 적은 계산량으로 더 빠르고 효율적으로 학습할 수 있게 됩니다.
3단계: AI가 최종 판정을 내리다 (DNN 분류)
마지막으로, 앞에서 추출한 9개의 핵심 특징을 '심층 신경망(DNN, Deep Neural Network)' 모델에 입력하여 6가지 주요 이상 신호(Normal, Minor, Outlier, Square, Trend, Drift) 중 어떤 패턴에 해당하는지를 분류합니다. DNN 모델은 여러 개의 은닉층(hidden layer)으로 구성되어 있어, 입력된 특징들 사이의 복잡하고 미묘한 비선형 관계까지 학습하여 패턴을 정확하게 구별해낼 수 있습니다.
이 연구에서 제안된 모델은 실제 중국의 한 장대 사장교에서 수집된 데이터를 대상으로 한 국제 경진대회(IPC-SHM)에 제출되어, 전 세계 30개 팀 중에서 4위를 차지하는 우수한 성과를 거두었습니다. 특히, 최종적으로 약 98%에 달하는 높은 정확도로 이상 신호 패턴을 성공적으로 분류해내어, 제안된 방법론의 실용성과 효과성을 입증했습니다.
결론: 더 똑똑하고 안전한 교량 관리를 향하여
딥러닝 기반의 이상 신호 탐지 기술은 교량 건전성 모니터링 시스템의 신뢰도를 한 단계 끌어올리는 혁신적인 방법입니다. 수많은 센서 데이터 속에서 자동으로 이상 징후를 식별하고 분류함으로써, 관리자는 실제 교량의 상태 변화에 더 집중할 수 있게 됩니다. 이는 불필요한 경보를 줄이고 잠재적인 위험을 조기에 발견하여, 결과적으로 교량의 유지보수 효율을 높이고 대형 사고를 예방하는 데 결정적인 역할을 합니다. AI 기술이 사회 기반 시설의 든든한 '주치의'가 되어주는 시대, 데이터 기반의 스마트한 안전 관리를 통해 우리는 더 안전하고 지속 가능한 미래를 만들어 나갈 수 있을 것입니다.