기술

지속적인 검증

데이터의 질, 신뢰성의 중요성


데이터의 양이 폭발적으로 증가하는 현대 사회에서, 단순히 많은 데이터를 보유하는 것만으로는 충분하지 않습니다. 진정한 가치는 데이터의 정확도와 신뢰성에서 비롯됩니다. 리트머스는 이러한 원칙을 깊이 이해하고, 데이터의 질을 지속적으로 검증하고 개선하는 데 초점을 맞추고 있습니다. 이는 단순히 데이터를 수집하고 분석하는 것을 넘어서, 신뢰할 수 있는 정보를 제공함으로써 우리의 파트너들이 현명한 결정을 내릴 수 있도록 돕는 것을 의미합니다.


리트머스의 데이터 검증 접근 방식


리트머스는 지난 3년간 고품질의 데이터를 구축해 왔으며, 이 과정에서 수시로 정기적인 데이터 검증 작업을 수행해왔습니다. 우리의 데이터 검증 프로세스는 직접 검증간접 검증 크게 두 가지 주요 방법으로 구성됩니다.


직접 검증


우리는 반기마다 실제 차량 테스트를 통해 데이터를 직접 검증합니다. 이는 메이저 데이터 업데이트 때마다 추가로 수행되며, 이 과정에서 우리는 데이터의 정확성을 실제 상황에서 테스트하여 어떤 상황에서도 믿을 수 있는 정보를 제공할 수 있도록 합니다.


실차 테스트 과정에서는 2가지 중요한 점을 고려해야 합니다.
첫째, 균형있는 샘플을 취하여 검증 데이터의 적합성을 확보하는 것이 무엇보다 중요합니다. 그런 이유로, 우리는 상기 이미지의 2번 단계에서 다양한 시나리오에 맞는 검증 샘플을 확보할 수 있도록 상세한 시나리오와 이에 따른 모델 영향도를 고려합니다. 둘째, 정답지 확보 과정에서 사람을 무조건 신뢰할 수 없습니다. 복잡한 정답 데이터를 정확한 시공간 단위로 기록하는 것은 어려운 일이기에 실차 테스트 대상자를 신뢰하기보다 검증용 어플리케이션 설치를 통해 실제 기기에 기록된 데이터를 기반으로 정답을 구성하도록 합니다.


검증 앱 활용

직접 검증시 위와 같은 정답지 확보 중 발생하는 부득이한 오기 상황에 대비하여 리트머스는 검증 앱을 직접 구현하여 활용하고 있습니다. 해당 검증 앱은 정확한 위치 데이터를 활용하여 앱 자체의 임베디드 모델을 통해 이동 체류를 판단하고 상세한 컨텍스트 데이터를 자동으로 저장하여 활용하도록 구성되어 있습니다. 이를 통해 발생할 수 밖에 없는 휴먼 에러를 최소화 하여 검증 샘플을 최대한 확보하도록 합니다.


간접 검증


리트머스는 다양한 외부 소스로부터 얻은 정답 통계와 지속적으로 우리의 데이터를 비교함으로써 간접적으로 검증합니다. 이는 우리 데이터의 정확성을 간접적으로 측정하고, 다양한 상황과 조건에서의 신뢰성을 확인하는 데 도움이 됩니다. 아래 이미지는 국가 주요 정책 타당성 조사에 공식으로 활용되는 
KTDB (Korea Transport DataBase) 와 리트머스 데이터를 간접 비교한 결과 입니다. 


검증 결과 외부 공유


기존 유동인구 서비스들은 검증 및 정확도 측정을 할 수 없는 구조로 구성되어 있었습니다. 일반적으로 시공간의 인구 분포와 같은 전통적인 유동인구 서비스는 검증을 위한 정답지 확보가 불가능했기 때문입니다. 리트머스는 전통적인 서비스의 불확실성에서 벗어나고자 하였고 이동 여정을 검증함으로써 정답지와 더불어 정확도를 실질적으로 도출할 수 있게 되었습니다. 리트머스의 검증 결과는 주기적으로 홈페이지 등을 통해 공개 되고 있습니다.

[간접검증 대시보드 공유] 추가로 다양한 간접 검증 결과를 확인하실 수 있도록 검증 결과 대시보드를 준비 중에 있습니다 ('24년 상반기 중)

데이터를 만드는 것보다 중요한 것은, 수년에 걸쳐 어떻게 그 데이터를 검증할지에 대한 노하우를 쌓는 것입니다. 리트머스는 이러한 과정을 통해 높은 신뢰도를 확보하였으며, 국가 통계청과 같은 권위 있는 기관을 포함한 다양한 국가 기관에 데이터를 제공해 왔습니다. 우리는 데이터의 질을 통해 신뢰를 구축하고, 이를 통해 파트너와 고객에게 실질적인 가치를 제공하고자 합니다.

keyboard_double_arrow_left Back