기술

AI 통계전수화

기존 전수화 기법에 대한 고민


우리는 기존의 전통적인 인구 통계 전수화 방식보다 더 나은 전수화(주) 방법을 고민했습니다. 기존 전수화 기법은 대상 지역의 가입자 분포 패턴을 실제 주민등록 인구에 확대 적용하는 방식으로 단순한 지역 내 인구 분포에는 나쁘지 않은 결과를 보였습니다. 그렇지만 리트머스의 데이터는 단순한 인구 분포가 아닌 개별 인구의 이동을 구체화 한 것이기에 기존 인구통계 전수화 방식으로는 충분히 좋은 결과에 도달하지 못할 수 있습니다.

(주) 샘플링 결과를 전체 모수로 확장하는 기법, 예를 들어 SKT의 40% 점유율로 추정한 데이터를 전국민 100% 일 때를 가정하여 재가공 하는 방법을 말한다. 


합성인구 기반 전수화 기법


이에 우리는 합성인구 (Synthetic Population) 를 활용한 AI 통계 전수화 방식을 도입하였습니다. 기존에 많은 선행 연구가 있었고 유의미한 결과를 도출한 방식으로 합성인구 방식의 통계 전수화는 아래 그림과 같은 개념으로 구성됩니다. 


쉽게 말해 리트머스가 샘플링 하지 못하는 나머지 60%의 이동을 AI 의 학습결과를 통해 만들어내는 가상의 이동 객체를 구성하는 것입니다. 이 가상의 이동 객체는 다양한 인구 통계 조사 결과, 리트머스의 컨텍스트 데이터를 포함한 직간접적인 정답 데이터를 학습하여 이동의 세부 특성을 반영하는 페르소나 (Persona) 를 만들어 냅니다. 페르소나를 부여받은 이동 객체는 페르소나의 특성에 따라 기계 학습된 방식으로 각자 실제 사람과 같은 이동 상태를 업데이트 합니다. 


이렇게 60%의 합성인구 페르소나가 이동하는 결과와 40%의 실제 인구가 이동하는 샘플을 결합하면 총 100%의 전수화 통계 데이터가 만들어지게 됩니다. 이러한 합성인구 기반의 AI 통계 전수화는 이동 중 발생하는 다양한 인사이트, 즉 이동 수단, 이동 경로, 이동 거리, 이동 수단, 이동 목적 등 다양한 형태의 특성을 페르소나의 특성에 맞도록 생성해내고 이를 통해 더욱 풍부하며 통계적 오류에 치우치지 않는 다양한 결과를 만들어낼 수 있습니다. 

keyboard_double_arrow_left Back