
- 수만 건의 금융 신청 내역을 시계열 및 고객 특성 보전한 고품질 합성데이터로 변환
- 공공데이터포털 공개를 통해 일반인 및 연구자의 금융 서비스 연구 지원 기반 마련
개인정보 비식별화 및 합성데이터 생성 전문 기업 드위치는 지난 8월부터 9월까지 약 2개월간 예금보험공사(이하 공사)와 ‘합성데이터 생성 용역’ 계약을 맺고, 공사가 보유한 핵심 금융 데이터를 안전하게 개방할 수 있도록 합성데이터 생성 및 적정성 검증을 완료했다.
예금보험공사는 지난 2021년부터 홈페이지를 통해 ‘잘못 보낸 돈 되찾기 서비스(착오송금반환지원 제도)’를 운영하며 현재까지 수만 건의 신청 내역을 확보하고 있다. 공사는 이 고가치 금융 데이터를 통계적 특성이 유지된 합성데이터로 재생성하여 ‘공공데이터 포털’에 공개함으로써, 일반 국민과 연구 기관이 금융 데이터를 기반으로 혁신적인 연구를 수행할 수 있도록 지원하는 것을 목표로 했다.
금융 데이터는 고객의 연령대, 성별, 지역 등 인구통계학적 특성과 자금 흐름에 따른 시계열적 특성에 매우 민감하다. 따라서 단순히 알고리즘에 따라 데이터를 생성하는 것을 넘어, 원본의 통계적 유용성을 보전하면서도 개인 식별 위험을 원천 차단하는 기술력이 요구된다. 드위치는 자사 솔루션을 활용해 금융 데이터의 복잡한 상관관계를 정밀하게 재현하였으며, 생성된 데이터의 안전성과 유용성이 보장되는지 객관적 지표를 통해 검증을 완료했다.
특히 드위치는 이번 용역을 통해 합성데이터 생성부터 반출까지의 전 과정을 구체화한 내부 프로세스를 수립하고, 외부 전문가가 참여한 ‘적정성 심의위원회’를 거쳐 가공된 데이터가 안전하게 반출될 수 있도록 지원했다. 이를 통해 공사는 민감한 개인정보가 포함된 금융 데이터를 안전하게 활용하고 개방할 수 있는 선진적인 데이터 거버넌스를 구축하게 되었다.
§ 공공데이터 포털: https://www.data.go.kr/data/15150173/fileData.do
§ 관련 기사: https://www.yna.co.kr/view/AKR20250922116300002
- 수만 건의 금융 신청 내역을 시계열 및 고객 특성 보전한 고품질 합성데이터로 변환
- 공공데이터포털 공개를 통해 일반인 및 연구자의 금융 서비스 연구 지원 기반 마련
개인정보 비식별화 및 합성데이터 생성 전문 기업 드위치는 지난 8월부터 9월까지 약 2개월간 예금보험공사(이하 공사)와 ‘합성데이터 생성 용역’ 계약을 맺고, 공사가 보유한 핵심 금융 데이터를 안전하게 개방할 수 있도록 합성데이터 생성 및 적정성 검증을 완료했다.
예금보험공사는 지난 2021년부터 홈페이지를 통해 ‘잘못 보낸 돈 되찾기 서비스(착오송금반환지원 제도)’를 운영하며 현재까지 수만 건의 신청 내역을 확보하고 있다. 공사는 이 고가치 금융 데이터를 통계적 특성이 유지된 합성데이터로 재생성하여 ‘공공데이터 포털’에 공개함으로써, 일반 국민과 연구 기관이 금융 데이터를 기반으로 혁신적인 연구를 수행할 수 있도록 지원하는 것을 목표로 했다.
금융 데이터는 고객의 연령대, 성별, 지역 등 인구통계학적 특성과 자금 흐름에 따른 시계열적 특성에 매우 민감하다. 따라서 단순히 알고리즘에 따라 데이터를 생성하는 것을 넘어, 원본의 통계적 유용성을 보전하면서도 개인 식별 위험을 원천 차단하는 기술력이 요구된다. 드위치는 자사 솔루션을 활용해 금융 데이터의 복잡한 상관관계를 정밀하게 재현하였으며, 생성된 데이터의 안전성과 유용성이 보장되는지 객관적 지표를 통해 검증을 완료했다.
특히 드위치는 이번 용역을 통해 합성데이터 생성부터 반출까지의 전 과정을 구체화한 내부 프로세스를 수립하고, 외부 전문가가 참여한 ‘적정성 심의위원회’를 거쳐 가공된 데이터가 안전하게 반출될 수 있도록 지원했다. 이를 통해 공사는 민감한 개인정보가 포함된 금융 데이터를 안전하게 활용하고 개방할 수 있는 선진적인 데이터 거버넌스를 구축하게 되었다.
§ 공공데이터 포털: https://www.data.go.kr/data/15150173/fileData.do
§ 관련 기사: https://www.yna.co.kr/view/AKR20250922116300002