
- AI 학습용 고가치 데이터의 안전한 반출 절차 및 적정성 심의 체계 확립
- 단순 민원을 넘어 연구 목적의 데이터 요구에 대응하는 공공데이터 활용 모범사례 제시
개인정보 비식별화 및 합성데이터 생성 전문 기업 드위치는 지난 8월부터 11월까지 약 90일간 서울교통공사(이하 공사)와 ‘가명정보 처리 컨설팅 용역’ 계약을 맺고 가명처리 및 합성데이터 생성을 성공적으로 지원했다.
최근 서울시의 행정적 요청이나 단순 정보공개 청구 위주였던 공공데이터 제공 트렌드가 연구 목적의 AI 학습용 데이터 요청으로 급격히 변화하고 있다. 이에 발맞춰 공사는 드위치와의 이번 사업을 통해 내부의 개인정보 처리 및 반출 절차를 구체화하고, 적정성 심의를 통한 안전한 데이터 활용 문화를 정립하는 전기를 마련했다.
이번 프로젝트에서 다뤄진 원본 데이터는 ▲성평등 임금공시 데이터 ▲지하철 안전관리 데이터 ▲챗봇 데이터 등으로, 개인정보가 포함되어 있거나 외부 유출 시 사회적 파장이 예상되어 그간 반출이 까다로웠던 고가치 데이터들이다. 드위치는 해당 데이터들의 민감도를 정밀하게 파악하여 목적에 맞는 가명·익명처리를 수행하였으며, 특히 AI 학습 모델의 성능을 유지하면서도 개인정보를 원천 차단하는 합성데이터 기술을 적용했다.
특히, 드위치는 단순히 데이터 가공에 그치지 않고 외부 전문가가 참여하는 '적정성 심의위원회' 구성을 지원하여, 가공된 데이터가 정부 가이드라인에 따라 안전하게 반출될 수 있도록 절차적 정당성을 확보했다. 이를 통해 공사는 민감한 정보를 보호하면서도 민간 및 연구 기관에 유용한 데이터를 개방할 수 있는 선진적인 거버넌스를 구축하게 되었다.
드위치는 이번 성과를 바탕으로 정형데이터 가명처리 솔루션인 ‘FORTE’와 비정형데이터용 ‘PIANO’를 통해 공공기관의 AI 친화적(AI-Ready) 데이터 환경 구축을 지속적으로 지원할 계획이다.
- AI 학습용 고가치 데이터의 안전한 반출 절차 및 적정성 심의 체계 확립
- 단순 민원을 넘어 연구 목적의 데이터 요구에 대응하는 공공데이터 활용 모범사례 제시
개인정보 비식별화 및 합성데이터 생성 전문 기업 드위치는 지난 8월부터 11월까지 약 90일간 서울교통공사(이하 공사)와 ‘가명정보 처리 컨설팅 용역’ 계약을 맺고 가명처리 및 합성데이터 생성을 성공적으로 지원했다.
최근 서울시의 행정적 요청이나 단순 정보공개 청구 위주였던 공공데이터 제공 트렌드가 연구 목적의 AI 학습용 데이터 요청으로 급격히 변화하고 있다. 이에 발맞춰 공사는 드위치와의 이번 사업을 통해 내부의 개인정보 처리 및 반출 절차를 구체화하고, 적정성 심의를 통한 안전한 데이터 활용 문화를 정립하는 전기를 마련했다.
이번 프로젝트에서 다뤄진 원본 데이터는 ▲성평등 임금공시 데이터 ▲지하철 안전관리 데이터 ▲챗봇 데이터 등으로, 개인정보가 포함되어 있거나 외부 유출 시 사회적 파장이 예상되어 그간 반출이 까다로웠던 고가치 데이터들이다. 드위치는 해당 데이터들의 민감도를 정밀하게 파악하여 목적에 맞는 가명·익명처리를 수행하였으며, 특히 AI 학습 모델의 성능을 유지하면서도 개인정보를 원천 차단하는 합성데이터 기술을 적용했다.
특히, 드위치는 단순히 데이터 가공에 그치지 않고 외부 전문가가 참여하는 '적정성 심의위원회' 구성을 지원하여, 가공된 데이터가 정부 가이드라인에 따라 안전하게 반출될 수 있도록 절차적 정당성을 확보했다. 이를 통해 공사는 민감한 정보를 보호하면서도 민간 및 연구 기관에 유용한 데이터를 개방할 수 있는 선진적인 거버넌스를 구축하게 되었다.
드위치는 이번 성과를 바탕으로 정형데이터 가명처리 솔루션인 ‘FORTE’와 비정형데이터용 ‘PIANO’를 통해 공공기관의 AI 친화적(AI-Ready) 데이터 환경 구축을 지속적으로 지원할 계획이다.