Sqix

데이터 스페이스 - 1. 데이터 스페이스란 무엇인가? 본문

Data Space

데이터 스페이스 - 1. 데이터 스페이스란 무엇인가?

Sqix_ow 2026. 6. 15. 16:59

최근 들어 관심을 깊게 가지고 있는 "데이터 스페이스"라는 기술에 대해서 소개하고자 한다. 초장에서는 데이터 스페이스에 대해서 폭넓게 소개하고, 심층적으로 한 Depth씩 들어가서 데이터 스페이스에 대해서 다뤄보도록 하고자 한다.

데이터 스페이스란 무엇이고, 어디에서부터 왔는가?

우선 데이터 스페이스는 데이터 공유 기술의 일종으로, 빅데이터 플랫폼, 데이터 포털 등과 같이 데이터를 공유하기 위한 시스템이다. 그러나, 데이터 스페이스는 기존 빅데이터 플랫폼이나 데이터 허브처럼, 데이터를 한 곳에 모으는 시스템이 아니라 데이터가 각자의 원천(Data Source)에 머문 상태에서 신원(Identification), 계약(Contract), 정책(Policy), 의미(Metadata Profile / Data Ontology), 감사 체계를 표준화하여 필요한 순간에만 안전하게 연결하여 데이터를 공유하는 환경이라고 할 수 있다.

 

기존의 빅데이터 플랫폼과 같은 데이터 레이크의 경우 데이터를 수집하여 개방하는 형태를 띄었으나, 기업 및 기관이 민감한 데이터를 제공/활용할 수 있도록 하기에는 기업의 거버넌스적 문제와, 보안 관점에서의 컴플라이언스 문제로 인해서 크나큰 한계가 있었다. 이와 더불어 데이터 제공자 입장에서는 내가 한 번 제공한 데이터가 어디서 어떻게 쓰이는지에 대한 계보 추적 및 관리가 사실상 불가능한 문제가 있었고, 데이터 소비자 입장에서는 기관마다 다른 API, 메타데이터, 승인 절차를 가지고 있어서 실제 데이터를 AI나 분석에 활용하기에는 공수가 많이 소요되는 문제가 있다.

 

이는 데이터 스페이스의 출발점으로서 작용하였는데, Industrial Data Space가 제시한 "스마트한 데이터 관리 체계"의 필요성과도 직결된다.(https://ec.europa.eu/futurium/en/system/files/ged/industrial_data_space.pdf) 제조, 물류, 자동차, 에너지와 같은 산업에서는 기업 간 데이터가 연결되어야 제품 추적, 품질 개선, 예측 정비, 탄소 배출 산정, 공급망 최적화가 가능하다. 하지만 현실에서는 공급망 단계마다 데이터가 중복 저장되고, 형식이 다르고, 소유권과 책임이 불명확하며, 민감 데이터는 공유 자체가 거부되는 경우도 허다하다. 

 

Industrial Data Space에서는 이 문제를 데이터 주권, 데이터 거버넌스, 안전한 데이터 교환, 인증된 참여자, 분산형 아키텍처, 공통 시맨틱 모델로 풀어내고자 데이터 스페이스 모델을 제시한다. 

  1. 데이터 주권(Data Sovereignty)은 데이터 제공자가 자신의 데이터가 누구에게, 어떤 목적으로, 어떤 조건에서 쓰이는지를 데이터가 손을 떠난 뒤에도 계속 결정할 수 있어야 한다는 원칙이다
  2. 데이터 거버넌스(Data Governance)는 누가 어떤 역할과 책임을 지고 어떤 규칙 아래 데이터를 주고받을지를 참여자 모두가 합의한 공통 규약으로 명문화하는 것이다
  3. 안전한 데이터 교환(Secure Data Exchange)은 데이터가 암호화되고 인증된 통로로만 오가도록 보장한다
  4. 인증된 참여자(Certified Participants) 원칙은 신원과 자격이 검증된 주체만 생태계에 들어오도록 하여 믿을 수 있는 상대방과 데이터를 공유하도록 한다
  5. 분산형 아키텍처(Distributed Architecture)는 데이터를 한곳에 쌓는 중앙 저장소 없이 데이터가 각자의 원천에 머문 채로 필요할 때만 연결되도록 하는 아키텍처 원칙이다
  6. 공통 시맨틱 모델(Common Semantic Model)은 서로 다른 조직이 같은 용어를 같은 의미로 해석할 수 있도록 공통 어휘와 온톨로지를 정의한다

이를 통해 데이터 스페이스가 기존 데이터 공유 방식과 다른 점을 도출할 수 있는데, 데이터 레이크나 데이터 허브가 데이터를 한곳에 모아서 제공하는 패러다임이라면, 데이터 스페이스는 데이터를 제자리에 둔 채로 필요할 때 안전하게 연계하고 연결하는 패러다임이다.

 

비유하자면 전자는 여러 기관의 책을 모두 거대한 중앙 창고로 옮겨 쌓아 두는 방식이고, 후자는 각 도서관이 자기 책을 그대로 소장하되 표준화된 목록과 대출 규칙, 회원 인증 체계를 공유하여 필요한 책만 규칙에 따라 빌려주는 네트워크에 가깝다. 데이터를 옮겨 한곳에 쌓는 순간 통제권과 소유권, 책임의 경계가 흐려지고, 중앙에서는 이를 적재하고 관리하기 위한 비용이 증가하지만, 데이터를 제자리에 두고 연결하며, 데이터의 계보를 추적하면 통제권을 원본 제공자에게 부여하고, 데이터 스페이스를 구성하기 위한 컴포넌트 비용 및 활용을 위한 하드웨어, 네트워크 체계 수준의 비용만 추가되어 효율적이다.

 

이렇게 보면 앞에서 짚은 한계들이 왜 생겼는지, 그리고 데이터 스페이스가 그것을 어떻게 뒤집는지가 분명해진다. 데이터를 모으는 모델에서는 제공자가 데이터를 내주는 순간 통제권을 함께 잃었고, 그래서 민감한 데이터일수록 공유가 거부되었으며, 기관마다 제각각인 형식과 절차가 그대로 데이터 소비자에게 떠넘겨졌다. 데이터 스페이스는 데이터를 옮기지 않음으로써 제공자의 통제권을 지키고, 참여 규칙과 의미 체계를 표준화함으로써 소비자가 기관을 옮길 때마다 새로 적응해야 하는 비용을 없앤다. 발상을 한 번 모아서 개방한다에서 주권과 규칙을 표준화해 두고 그때그때 연결한다는 개념으로 바꾼 것이다.

 

데이터 스페이스라는 개념이 어디서 출발해 어떻게 지금의 모습으로 자랐는지를 짚어보면, 이 기술이 단순한 유행이 아니라 십 년 넘게 다져진 흐름임을 알 수 있다. 출발점은 독일의 응용연구기관 Fraunhofer다. Fraunhofer-Gesellschaft는 2014년 말 산업계·정부와 함께 "Industrial Data Space" 이니셔티브를 출범시켰고 (https://www.fraunhofer.de/en/research/lighthouse-projects-fraunhofer-initiatives/international-data-spaces.html) 2015년 3월 CeBIT에서 핵심 구상안을 발표한 뒤 같은 해 10월 1일 정식 연구 프로젝트를 시작했다.

 

초기 이 프로젝트는 12개 Fraunhofer 연구소가 참여하고 Boris Otto 교수가 이끌었으며, 독일 연방교육연구부(BMBF)가 약 5백만 유로를 지원하는 3년짜리 사업이었다. 이후 2016년 1월 26일 베를린에서 비영리 협회 "Industrial Data Space e.V."가 설립되어 산업 표준화를 위해 데이터 스페이스의 참조 아키텍처 모델(Reference Architecture Model, IDS-RAM)을 개발하고 발전시켜나갔다.

 

Fraunhofer가 처음부터 분명히 짚은 문제의식은 데이터는 전략적 자원이 되었지만, 바로 그 때문에 역설에 빠진다는 점이다. 데이터의 가치가 높을수록 이를 보호하기 위한 컴플라이언스가 강해지고, 이는 공유해야 가치가 생긴다는 명령과 정면으로 충돌하게 된다. 이들은 이 충돌을 푸는 열쇠가 데이터 주권이며, 여기에 익명화·통합·데이터 유효기간(expiration date) 관리 같은 데이터 서비스와 인증된 교환을 더해 주권을 잃지 않으면서 안전하게 연결하는 인프라를 만들어야 한다는 사상을 가지고 IDS의 출발을 구상하였다.

 

이렇게 출발한 데이터 스페이스는 2020년대 들어 유럽 차원의 생태계로 확장된다. EU 데이터 전략을 기반으로 방향성과 사업을 제시하는 EU 집행위원회를 중심으로, 표준과 생태계를 구성하는 DSSC, IDSA, Gaia-X, BDVA와 이들의 연합체인 DSBA, 표준을 실제 구현체로 구현하는 Fiware 및 Eclipse 재단이 대표적이다. 

 

이렇게 유럽 차원의 생태계로 자라난 데이터 스페이스가, 특히 최근 들어 다시 주목받는 데에는 분명한 이유가 있다.

  1. 첫째는 AI다. 모델의 성능이 결국 학습 데이터의 품질과 다양성에 좌우되면서, 기관의 경계를 넘어 양질의 데이터를 확보하되 그 출처와 사용 범위를 추적·통제할 수 있는 방식에 대한 수요가 커졌다.
  2. 둘째는 제도다. 2025년 9월부터 본격 적용되기 시작한 EU 데이터법(Data Act)이 데이터 접근과 공유를 둘러싼 권리와 의무를 명문화하면서, 데이터 주권과 공정한 데이터 공유가 선언적 구호를 넘어 규제의 영역으로 들어왔다.
  3. 셋째는 표준화다. 데이터 스페이스의 핵심 통신 규약인 데이터 스페이스 프로토콜(Dataspace Protocol, https://internationaldataspaces.org/offers/dataspace-protocol/)이 2025년 7월 정식 버전으로 공개되고 현재 ISO/IEC 국제표준화 절차를 밟음과 동시에 Gaia-X에서 시행하는 다양한 Lighthouse Project의 결과가 드러나기 시작하면서, 데이터 스페이스의 TRL이 7단계 이상으로 넘어가고 있다. 국내에서도 2025년 10월 통계청이 국무총리 직속 국가데이터처로 승격하고 국가데이터기본법이 마련되는 등, 데이터를 국가 자원으로 보고 거버넌스를 강화하려는 흐름이 뚜렷한 현황이다.

데이터 스페이스의 실제 사례

앞서 데이터 스페이스가 주목받는 세 번째 이유로 "Gaia-X Lighthouse Project의 결과가 드러나기 시작했다"는 점을 들었다. 그 결과가 구체적으로 무엇인지, 여덟 개 사례로 확인해 보자. 다만 사례별 성숙도에 큰 차이가 있다는 점을 먼저 짚어둔다. Catena-X·Mobility Data Space·Pontus-X는 이미 다수 기관이 참여해 운영 중인 대형 생태계라 도입 규모와 정성적 성과가 뚜렷하다. 반면 COOPERANTS·AgrospAI·RegenAg-X·Empower-X·Dynamo는 대체로 데모·실증 단계이다. 

 

Catena-X

자동차 가치사슬은 OEM과 수많은 1·2·n차 협력사로 이뤄지는데 대다수가 중소기업이다. 부품의 상태 및 출처를 추적하거나 계보를 관리하고(Traceability), 제품 단위 탄소발자국(PCF)을 계산하거나, 품질 문제의 원인을 신속히 찾으려면 기업 경계를 넘는 데이터가 필요하지만, 데이터는 파편화되고 시스템은 단절되어 있으며 공급망은 다층적이다. 게다가 협력사는 OEM마다 다른 독점 인터페이스에 각각 대응해야 했다. 이러한 문제점을 해결하기 위해 2021년 Catena-X는 산업 이니셔티브로 출발해서 2023년 1월 우리가 익히 아는 독일의 자동차 및 부품 회사들인 Mercedes-Benz·BASF·BMW·Henkel·SAP·Schaeffler·Siemens·T-Systems·Volkswagen·ZF 등 10개 주주가 운영회사 Cofinity-X를 설립하면서 실제 서비스로 산업화되었다.

 

Catena-X는 자동차 산업을 위한 개방형 데이터 스페이스로, IDS/Gaia-X 원칙 위에서 표준화된 시맨틱 모델(SAMM 기반 Aspect Model)과 정책 기반 데이터 교환을 제공한다. 오픈소스 레퍼런스 구현인 Eclipse Tractus-XEclipse EDC 기반의 구현체로 기술 스택은 크게 세 층으로 나뉜다.

  • Transport Layer : 모든 참여자는 Tractus-X EDC 커넥터를 양쪽에 둔다. EDC는 정책·계약을 처리하는 Control Plane과 실제 데이터를 전송하는 Data Plane으로 분리되며, 데이터 스페이스 프로토콜(DSP)과 분산 신원인증 프로토콜(DCP)을 구현한다. 데이터 전송 전 반드시 계약 협상이 선행되고, 사용 규칙은 ODRL 기반 접근/사용 정책(표준 CX-0152)으로 강제된다.
  • Identity & Trust Layer : 참여자는 고유 식별자 BPN(Business Partner Number)과 DID로 식별되고, Managed Identity Wallet에 멤버십 등 검증가능 자격증명(VC)을 보관한다. 거래 상대 회사의 커넥터 주소는 BPN을 키로 EDC Discovery를 통해 찾는다. SSI(자기주권신원) 방식이라 중앙 인증기관에 의존하지 않는다.
  • Semantic Layer : 부품·차량 같은 실물 자산은 AAS(Asset Administration Shell) 기반 디지털 트윈으로 표현되고, 각 측면의 의미는 RDF/Turtle로 기술된 Aspect Model(메타모델 SAMM 준수)로 정의된다. 분산형 디지털 트윈 레지스트리(DTR)가 트윈의 위치(서브모델 엔드포인트)를 찾아주고, IRS(Item Relationship Service)가 디지털 트윈의 트리 구조를 거슬러 올라가며 Supply Data Chain을 구성한다.

2025년 IAA Mobility를 기점으로 Catena-X는 TRL 7~8 수준의 운영 중인 글로벌 생태계로 평가받으며 확산 단계에 들어섰다(https://www.cofinity-x.com/news). Traceability, PCF, 디지털 제품 여권(DPP), 공급망 회복력, 품질관리, 비즈니스 파트너 데이터 관리(BPDM) 등 10개 이상의 표준 유즈케이스가 가동 중이고, BASF·CircularTree·Cofinity-X가 함께 만든 PCF 앱 'PACIFIC'처럼 도메인 특화 솔루션이 마켓플레이스에 올라와 있다.

 

구체적 도입 사례로, 글로벌 부품사 Dräxlmaier(직원 7만여 명, 20개국 60개 거점)는 배터리 수입에 필요한 추적 요건을 충족하기 위해 독점 인터페이스에서 Catena-X 표준으로 전환했고, 전환 과정에서 생산 중단 없이(zero production disruption) 표준화·확장성·규제 준수를 확보했다(https://www.cofinity-x.com/blog/webinar-summary-how-draxlmaier-mastered-traceability-with-catena-x).

 

다만 Catena-X에서도 "리콜 비용 X% 절감"식의 정밀한 정량 KPI는 아직 공개가 제한적이다. 바로 이 공백을 메우기 위해 IDSA와 Catena-X는 2025년 €23M 규모의 'Data Space Accelerator' 프로그램을 출범시켰는데, 이는 다수의 n차 협력사를 실제로 온보딩시켜 네트워크 효과와 경제적 가치를 실증 데이터로 측정하려는 시도이다.

 

Mobility Data Space

 

교통·물류 데이터는 지자체와 기업의 단절된 시스템에 흩어져 있어, 교통 예측·스마트시티·물류 최적화 같은 서비스를 만들려는 쪽과 데이터를 가진 쪽이 안전하게 만나기 어려운 문제가 있었다. 이를 해결하기 위해 만들어진 MDS는 2019~2020년 독일 연방정부 주도로 200여 이해관계자가 함께 만든 모빌리티 B2B 데이터 마켓플레이스로, IDS-RAM을 따르되 Catena-X와 마찬가지로 EDC 기반 커넥터를 핵심에 둔다. 다만 모빌리티 도메인에 맞춘 특징이 있다.

  • MDS Connector와 Connector-as-a-Service. 참여자는 EDC 기반 MDS Connector를 자사 인프라 혹은 CaaS 형태로 활용하여 Point-to-Point로 데이터를 주고받는다. 직접 운영이 부담스러운 회원을 위해 커넥터를 SaaS로 빌려 쓰는 Connector-as-a-Service(CaaS) 옵션도 있다. 데이터는 중앙에 모이지 않고, 전송 직전에 사용 규칙(정책)이 데이터에 부착되어 계약 당사자 사이에서만 오간다.
  • 모빌리티 시맨틱. MDS는 교통·모빌리티 데이터 형식 DATEX II·NeTEx와 API 규격 SIRI·TRIAS를 어휘·온톨로지 형태로 제공해, 서로 다른 출처의 데이터가 기계적으로 해석·상호운용되도록 한다. 자동차 도메인의 SAMM/AAS에 대응하는 모빌리티판 의미 계층이라고 볼 수 있다.
  • 신뢰와 부가 서비스. 신원 제공자(Identity Provider)가 제공자·소비자·데이터·앱의 신뢰성을 평가하고, 데이터 앱 스토어를 통해 모빌리티 데이터 처리용 앱을 등록·유통한다. 2025년 상반기에는 공공부문 데이터 플랫폼 Mobilithek과 완전 연동되어, 공공 데이터까지 같은 커넥터로 소비할 수 있게 됐다.

Mobility Data Space의 운영 주체는 비영리 DRM Datenraum Mobilität GmbH이며 2026년까지 연방교통부(BMV)의 지원 하에 운영되고 있다. MDS는 현재 150개 이상의 회원이 참여하는 "데이터 공유 커뮤니티"로 운영되고 있으며(https://mobility-dataspace.eu/), 참여 기관에는 Vodafone, Deutsche Bahn, DHL, Volkswagen, HUK-Coburg(보험), Tier Mobility, Here Technologies 등 모빌리티 안팎의 주요 사업자가 포함된다.

 

MDS는 차량 데이터뿐 아니라 보험·기상·행정 데이터까지 다룬다는 점이 특징이고, 2025년 상반기에는 공공부문 데이터 플랫폼 Mobilithek과 완전 연동되었다. 구체적 활용 예로, 한 물류기업이 MDS의 데이터를 결합해 공차 운행(empty runs)을 줄이고 에너지 소비를 낮춘 사례가 보고되었는데, 어느 기업도 데이터를 독점적으로 통제하지 않은 채 이를 달성했다는 점이 핵심이다(https://gaia-x-hub.de/en/campus-en/data-spaces/).

 

Pontus-X

 

분야별 데이터 스페이스를 각자 처음부터 구축하면 중복 투자가 크고, 서로 연결되지 않는 섬이 늘어난다. 또 민감한 원본 데이터를 넘기지 않으면서도 그 데이터로 AI를 학습·활용하게 하는 일은 기술적으로 까다롭다. 이에 출범한 Pontus-X는  deltaDAO가 2021년 출범시킨, 공개적으로 이용 가능한 최대 규모의 Gaia-X 생태계다. 앞의 두 사례가 EDC 커넥터 기반이라면, Pontus-X는 블록체인과 스마트 컨트랙트를 토대로 한 Web3 기반 접근이라는 점이 결정적으로 다르다.

  • 네트워크 계층의 기반은 Pontus-X 네트워크(GEN-X)으로 Polygon Edge로 구축되어 Polygon Supernets로 이행 중인 EVM 호환 블록체인이다. 유럽의 여러 클라우드 제공자에 분산 배치된 탈중앙 인프라(DePIN)로, 단일 통제·장애점이 없다.
  • 데이터 교환·카탈로그·계약·오케스트레이션은 Ocean Protocol 스택의 스마트 컨트랙트로 처리된다. 각 데이터 자산은 DID로 식별되고 메타데이터를 담은 DDO로 기술되는데, Pontus-X에서는 하나의 DID에 Ocean용 DDO와 Gaia-X 서비스 크리덴셜이라는 두 DDO가 붙는다. 자산 접근권은 datatoken으로 표현되고(토큰을 가지면 그 서비스를 쓸 수 있다), 메타데이터 검색은 캐시 서비스 Aquarius가, 접근 권한 검증·중개는 Provider(Access Controller)가 담당한다.
  • 가장 핵심적인 데이터 주권 기술은 Compute-to-Data(C2D)다. 원본을 복제해 넘기는 대신, 데이터는 소유자 인프라에 머문 채 알고리즘이 데이터로 찾아가 실행되고 결과(insight)만 반환된다. 덕분에 민감 데이터를 노출하지 않고도 연합학습·연합분석과 온디맨드 익명화가 가능하다.
  • 모든 참여자는 Gaia-X Trust Framework에 따라 Self-Description(자기기술서)을 제출하고, Pontus-X는 기본적으로 Gaia-X Digital Clearing House(GXDCH)를 통해 서비스 크리덴셜을 검증한다. 정산·과금은 스마트 컨트랙트로 자동화되어 사용한 만큼만(pay-per-use) 지불한다.

Pontus-X에는 100개 이상의 기관·유즈케이스·서비스가 온보딩되어 있고, 항공우주·농업·제조·모빌리티·AI 등 여러 분야의 Gaia-X 등대 프로젝트(ACCURATE, COOPERANTS, EuProGigant, Gaia-X4FutureMobility 등)를 품는 System of Systems 형태로 기능한다(https://www.pontus-x.eu/).

 

구체적 활용 예로, 정밀 모터 스핀들 제조사 GMN은 현장 스핀들의 품질·진동 데이터를 Pontus-X에 연결해 조립 검증·디지털 시운전 같은 데이터 기반 서비스를 고객에게 제공하고, 정밀공구 기업 Gühring는 자사의 공구 추천 서비스를 SaaS 형태로 수익화한다. 즉 데이터를 파는 대신 원본은 지키고 Insight와 Service를 as a Service 형태로 파는 새 비즈니스 모델이 실제로 작동하는 모습을 보여준다.

 

데이터 스페이스의 기술적 표준

앞의 사례들이 서로 다른 회사·기관 사이에서 실제로 데이터를 주고받을 수 있었던 것은, 그 밑에 공통의 프로토콜이 깔려 있기 때문이다. 데이터 스페이스의 기술적 핵심은 두 개의 프로토콜로 요약할 수 있다. 데이터를 어떻게 주고받을지를 정하는 DSP(Dataspace Protocol)와, 상대가 누구이고 믿을 수 있는지를 정하는 DCP(Decentralized Claims Protocol)다.

 

DSP(Dataspace Protocol)는 데이터 스페이스의 커넥터끼리 어떻게 대화할지를 규정하는 표준이다. 구체적으로는 세 과정을 다룬다.

  1. 카탈로그 조회 : 상대가 어떤 데이터를 어떤 조건에 제공하는지 탐색한다
  2. 계약 협상 : ODRL로 표현된 사용 정책을 양측이 협상하고 체결한다.
  3. 데이터 전송 : 체결된 계약에 따라 실제 데이터를 주고받는다. 

해당 프로토콜은 HTTPS 기반의 RESTful 방식이라 기존 웹 기술 위에서 그대로 동작한다. 앞서 데이터 주권 원칙에서 말한 주권 보장의 원칙이 바로 이 DSP의 계약 협상·전송 절차를 통해 기술적으로 집행되는 셈이다. DSP는 원래 IDSA가 만들었고 2023년 벤더 중립적 발전을 위해 Eclipse 재단으로 이관되었으며, 2025년 7월 정식 버전(2025-1)이 공개되어 현재 ISO/IEC 국제표준화 절차를 밟고 있다.

 

DCP(Decentralized Claims Protocol)는 DSP가 일부러 다루지 않은 부분, 즉 신원과 신뢰를 담당하는 표준이다. DSP는 참여자가 누구인지, 신뢰할 수 있는지를 정의하지 않고 그 결정을 각 데이터 스페이스에 맡겨 두는데, DCP가 바로 이 빈자리를 메우는 오버레이(overlay) 프로토콜이다.

 

DCP는 자체 발급(self-issued) 신원 토큰의 형식, 검증가능 자격증명(Verifiable Credentials, VC)을 저장·제시하는 방법, 발급기관에 자격증명을 요청하는 방법을 정의한다. 핵심은 분산형이라는 점이다. 즉, 여러 신뢰 기점(trust anchor, 자격증명 발급기관)을 허용하고, 중앙의 제3자 검증기관 없이도 참여자끼리 신원과 자격을 증명·검증할 수 있게 한다. 이는 자기주권신원(Self-Sovereign Identity) 개념에 기반하며, 네트워크의 견고성을 높이고 통신 도청 가능성을 줄인다. 

 

이 표준들이 중요한 이유는, 바로 이것들이 있어야 서로 다른 데이터 스페이스가 연결될 수 있기 때문이다. 원리적으로 Catena-X 참여자와 Mobility Data Space 참여자가 상호운용할 수 있는 것은 둘이 같은 DSP·DCP 위에 서 있기 때문이다. 인터넷이 IP라는 공통 규약 위에서 폭발적으로 성장했듯, 데이터 스페이스도 DSP·DCP라는 공통 규약을 갖추면서 비로소 개별 실험을 넘어 연결된 생태계로 확장될 발판을 마련했다.

 

더불어 최근에는 AS4 프로토콜 기반의 안전한 처리 환경(Secure Processing Environment, SPE)이 등장하고 있다. SPE는 데이터를 밖으로 내보내지 않고 그 안에서만 분석하도록 울타리를 친 통제된 환경으로, 허가받은 이용자가 자신의 분석 도구나 AI 모델을 환경 안으로 들고 들어가 실행한 뒤 원본이 아닌 결과(집계·통계)만 반출하도록 하는 시스템으로, EHDS(유럽 보건 데이터 스페이스)에서는 민감 데이터 이동 시 SPE를 통해사 제공하고 데이터를 처리하도록 컴플라이언스를 갖추고 있다.


 

다음 시간에는 이들 중에서도, 데이터 스페이스의 핵심이라 할 수 있는 데이터 스페이스 프로토콜을 알아보고 이를 하나씩 구현하는 단계를 밟도록 할 것이다.

 

Comments