생성형 AI 시대, 공공기관 업무는 왜 여전히 느린가
공공기관의 일은 대부분 ‘문서 위에서’ 움직인다
공공기관의 업무를 자세히 들여다보면, 시스템보다 문서가 훨씬 더 큰 영향력을 가진다는 사실을 알 수 있다. 정책 검토는 보고서로 시작되고, 회의는 회의자료와 회의록으로 남으며, 행정 판단의 근거는 언제나 문서로 축적된다. 즉 공공기관의 업무 흐름은 사람이 아니라 문서가 이어주는 구조에 가깝다.
문제는 이 문서들이 대부분 사람을 기준으로 만들어졌다는 점이다. HWP와 PDF는 읽기에는 편하지만, 컴퓨터가 이해하기에는 구조 정보가 거의 없는 상태다. 제목과 본문, 표와 설명, 문단 간 위계는 화면에서는 보이지만 데이터로는 사라진다. 그래서 공공기관 내부에서는 이미 존재하는 자료임에도 불구하고 “다시 찾아 읽고, 다시 정리하고, 다시 작성하는” 일이 반복된다. 문서가 쌓일수록 행정은 빨라지지 않고 오히려 느려진다.
생성형 AI를 도입하려 했지만, 현실은 달랐다
이런 문제를 해결하기 위해 공공 부문에서도 생성형 AI 도입이 빠르게 추진됐다. 질문하면 답해주는 AI, 문서를 요약해주는 서비스, 내부 자료 검색 챗봇까지 다양한 시도가 이어졌다. 하지만 실제 현장 반응은 기대만큼 뜨겁지 않았다.
이유는 단순하다. AI에게 전달되는 문서가 ‘이해 가능한 형태’가 아니었기 때문이다. 이해 가능한 형태가 아니었기에 적절히 문서를 학습하지 못한 것. 생성형 AI는 똑똑해 보이지만, 정리되지 않은 문서 더미 앞에서는 아무것도 하지 못한다. 표가 깨진 텍스트, 문단 순서가 뒤섞인 데이터는 AI에게도 혼란을 준다. 결국 문제는 AI 성능이 아니라, AI가 읽어야 할 문서의 상태에 있었다.
OCR 다음 단계가 필요해진 이유
OCR은 ‘글자를 옮겨 적는 기술’에 가까웠다
OCR을 쉽게 비유하면, 사람이 보고 타이핑하던 일을 자동으로 대신해주는 기술이다. 종이에 적힌 글자를 컴퓨터가 읽을 수 있는 텍스트로 바꿔주는 것만으로도 분명 큰 발전이었다. 수작업 입력이 줄고, 검색이 가능해졌기 때문이다.
하지만 OCR의 결과물은 어디까지나 글자 목록에 가깝다. 표 안의 숫자가 무엇을 의미하는지, 제목과 본문이 어떤 관계인지, 문단이 왜 이 순서로 배치됐는지는 알려주지 않는다. 그래서 OCR만 적용된 문서는 사람이 다시 읽어야만 의미를 파악할 수 있고, AI는 여전히 “눈은 있지만 이해는 못하는” 상태에 머문다.
→ OCR이란? PDF OCR 프로그램부터 딥러닝까지, 강력해진 문자인식 기술
문서를 이해한다는 것은 무엇이 다른가
사람이 문서를 읽을 때를 떠올리면 차이가 명확해진다. 우리는 문서를 볼 때 제목을 먼저 보고, 표를 하나의 덩어리로 인식하며, 문단 간 흐름을 자연스럽게 따라간다. 즉 글자를 읽는 동시에 구조와 맥락을 함께 이해한다.
문서 이해(Parsing)란 바로 이 과정을 AI에게 가능하게 만드는 것이다. 표는 표로, 문단은 문단으로, 제목은 제목으로 인식돼야 이후 요약이나 검색, 질의응답이 제대로 작동한다. 이 단계가 빠지면 AI는 아무리 뛰어난 모델이라도 피상적인 답변만 반복하게 된다.
문서를 ‘사진과 언어’로 함께 보는 VLM 방식
이 문제를 해결하기 위해 주목받는 방식이 VLM(Vision Language Model)이다. VLM은 문서를 단순한 텍스트 파일이 아니라, 이미지와 언어를 동시에 가진 대상으로 인식한다. 쉽게 말해 문서를 사진처럼 보면서 동시에 내용을 읽는 방식이다.
이 접근법은 공공 행정 문서에 특히 잘 맞는다. 양식이 제각각이고, 표와 설명이 복잡하게 얽혀 있는 문서도 사람처럼 전체를 한 번에 바라보며 구조를 파악할 수 있기 때문이다. OCR이 문서를 ‘쪼개는 기술’이었다면, VLM은 문서를 ‘이해하는 기술’에 가깝다.
경기도청 생성형 AI 플랫폼의 기술적 선택
전국 최초 광역지자체 생성형 AI 사례의 출발점
경기도청은 2025년 생성형 AI 플랫폼 구축사업을 통해 총 131억 원 규모의 프로젝트를 추진했다. 이는 단순한 시범 사업이 아니라, 광역지자체 행정 전반에 생성형 AI를 실제 업무 도구로 적용하려는 전국 최초의 시도였다.
이 프로젝트에서 가장 먼저 제기된 질문은 “어떤 AI 모델을 쓸 것인가”가 아니었다. “AI가 실제로 일을 하게 하려면 무엇부터 바꿔야 하는가”가 핵심이었다. 그 답은 의외로 시스템이 아니라 문서였다.
문서의 90%를 차지하던 HWP와 PDF 문제
경기도청 내부 문서의 90% 이상은 HWP와 PDF 형태로 존재한다. 이는 대부분의 공공기관이 공통으로 겪는 현실이다. 문제는 이 문서들이 AI에게는 거의 ‘닫힌 상자’에 가깝다는 점이다. 열어볼 수는 있지만, 안에 무엇이 어떻게 들어 있는지는 알기 어렵다.
이 상태에서는 아무리 뛰어난 생성형 AI를 도입해도 활용 범위가 제한적일 수밖에 없다. 그래서 경기도청의 생성형 AI 플랫폼은 문서 구조를 먼저 해결하는 방향으로 설계됐다.
DEEP Parser는 문서를 어떻게 다르게 다루는가
문서를 ‘글자’가 아니라 ‘구조’로 본다
DEEP Parser의 핵심은 문서를 글자 단위로 분해하지 않는다는 점이다. 대신 문서를 의미 단위로 해체한 뒤 다시 조립한다. 표는 하나의 표로, 병합된 셀은 연결된 정보로, 문단은 계층 구조를 유지한 채 인식한다.
이렇게 구조가 살아 있는 데이터는 AI가 바로 활용할 수 있다. 문서 요약 시에도 중요한 문단을 중심으로 정리할 수 있고, 정책 비교 시에도 맥락을 유지한 분석이 가능해진다.
AI 에이전트가 바로 활용할 수 있는 이유
생성형 AI가 제대로 작동하려면 질문에 대한 답을 찾을 수 있는 정돈된 지식 공간이 필요하다. DEEP Parser가 만든 구조화 문서 데이터는 바로 이 역할을 한다. 단순 검색이 아니라, 질문의 의도를 이해하고 관련 문서를 연결해 답변할 수 있는 기반이 된다.
그래서 DEEP Parser는 단독 솔루션이 아니라, 생성형 AI 플랫폼의 핵심 인프라에 가깝다. 문서가 구조화되지 않으면 AI 에이전트도 존재할 수 없기 때문이다.
수치로 확인된 신뢰성의 의미
DEEP Parser는 자체 테스트 기준으로 문서 항목 인식 정확도 97.3%, 데이터 추출 정확도 96%를 기록했다. 이 숫자는 단순한 기술 홍보용 지표가 아니다. 공공기관처럼 오류 허용 범위가 매우 낮은 환경에서는, 이 정도의 정확도가 되어야 실제 업무 적용이 가능하다.
문서가 바뀌면 행정은 어떻게 달라지는가
Alt text: AI 기반 행정 자동화와 공공 서비스 혁신을 표현한 이미지
공무원의 역할이 ‘정리’에서 ‘판단’으로 이동한다
문서 구조화가 이루어지면 공무원의 하루는 크게 달라진다. 자료를 찾고 정리하는 데 쓰이던 시간이 줄어들고, 정책 판단과 의사결정에 더 많은 시간을 쓸 수 있다. AI는 반복 업무를 처리하고, 사람은 판단에 집중하는 구조가 만들어진다.
검색이 아닌 ‘질의응답’ 행정으로의 전환
기존에는 문서를 찾기 위해 키워드를 검색해야 했다. 구조화된 문서 데이터 위에서는 질문 자체가 검색이 된다. “이 정책과 유사한 사례는?” 같은 질문에 AI가 관련 문서를 엮어 답변하는 방식이다. 이는 행정 업무의 속도와 질을 동시에 바꾼다.
공공 문서가 지식 자산이 되는 순간
이 변화의 본질은 효율화가 아니다. 공공 문서가 단순 보관 대상이 아니라, 지속적으로 활용 가능한 지식 자산으로 전환된다는 점이다. 이는 향후 정책 분석, 시민 서비스 개선, AI 기반 행정 혁신의 출발점이 된다.
이 사례가 다른 공공기관에 중요한 이유
왜 ‘전국 최초 광역지자체 사례’인가
경기도청 사례는 단일 기관의 성공을 넘어, 이후 도입 기관들이 참고할 수 있는 기준 모델을 제시했다는 점에서 의미가 크다. 무엇부터 시작해야 하는지, 어떤 기술이 필요한지에 대한 답을 제공한다.
다른 기관에도 그대로 적용 가능한 구조
DEEP Parser는 특정 양식에 의존하지 않기 때문에 중앙부처, 기초지자체, 공공기관 전반으로 확장 적용이 가능하다. 이는 공공 부문 생성형 AI 확산의 현실적인 조건을 충족한다.
정리하며: 생성형 AI의 성패는 결국 문서다
AI 모델보다 먼저 설계해야 할 것
생성형 AI 도입에서 가장 먼저 설계해야 할 대상은 모델이 아니라 문서다. 문서가 이해되지 않으면 AI도 일하지 못한다.
경기도청 사례가 보여준 분명한 메시지
한국딥러닝의 DEEP Parser와 경기도청 사례는 하나의 사실을 분명히 보여준다.
생성형 AI는 ‘이해 가능한 문서’ 위에서만 비로소 제대로 작동한다.