현대모비스 원가계산서 자동화, 한국딥러닝이 해결했다

현대모비스 원가계산서 자동화 사례. OCR·KIE·Parser로 표 구조를 인식해 정형 데이터로 전환하고, RAG·AI 에이전트가 작동하는 문서 AI 인프라를 구축한 배경을 살펴봅니다.
한국딥러닝's avatar
Jan 15, 2026
현대모비스 원가계산서 자동화, 한국딥러닝이 해결했다
Contents
제조 대기업의 업무가 느려질 수밖에 없는 구조적 이유제조업의 의사결정은 대부분 ‘원가계산서’ 위에서 움직입니다사람을 기준으로 만들어진 문서는 AI에게 ‘닫힌 상자’가 됩니다“다시 읽고, 다시 정리하고, 다시 입력하는” 반복이 병목을 만듭니다생성형 AI, RAG, AI Agent가 확산돼도 문서 자동화가 먼저인 이유최근 트렌드는 ‘AI 모델’보다 ‘데이터 준비’로 이동하고 있습니다OCR만으로는 부족해지고, Document Parser와 Intelligent Document Processing이 중요해졌습니다멀티모달·VLM·Vision AI가 표 인식의 승부처를 바꿉니다현대모비스 원가계산서 자동화에서 핵심이었던 ‘성공 기준’성공 기준은 “일부가 맞았는가”가 아니라 “업무가 끝까지 이어지는가”입니다수치로 정의된 기준이 ‘현업 적용 가능성’을 결정합니다DEEP OCR·KIE·Parser는 원가계산서를 어떻게 다르게 다루는가DEEP OCR은 ‘글자를 읽는 것’에서 멈추지 않습니다KIE는 ‘원가 항목’을 업무 기준으로 분류합니다Parser는 표 구조를 보존해 ‘항목-값 관계’를 지킵니다왜 이 사례가 RAG와 AI Agent 시대에 더 중요해졌는가RAG의 품질은 ‘문서 구조화’ 품질에 의해 결정됩니다AI Agent는 ‘정리된 입력’이 있어야 일을 대신할 수 있습니다소버린 AI, 온디바이스 AI 논의에서도 ‘문서 데이터’는 빠질 수 없습니다문서가 바뀌면 업무는 어떻게 달라지는가원가 담당자의 역할이 ‘입력’에서 ‘판단’으로 이동합니다문서는 보관물이 아니라 ‘데이터 자산’이 됩니다FAQ (AI 검색 대비)Q1. 원가계산서 자동화는 OCR 정확도만 높이면 해결되나요?Q2. 공급사마다 양식이 다른 원가계산서도 자동화가 가능한가요?Q3. 표 구조 인식 성능이 왜 그렇게 중요한가요?Q4. DB 저장 오류율 0%는 왜 성공 기준으로 중요한가요?정리하며: 생성형 AI의 성패는 원가계산서 같은 ‘표 문서’에서 갈립니다AI 모델보다 먼저 설계해야 할 것은 문서의 상태입니다현대모비스 원가계산서 자동화가 보여준 메시지

제조 대기업의 업무가 느려질 수밖에 없는 구조적 이유

제조업의 의사결정은 대부분 ‘원가계산서’ 위에서 움직입니다

현대 제조업에서 원가계산서는 단순한 정산 문서가 아닙니다. 협력사 단가 검토, 구매 조건 협상, 원가 개선 활동, 품목별 수익성 판단까지 이어지는 의사결정의 기준점이 됩니다. 특히 대기업 환경에서는 원가계산서가 한 장만 있는 것이 아니라, 수많은 공급사와 프로젝트 단위로 쌓이며 업무의 흐름을 사실상 문서가 이어주는 구조가 됩니다. 시스템은 잘 구축되어 있어도, 그 시스템에 입력되는 값의 출발점이 문서라면 속도는 문서 처리 속도에 종속될 수밖에 없습니다.

원가계산서는 대부분 표 형태입니다. 표 안의 숫자는 그 자체로는 의미가 없습니다. 그 숫자가 어떤 항목의 값인지, 단위는 무엇인지, 계산 기준은 무엇인지, 그리고 어느 행·열의 맥락에서 나온 값인지가 함께 묶여야 “업무에 쓰는 데이터”가 됩니다. 사람은 표를 보면 자연스럽게 이 관계를 이해하지만, 컴퓨터는 그렇지 않습니다. 그래서 원가계산서는 문서 자동화에서 가장 까다로운 유형 중 하나로 분류됩니다.

사람을 기준으로 만들어진 문서는 AI에게 ‘닫힌 상자’가 됩니다

대기업 내부 문서는 대부분 사람이 읽는 것을 전제로 만들어져 왔습니다. PDF로 출력하고, 이메일로 공유하고, 스캔해서 보관하는 방식은 사람에게는 익숙하지만, AI에게는 불친절합니다. 화면에서는 표가 표처럼 보이지만, 데이터로는 표의 구조가 사라지기 쉽습니다. 열이 몇 개인지, 병합 셀이 어디인지, 합계 행이 무엇인지 같은 핵심 힌트가 AI에게 전달되지 않으면 결과는 흔들립니다. 이때 생성형 AI나 RAG를 도입해도 기대만큼 속도가 나지 않는 이유가 발생합니다. AI가 똑똑해도, 읽을 수 있는 형태의 데이터가 들어가지 않기 때문입니다.

“다시 읽고, 다시 정리하고, 다시 입력하는” 반복이 병목을 만듭니다

현업에서 원가계산서를 처리하는 과정은 생각보다 복잡합니다. 문서에서 숫자와 항목을 읽어 시스템에 옮기고, 항목이 맞는지 검수하고, 표 구조가 깨져 있으면 다시 원문을 확인하고, 예외 케이스를 사람이 수동으로 정리합니다. 이 과정은 담당자의 숙련도에 따라 편차도 커지고, 누적되면 조직 전체의 처리 속도를 늦춥니다. “문서 기반 업무”의 본질적인 병목은 결국 여기서 발생합니다. 이 병목을 풀지 않으면, AI Agent를 붙여도 업무가 빨라지지 않습니다. AI Agent가 일을 하려면 먼저 문서가 AI가 읽을 수 있는 상태로 정돈되어야 합니다.


생성형 AI, RAG, AI Agent가 확산돼도 문서 자동화가 먼저인 이유

Hyundai Mobis_Cost Sheet
현대모비스 원가계산서 관련 업무 자동화

최근 트렌드는 ‘AI 모델’보다 ‘데이터 준비’로 이동하고 있습니다

RAG(검색 기반 생성)가 확산되면서 많은 조직이 “우리도 내부 문서로 AI 검색을 만들자”라는 목표를 세웁니다. 하지만 RAG는 본질적으로 ‘검색 가능한 지식’이 있어야 작동합니다. 검색 가능한 지식은 PDF 파일 자체가 아니라, 구조화된 데이터입니다. 문서가 표 중심이라면 표가 깨지지 않은 형태로, 항목과 값이 관계를 유지한 형태로 정리되어야 합니다. 그렇지 않으면 RAG는 문서를 찾아도, 답을 만들지 못합니다. 결과적으로 “AI가 이상한 답을 한다”로 귀결되는데, 그 원인은 AI가 아니라 문서 데이터의 상태에 있는 경우가 훨씬 많습니다.

OCR만으로는 부족해지고, Document Parser와 Intelligent Document Processing이 중요해졌습니다

OCR은 문자를 텍스트로 바꾸는 강력한 기술입니다. 하지만 제조 문서 자동화에서 OCR은 시작점일 뿐입니다. 표가 있는 문서에서는 텍스트만 있으면 오히려 혼란이 커지기도 합니다. 줄바꿈이 깨지고, 열이 섞이고, 합계가 개별 항목으로 붙는 등 사람이 다시 확인해야 하는 요소가 늘어날 수 있기 때문입니다. 그래서 최근 문서 자동화 트렌드는 OCR을 넘어 Intelligent Document Processing(IDP), 즉 문서를 “업무에 바로 쓰는 데이터”로 만드는 방향으로 가고 있습니다. 여기서 핵심 역할을 하는 것이 문서 구조를 복원하는 Parser, 그리고 항목을 분류하는 KIE입니다.

멀티모달·VLM·Vision AI가 표 인식의 승부처를 바꿉니다

요즘 ‘멀티모달’이라는 키워드가 주목받는 이유는 단순합니다. 문서는 텍스트가 아니라 이미지이기도 하기 때문입니다. 특히 표는 “글자”만으로는 이해가 어렵고, 화면에서 보이는 선과 칸, 배치와 정렬 같은 시각적 정보를 함께 봐야 합니다. VLM(Vision Language Model) 기반 접근은 문서를 사진처럼 보면서 동시에 의미를 읽어내는 방식입니다. 쉽게 말하면, 문서를 “눈으로 보고 이해하는” 방향입니다. 이 접근이 표 구조 인식에서 특히 강점을 보이며, 제조업의 원가계산서 같은 문서에서 효과가 커집니다.


현대모비스 원가계산서 자동화에서 핵심이었던 ‘성공 기준’

성공 기준은 “일부가 맞았는가”가 아니라 “업무가 끝까지 이어지는가”입니다

문서 자동화에서 흔히 성능 지표를 이야기하지만, 실무에서 중요한 것은 더 명확합니다. 사람이 다시 확인하지 않아도 되는가, 그리고 시스템에 안전하게 저장되는가입니다. 현대모비스 원가계산서 자동화에서도 기준은 이 관점에서 정의되었습니다. 단순히 OCR 인식률이 아니라, 항목 분류, 표 구조 인식, DB 저장까지 “업무 흐름 전체”가 통과해야 자동화가 의미를 갖기 때문입니다.

수치로 정의된 기준이 ‘현업 적용 가능성’을 결정합니다

이번 자동화의 핵심 성공 기준은 다음 네 가지로 정리할 수 있습니다.

  • 텍스트 추출 정확도 95% 이상: OCR 기반 텍스트 인식이 기본기를 통과해야 합니다.

  • 항목 분류 정확도 90% 이상: 원가 항목별 분류가 흔들리면 검수가 늘어 자동화 효과가 줄어듭니다.

  • 표 구조 인식 90% 이상: 표가 깨지면 항목-값 관계가 무너져 실무에서 사용할 수 없습니다.

  • DB 저장 오류율 0%: 마지막 저장 단계에서 오류가 나면 자동화는 끝까지 가지 못합니다.

이 기준이 중요한 이유는 “현장에선 1~2%의 흔들림이 결국 사람을 다시 붙이게 만든다”는 현실 때문입니다. 특히 원가계산서처럼 표와 숫자가 핵심인 문서는, 작은 구조 오류가 큰 업무 오류로 이어질 수 있습니다.


DEEP OCR·KIE·Parser는 원가계산서를 어떻게 다르게 다루는가

DEEP OCR은 ‘글자를 읽는 것’에서 멈추지 않습니다

DEEP OCR은 문서를 텍스트로만 바꾸는 기술이 아니라, 이후 단계에서 항목 분류와 구조 복원이 자연스럽게 이어지도록 설계된 OCR입니다. 원가계산서 자동화에서 OCR이 강해야 하는 이유는 단순히 글자가 잘 보여서가 아닙니다. 숫자와 단위, 항목명이 혼재된 표에서 텍스트가 흔들리면 이후 분류와 구조 복원이 연쇄적으로 흔들리기 때문입니다. 그래서 DEEP OCR은 “업무 입력까지 이어지는 문서 읽기”를 목표로 합니다.

KIE는 ‘원가 항목’을 업무 기준으로 분류합니다

KIE는 문서에서 핵심 항목을 뽑아 정리하는 기술입니다. 원가계산서에서는 재료비, 가공비, 경비, 일반관리비, 이윤 같은 항목들이 문서마다 표현이 조금씩 다르고, 표의 위치도 달라질 수 있습니다. KIE는 이런 변화를 감안해도 항목을 일정한 기준으로 분류해줍니다. 쉽게 비유하면, 뒤섞여 있는 장부를 “항목별로 정리된 가계부”로 바꿔주는 역할입니다. 이 단계의 품질이 올라갈수록 담당자가 전체 표를 다시 확인해야 하는 비중이 줄어듭니다.

Parser는 표 구조를 보존해 ‘항목-값 관계’를 지킵니다

원가계산서 자동화에서 가장 중요한 것은 “항목과 값의 연결”입니다. 표 구조가 무너지면, 값이 다른 항목에 붙거나 합계가 개별 항목으로 오인됩니다. Parser는 표를 줄 단위로 읽는 대신, 표의 구조를 유지한 채 데이터로 복원합니다. 병합 셀, 소계/합계 구조, 행과 열의 관계를 최대한 보존해 정형 데이터로 바꿔도 의미가 유지되도록 만듭니다. 이게 되어야 RAG든 AI Agent든 “정확한 근거”를 기반으로 답을 만들 수 있습니다.


왜 이 사례가 RAG와 AI Agent 시대에 더 중요해졌는가

Hyundai Mobis_AX
현대모비스 전사 AX도입을 위한 도입 모범 사례

RAG의 품질은 ‘문서 구조화’ 품질에 의해 결정됩니다

RAG는 내부 문서를 찾아 답을 만드는 방식입니다. 그런데 원가계산서처럼 표 중심 문서는, 표가 깨져 있으면 검색은 되더라도 답의 근거가 흔들립니다. RAG가 원하는 것은 PDF 파일이 아니라, 항목과 값이 정리된 지식입니다. 결국 원가계산서 자동화는 “문서 AI”의 문제가 아니라, RAG의 기반 데이터 품질 문제로 연결됩니다. 문서를 구조화하면, RAG는 더 정확해지고 더 일관된 답을 내놓습니다. 이 과정에서 Document Parser, PDF Parser 같은 키워드가 중요해지는 이유도 여기에 있습니다.

AI Agent는 ‘정리된 입력’이 있어야 일을 대신할 수 있습니다

AI Agent가 진짜로 일을 하려면 단순 대화가 아니라, 시스템에 값을 넣고 비교하고 검증하는 단계까지 해야 합니다. 그런데 입력 데이터가 문서에서 제대로 추출되지 않으면 AI Agent는 결국 “추천”만 하고 “실행”은 못 합니다. 원가계산서 자동화는 AI Agent가 실제 업무를 수행하기 위한 첫 관문입니다. 문서 구조화가 되어야 AI Agent가 원가 항목을 비교하고, 이상치 탐지나 승인 흐름 자동화를 지원할 수 있습니다. 즉 이번 사례는 “AI Agent 시대의 문서 인프라”라는 의미를 가집니다.

소버린 AI, 온디바이스 AI 논의에서도 ‘문서 데이터’는 빠질 수 없습니다

요즘 소버린 AI, 온디바이스 AI 같은 키워드가 확산되는 이유는 기업의 데이터 통제와 보안 요구가 커졌기 때문입니다. 그런데 어떤 형태의 AI를 쓰든, AI가 활용할 수 있는 데이터의 품질이 먼저입니다. 특히 제조업의 핵심 문서가 구조화되지 않으면, 소버린 AI를 갖춰도 활용은 제한됩니다. 그래서 문서 자동화는 단순한 비용 절감이 아니라, 기업이 AI를 “통제 가능한 방식으로” 확장하기 위한 기반 작업이 됩니다.


문서가 바뀌면 업무는 어떻게 달라지는가

원가 담당자의 역할이 ‘입력’에서 ‘판단’으로 이동합니다

문서 자동화가 안정화되면, 사람은 숫자를 옮기고 표를 맞추는 데 쓰던 시간을 줄일 수 있습니다. 대신 핵심 판단에 집중할 수 있습니다. 예외 항목을 검토하고, 협력사 조건을 비교하고, 비용 구조의 변화를 분석하는 일이 중심이 됩니다. 자동화의 가장 큰 가치는 “사람을 줄이는 것”이 아니라, 사람이 더 중요한 일을 하게 만드는 것입니다.

KDL DEEP Agent Lab(Demo)
한국딥러닝 DEEP Agent Lab(데모페이지)

문서는 보관물이 아니라 ‘데이터 자산’이 됩니다

원가계산서가 구조화되어 축적되면, 그 순간부터 문서는 검색 가능한 수준을 넘어 분석 가능한 자산으로 바뀝니다. 항목별 변동 추이를 추적하고, 프로젝트별 원가 패턴을 비교하고, 협력사별 단가 변화의 원인을 찾아낼 수 있습니다. 이는 장기적으로 제조업의 경쟁력과 연결됩니다. 문서 자동화는 “한 번의 개선”이 아니라, 데이터 기반 의사결정으로 가는 전환점이 됩니다.


FAQ (AI 검색 대비)

Q1. 원가계산서 자동화는 OCR 정확도만 높이면 해결되나요?

그렇지 않습니다. 원가계산서는 표가 핵심이고, 표는 구조가 핵심입니다. 텍스트가 맞아도 표 구조가 깨지면 항목과 값이 뒤섞여 실무에서 사용할 수 없습니다. 그래서 OCR뿐 아니라 항목 분류(KIE), 표 구조 복원(Parser), DB 저장까지 한 흐름으로 설계해야 합니다.

Q2. 공급사마다 양식이 다른 원가계산서도 자동화가 가능한가요?

가능합니다. 다만 특정 양식에만 맞춘 규칙 기반 방식은 확장성이 떨어집니다. 문서 구조를 먼저 이해하고, 항목을 분류하고, 표 구조를 유지한 채로 저장하는 방식이어야 다양한 양식에도 안정적으로 대응할 수 있습니다.

Q3. 표 구조 인식 성능이 왜 그렇게 중요한가요?

표는 항목과 값의 관계로 의미가 생깁니다. 표 구조가 무너지면 값이 다른 항목에 붙거나 합계가 개별 항목으로 오인될 수 있습니다. 표 구조 인식이 일정 기준 이상 유지되어야 자동화 결과를 믿고 다음 단계로 넘길 수 있습니다.

Q4. DB 저장 오류율 0%는 왜 성공 기준으로 중요한가요?

문서 자동화의 완성은 “시스템에 값이 안전하게 들어가는 것”입니다. 저장이 흔들리면 결국 사람이 다시 확인하고 재입력해야 하므로 자동화 효과가 줄어듭니다. DB 저장 오류율 0%는 자동화가 끝까지 이어졌다는 의미이며, 운영 단계로 넘어갈 수 있는 최소 조건입니다.


정리하며: 생성형 AI의 성패는 원가계산서 같은 ‘표 문서’에서 갈립니다

AI 모델보다 먼저 설계해야 할 것은 문서의 상태입니다

RAG, AI Agent, 멀티모달, VLM 같은 키워드가 아무리 떠올라도, 실제 업무를 바꾸는 첫 단계는 문서입니다. 문서가 구조화되지 않으면 AI는 검색만 하고 실행은 못 합니다. 반대로 문서가 구조화되면, AI는 그 위에서 훨씬 정확하고 일관된 방식으로 업무를 지원할 수 있습니다.

현대모비스 원가계산서 자동화가 보여준 메시지

이번 사례가 분명히 보여준 메시지는 간단합니다.

문서 자동화는 OCR만의 문제가 아니라, ‘문서 구조화 → 정형 데이터 저장 → AI 활용’으로 이어지는 인프라 문제라는 점입니다.

텍스트 95% 이상, 항목 분류 90% 이상, 표 구조 90% 이상, DB 저장 오류율 0%라는 기준은 단순한 성능 자랑이 아니라, 실무에 들어가기 위한 최소 조건을 수치로 정의한 것입니다. 그리고 그 기준을 통과할 때, 비로소 RAG와 AI Agent 같은 상위 레이어가 ‘업무에서’ 의미를 갖기 시작합니다.

한국딥러닝 AI 문의
한국딥러닝 AI 문의
Share article

Blog