AI OCR

인쇄·스캔 문서를 서비스에서 바로 활용할 수 있는 결과물로 변환합니다. 멀티모달 AI 인식, Human-in-the-loop 검수, 자동 전송 — 하나의 운영 가능한 워크플로우를 제공합니다.

Multimodal AIHuman-in-the-LoopLayout-aware

Beyond Recognition Accuracy

잘 인식되는 것보다, 잘 쓰이는 것이 본질입니다.

모델 정확도 90%, 95% 같은 숫자만으로는 비즈니스 가치가 만들어지지 않습니다. 검색이든 RAG든 출판이든, 사용자가 실제로 받는 결과물의 품질이 본질입니다.

그래서 우리는 모델 자체보다 모델 위의 워크플로우를 책임집니다. 자동화할 수 있는 영역과 사람이 검수해야 하는 영역을 명확히 나누고, 두 흐름을 매끄럽게 잇습니다.

정제된 텍스트, 정리된 삽화 자산, 구조화된 메타데이터를 정확하고 빠르게 제공합니다. 검색·RAG·출판 — 어떤 형태로든 추출한 데이터를 바로 제공할 수 있습니다.

OCR 인식률만으로는 비즈니스가 작동하지 않습니다. 모델 위의 워크플로우, 그리고 결과물 — 거기까지가 우리가 책임지는 일입니다.

— CEO & Chief Architect, RightStack

결과물 품질을 결정하는 핵심 기능

구조적 레이아웃 인식

각주, 한자 루비, 제목, 페이지 번호 등 문서 특유의 구조를 통째로 인식합니다. 본문과 부속 요소가 의미 단위로 분리되어 정확한 위치에서 추출됩니다.

삽화 영역 검출·추출

본문 내 삽화 영역을 검출해 별도 자산으로 추출합니다. 텍스트와 이미지가 깔끔하게 분리된 디지털 자산으로 만들어집니다.

Human-in-the-Loop 검수

자동 인식 결과를 사람이 검토·수정하는 워크플로우와 함께 제공합니다. 자동화 효율과 결과 품질을 동시에 확보합니다.

부분 재인식

검수 단계에서 잘못 인식된 영역만 선별적으로 다시 처리합니다. 사람의 피드백을 그대로 반영해 더 정확한 결과를 얻고, 전체 재실행 없이 비용을 줄입니다.

이벤트 웹훅

처리 완료·검수 진입·실패 같은 주요 이벤트를 웹훅으로 발송합니다. 다운스트림 파이프라인(검색, RAG, 사내 시스템 등)과 폴링 없이 비동기로 매끄럽게 연결됩니다.

스토리지 직접 전송

추출된 텍스트와 자산을 S3 호환 스토리지로 곧장 푸시합니다. 별도의 파일 이동 단계 없이 다운스트림 시스템이 결과를 그대로 읽어갈 수 있습니다.

사례 연구

아이세움 NEW 논술 명작 100 디지털 출판 자동화

Problem

아이세움 NEW 논술 명작 100 시리즈(하이디, 키다리아저씨 등)의 인쇄본을 디지털 출판물로 전환해야 했습니다. 총 40권의 도서, 도서당 100페이지 가량의 분량을 단기간에 탑재해야 했으며 도서 내의 제목, 소제목, 삽화 추출 등 다양한 형식을 그대로 유지하면서 전자책으로 옮겨야 했습니다.

Our Solution

멀티모달 AI 기반 OCR 파이프라인으로 각주, 한자 루비, 제목, 페이지, 삽화를 자동 인식·추출하고, 그 위에 Human-in-the-loop 검수 워크플로우를 얹었습니다. 검수 결과는 바로 최종 결과물에 반영될 수 있게 파이프라인을 구축했습니다. 결과적으로 디지털 탑재 속도가 30–40% 향상되었습니다.

Multimodal AIImage PreprocessingLayout DetectionRuby AnnotationHuman-in-the-LoopPostgreSQL Queue