utilbox
이미지

이미지 텍스트 추출 (OCR)

사진·스크린샷에서 글자를 추출합니다. 한국어·영어 동시 인식, 회원가입 없이 브라우저에서 100% 처리됩니다.

파일은 서버로 업로드되지 않습니다

모든 처리는 브라우저 안에서만 진행됩니다.

이미지를 드래그하거나 클릭해서 업로드

JPG, PNG, WebP — 깨끗한 인쇄물·스크린샷 권장

사용 방법

  1. 글자를 추출하고 싶은 이미지를 드래그하거나 클릭해 업로드합니다.
  2. 인식할 언어를 선택합니다 — 한국어+영어, 한국어만, 영어만 중 택일.
  3. 처음 실행 시 언어 학습 데이터(한국어 ~10MB)를 브라우저가 자동으로 받습니다.
  4. 인식이 끝나면 신뢰도와 함께 결과 텍스트가 표시됩니다. 복사하거나 .txt 파일로 저장하세요.

팁: 인쇄물·PPT 슬라이드·웹 스크린샷처럼 글자가 또렷한 이미지일수록 정확도가 높습니다. 손글씨·기울어진 문서는 정확도가 떨어집니다.

이 도구로 한 번에 끝내는 작업

이미지 텍스트 추출 (OCR)를 다른 도구와 연결해 한 흐름으로 처리해 보세요.

관련 툴

이미지 텍스트 추출 (OCR) 자세히 알아보기

이미지 텍스트 추출(OCR, Optical Character Recognition)은 사진·스크린샷·스캔 이미지에 찍힌 글자를 컴퓨터가 읽을 수 있는 텍스트로 변환하는 기술입니다. 이 도구는 오픈소스 OCR 엔진인 Tesseract.js(WebAssembly 빌드)를 브라우저에서 직접 구동하며, 한국어와 영어를 동시에 인식할 수 있도록 ‘kor+eng’ 언어팩을 사용합니다. 이미지가 서버로 업로드되지 않으므로 사내 문서·계약서·영수증처럼 외부에 노출하면 안 되는 자료도 안전하게 다룰 수 있습니다.

더 알아보기

깨끗하게 인쇄된 문서나 스크린샷에서는 한국어 인식률이 80~95% 수준으로 나오는 반면, 손글씨·심하게 기울어진 문서·저해상도 사진·곡면 위 글자(예: 캔)는 정확도가 크게 떨어집니다. 인식률이 낮을 때는 ‘처리 설정’에서 정확함(best) 모델, 자동 보정(Otsu 이진화), 2x 업스케일, 텍스트 구조 PSM 모드를 켜고 다시 인식해 정확도를 추가로 끌어올릴 수 있습니다. 처음 한 번은 한국어 학습 데이터(약 10MB, 정확함 모델은 약 40MB)를 다운로드해야 하며 이후엔 브라우저 캐시로 즉시 실행됩니다.

이럴 때 사용하세요

  • 책·잡지 페이지를 사진 찍어 문장을 인용·발췌하고 싶을 때
  • PPT 슬라이드 캡처에서 본문 텍스트를 추출해 검색·번역에 활용할 때
  • 영수증·세금계산서 사진에서 품목·금액 글자를 옮겨 적기 귀찮을 때
  • 명함 사진에서 이름·연락처를 한 번에 텍스트로 변환할 때
  • 강의 자료 스크린샷이나 자막이 박힌 이미지에서 글자를 그대로 가져올 때

이미지 텍스트 추출 (OCR) 자주 묻는 질문

한국어 인식률은 어느 정도인가요?
또렷한 인쇄물·디지털 스크린샷에서는 80~95% 정도 정확도가 나옵니다. 폰트가 작거나(글자 높이 16px 미만) 명조체·궁서체 같은 장식 글꼴, 배경 노이즈가 많은 사진은 정확도가 더 낮아집니다. 한 번에 완벽하지 않으면 손으로 조금 다듬어 쓰는 것을 권합니다.
손글씨도 인식되나요?
Tesseract.js 기본 학습 데이터는 인쇄체 위주라 손글씨 인식률은 매우 낮습니다(20~40% 수준). 특히 한국어 손글씨는 거의 인식하지 못합니다. 손글씨가 주 대상이라면 별도의 손글씨 전용 OCR 서비스(클라우드 기반)를 사용하는 것이 정확합니다.
인식률이 낮을 때 어떻게 해야 하나요?
‘처리 설정’ 패널을 열어 다음 순서로 시도해보세요. ① 자동 보정 켜기(이미 기본 ON) — 흑백 + Otsu 이진화로 배경 노이즈를 잘라냅니다. ② 글씨가 작으면 2x 업스케일 켜기. ③ 사진이 어둡거나 흐릴 때 대비 강화 켜기. ④ 영수증·라벨처럼 한 줄짜리면 텍스트 구조를 ‘한 줄’로, 명함·다이어그램이면 ‘흩어진 텍스트’로 변경. ⑤ 그래도 부족하면 모델을 ‘정확함(best, 40MB)’으로 바꿔 다시 인식하세요. 처리 시간은 늘지만 한국어 정확도가 눈에 띄게 올라갑니다.
인터넷 연결이 필요한가요?
처음 한 번 언어 데이터를 받을 때만 인터넷이 필요합니다. 이후엔 오프라인에서도 동작합니다. 이미지 자체는 절대 서버에 업로드되지 않고 브라우저 내부에서만 처리되므로 민감한 문서를 다뤄도 안전합니다.
내 이미지가 외부 서버로 업로드되나요?
아니요. 이 도구는 WebAssembly로 컴파일된 OCR 엔진을 브라우저 안에서 직접 구동합니다. 이미지 데이터는 페이지를 벗어나지 않으며, 서버에 저장되거나 전송되지 않습니다. 결과를 .txt 파일로 저장하거나 클립보드에 복사하는 것도 모두 브라우저 안에서 일어납니다.