이미지 텍스트 추출 (OCR)
사진·스크린샷에서 글자를 추출합니다. 한국어·영어 동시 인식, 회원가입 없이 브라우저에서 100% 처리됩니다.
파일은 서버로 업로드되지 않습니다
모든 처리는 브라우저 안에서만 진행됩니다.
이미지를 드래그하거나 클릭해서 업로드
JPG, PNG, WebP — 깨끗한 인쇄물·스크린샷 권장
사용 방법
- 글자를 추출하고 싶은 이미지를 드래그하거나 클릭해 업로드합니다.
- 인식할 언어를 선택합니다 — 한국어+영어, 한국어만, 영어만 중 택일.
- 처음 실행 시 언어 학습 데이터(한국어 ~10MB)를 브라우저가 자동으로 받습니다.
- 인식이 끝나면 신뢰도와 함께 결과 텍스트가 표시됩니다. 복사하거나 .txt 파일로 저장하세요.
팁: 인쇄물·PPT 슬라이드·웹 스크린샷처럼 글자가 또렷한 이미지일수록 정확도가 높습니다. 손글씨·기울어진 문서는 정확도가 떨어집니다.
이 도구로 한 번에 끝내는 작업
이미지 텍스트 추출 (OCR)를 다른 도구와 연결해 한 흐름으로 처리해 보세요.
이미지 텍스트 추출 (OCR) 자세히 알아보기
이미지 텍스트 추출(OCR, Optical Character Recognition)은 사진·스크린샷·스캔 이미지에 찍힌 글자를 컴퓨터가 읽을 수 있는 텍스트로 변환하는 기술입니다. 이 도구는 오픈소스 OCR 엔진인 Tesseract.js(WebAssembly 빌드)를 브라우저에서 직접 구동하며, 한국어와 영어를 동시에 인식할 수 있도록 ‘kor+eng’ 언어팩을 사용합니다. 이미지가 서버로 업로드되지 않으므로 사내 문서·계약서·영수증처럼 외부에 노출하면 안 되는 자료도 안전하게 다룰 수 있습니다.
더 알아보기접기
깨끗하게 인쇄된 문서나 스크린샷에서는 한국어 인식률이 80~95% 수준으로 나오는 반면, 손글씨·심하게 기울어진 문서·저해상도 사진·곡면 위 글자(예: 캔)는 정확도가 크게 떨어집니다. 인식률이 낮을 때는 ‘처리 설정’에서 정확함(best) 모델, 자동 보정(Otsu 이진화), 2x 업스케일, 텍스트 구조 PSM 모드를 켜고 다시 인식해 정확도를 추가로 끌어올릴 수 있습니다. 처음 한 번은 한국어 학습 데이터(약 10MB, 정확함 모델은 약 40MB)를 다운로드해야 하며 이후엔 브라우저 캐시로 즉시 실행됩니다.
이럴 때 사용하세요
- •책·잡지 페이지를 사진 찍어 문장을 인용·발췌하고 싶을 때
- •PPT 슬라이드 캡처에서 본문 텍스트를 추출해 검색·번역에 활용할 때
- •영수증·세금계산서 사진에서 품목·금액 글자를 옮겨 적기 귀찮을 때
- •명함 사진에서 이름·연락처를 한 번에 텍스트로 변환할 때
- •강의 자료 스크린샷이나 자막이 박힌 이미지에서 글자를 그대로 가져올 때