utilbox
개발자

텍스트 인코딩 감지기

파일을 업로드하면 BOM과 휴리스틱으로 인코딩을 자동 감지하고, 다른 인코딩으로 디코딩 미리보기를 제공합니다.

파일은 서버로 업로드되지 않습니다

모든 처리는 브라우저 안에서만 진행됩니다.

파일을 드래그하거나 클릭해서 선택하세요

텍스트 파일 (.txt, .csv, .log, .md, .json 등) · 최대 5MB

사용 방법

  1. 인코딩이 궁금한 텍스트 파일을 업로드합니다 (드래그 앤 드롭 가능).
  2. BOM(바이트 순서 표식)이 있으면 즉시 식별합니다 (UTF-8/UTF-16 등).
  3. BOM이 없으면 UTF-8 유효성 검사와 EUC-KR/CP949 패턴 휴리스틱으로 판별합니다.
  4. 오른쪽 드롭다운에서 다른 인코딩으로 디코딩 결과를 확인할 수 있습니다.
  5. 파일 처리는 모두 브라우저에서 이뤄지며 서버로 전송되지 않습니다.

자주 만나는 한글 인코딩

UTF-8

현대 표준. 한 글자가 3바이트(한글). 최근 거의 모든 환경의 기본값.

EUC-KR / CP949

윈도우 한글 메모장이 오래 쓰던 인코딩. 한 글자가 2바이트. CSV가 깨질 때 의심.

UTF-16

주로 윈도우 시스템 파일·Excel xml에서 등장. BOM이 거의 항상 붙어 있음.

관련 툴

텍스트 인코딩 감지기 자세히 알아보기

텍스트 인코딩 감지기는 글자가 깨져 보이는 텍스트 파일이나 문자열의 인코딩(UTF-8, EUC-KR/CP949, UTF-16 등)을 자동으로 감지하고, 각 후보 인코딩으로 디코딩한 결과를 미리보기로 보여주는 도구입니다. BOM(Byte Order Mark) 유무도 함께 확인할 수 있어 인코딩 문제 디버깅에 유용합니다.

더 알아보기

레거시 시스템에서 받은 CSV가 한글이 ㄱㅏ로 깨졌을 때, 한글 파일이 갑자기 ?? ?? 로 보일 때, 메일·로그 파일에서 받은 텍스트가 이상할 때 가장 먼저 시도해볼 수 있는 도구입니다. 정리 작업은 텍스트 정리 도구, 차이 비교는 텍스트 비교기를 이용하세요.

이럴 때 사용하세요

  • 엑셀에서 한글이 깨진 CSV 파일의 원본 인코딩 확인
  • 오래된 시스템에서 받은 EUC-KR/CP949 텍스트 정상 표시
  • UTF-8 BOM 유무 확인 (BOM이 빌드 오류를 일으킬 때)
  • 이메일·로그 파일의 인코딩 진단
  • 다국어 데이터 처리 전 인코딩 정규화

텍스트 인코딩 감지기 자주 묻는 질문

한국어는 어떤 인코딩이 가장 흔한가요?
최근에는 UTF-8이 표준입니다. 다만 윈도우 기본 메모장으로 저장한 옛날 한글 파일이나 일부 ERP·DB 출력은 EUC-KR(CP949)인 경우가 많습니다.
BOM은 무엇인가요?
파일 맨 앞에 붙는 인코딩 식별 바이트입니다. UTF-8 BOM(EF BB BF)은 일부 환경(셸 스크립트, JSON 파서)에서 오류의 원인이 될 수 있어 제거가 필요할 때가 있습니다.
감지가 100% 정확한가요?
짧은 텍스트나 영문만 있는 경우 여러 인코딩이 동시에 유효해 정확한 감지가 어려울 수 있습니다. 미리보기를 함께 비교해 가장 자연스러운 결과를 선택하세요.
파일이 외부로 전송되나요?
아니요. 모든 분석은 브라우저 안에서 처리되며 파일이 외부 서버로 전송되지 않습니다.
감지 후 인코딩 변환도 가능한가요?
본 도구는 감지·미리보기 중심입니다. 변환 결과를 복사해 텍스트로 저장하면 그것이 곧 UTF-8 텍스트가 됩니다.