OCR : AI가 글자를 인식하기 위한 노력

주의사항

  • 본 실습 프로젝트는 아래 가이드 숙지 후에 작업 가능합니다.

프로젝트 소개

상품 이미지를 보고, 문자를 기준(한글/영어/숫자)에 맞게 바운딩 후 내용을 입력(전사)하는 프로젝트입니다.

  1. 문자의 가장자리에 맞춰 바운딩해주세요.
  2. 대상의 내용을 입력(전사)해주세요.

이렇게 완성된 결과물은 문자 인식 소프트웨어 개발에 활용되고 있습니다.

작업 기준

1. [OCR 대상]

  • 한글: 이미지에서 확인할 수 있는 모든 한글이 OCR 대상입니다.
  • 영어: 이미지에서 확인할 수 있는 모든 알파벳이 OCR 대상입니다. (대문자/소문자)
  • 숫자: 이미지에서 확인할 수 있는 모든 아라비아 숫자가 OCR 대상입니다.

    속성이  섞여 있는 경우 각각 작업해 주세요. 문자 사이에 특수기호가 있는 경우도 특수기호 앞, 뒤로 나누어서 작업해야 합니다.

2. [OCR 단위]

  • 띄어쓰기(어절 단위) 또는 줄 바꿈에 따라 작업해야 합니다.
    띄어쓰기 간격이 애매하면 글자 사이가 균일한지 확인해주세요.

    띄어쓰기 기준으로 작업
    (검수 통과)
    띄어쓰기 무시하고 작업
    (작업 반려)

3. [반려 기준]

  • 문장 기호와 특수기호는 OCR 대상이 아닙니다. 문장 기호 또는 특수기호를 따로 작업하거나 한글/영어/숫자 등과 함께 작업한 경우 반려됩니다.
    등록상표기호 소괄호 쉼표 슬래시 앤드
    ® ( ) , / &
    온점 콜론 퍼센트 하이픈
    . : %
    느낌표 물음표 별표 작은따옴표 큰따옴표
    ! ? * ‘ ‘ ” “
    덧셈 기호 곱셈 기호 나눗셈기호 등호 아포스트로피
    + x ÷
  • 전사 내용 기재 시, 앞뒤 공백이 포함될 경우 반려될 수 있습니다.
  • 바운딩이 박스가 잘리거나 여백이 많은 경우 반려 대상입니다.

주의사항

1. [검수 통과]

띄어쓰기에 따라 작업 문자 사이 특수기호 제외 속성 분류
바운딩 박스여백 없이 정확히 작업 바운딩 대상이 아닌 것을 작업하지 않음

2. [작업 반려]

띄어쓰기 무시 특수기호 전사 속성 섞임 (숫자+영어)

 

바운딩 박스 여백이 넓음 바운딩 박스 잘림

작업 예시

  • 초록색 박스는 작업 예시입니다.

바운딩 바운딩 박스를 타이트하게 작업
내용 입력(전사) 문자 그대로 입력, 주의사항을 지켜서 입력

작업 방법

작업 방법

  • 마우스 왼쪽 버튼을 누른 상태로 드래그하면 바운딩 박스가 생성됩니다.
  • 마우스 오른쪽 버튼을 누른 상태로 이미지를 움직이면 이미지를 이동할 수 있습니다.
  • 마우스 커서를 이미지 위에 올려놓은 상태에서 마우스 휠로 이미지 크기를 조절할 수 있습니다.
  • 바운딩 박스가 잘못되었다면, [수정] 버튼을 누른 후에 크기를 조절하여 다시 [저장] 할 수 있고, [삭제] 버튼을 누른 후에 새롭게 바운딩 박스 생성할 수도 있습니다.
  • 크롬 자동 번역 옵션 제공을 비활성화해야 프로젝트를 정확히 진행할 수 있습니다.
  • 출처: 본 실습 프로젝트에서 사용되는 데이터는 AI HUB 공공데이터 입니다.
Updated on 2022년 8월 8일

Was this article helpful?