[OCR] 상품 이미지 OCR

주의사항

  • 본 실습 프로젝트는 내일배움카드 프로젝트 수강생만 참여 가능합니다.
  • 본 실습 프로젝트는 아래 가이드 숙지 후에 작업 가능합니다.
  • 반려된 건에 대해 1이내 재작업하지 않으면 작업물이 삭제됩니다.
  • 본 실습 프로젝트에서 [작업 불가] 버튼을 사용할 수 없습니다.

프로젝트 소개

상품 이미지를 보고, 문자를 기준(한글/영어/숫자)에 맞게 바운딩 후 태깅하고, 내용을 입력(전사)하는 프로젝트입니다.

  1. 문자의 가장자리에 맞춰 바운딩해주세요.
  2. 바운딩한 대상을 선택(한글/영어/숫자)해주세요.
  3. 대상의 내용을 입력(전사)해주세요.

이렇게 완성된 결과물은 문자 인식 소프트웨어 개발에 활용되고 있습니다.

작업 기준

1. [OCR 대상]

  • 한글: 이미지에서 확인할 수 있는 모든 한글이 OCR 대상입니다.
  • 숫자: 이미지에서 확인할 수 있는 모든 아라비아 숫자가 OCR 대상입니다.

    한글과 숫자가 섞여 있는 경우 각각 작업해 주세요. 문자 사이에 특수기호가 있는 경우도 특수기호 앞, 뒤로 나누어서 작업해야 합니다.

2. [OCR 단위]

  • 단위 1: 글씨 색상 또는 글씨 굵기
    – 글씨 색상(또는 글씨 굵기)이 다르면 따로 작업해야 합니다.

    글씨 색상이 달라 따로 작업
    (검수 통과)
    다른 글씨 색상을 한 번에 작업
    (작업 반려)
  • 단위 2: 띄어쓰기(어절 단위) / 줄 바꿈
    – 띄어쓰기 또는 줄 바꿈에 따라 작업해야 합니다.
    띄어쓰기 간격이 애매하면 글자 사이가 균일한지 확인해주세요.

    띄어쓰기 기준으로 작업
    (검수 통과)
    띄어쓰기 무시하고 작업
    (작업 반려)
  • 단위3: 테두리
    – 테두리가 포함되지 않게 작업해야 합니다.
    가장 안쪽 글씨를 기준으로 바운딩해주세요.

    테두리를 포함하지 않고 작업(검수 통과) 테두리를 포함하여 작업(작업 반려)

3. [반려 기준]

  • 문장 기호와 특수기호는 OCR 대상이 아닙니다. 문장 기호 또는 특수기호를 따로 작업하거나 한글/영어/숫자 등과 함께 작업한 경우 반려됩니다.
    등록상표기호 소괄호 쉼표 슬래시 앤드
    ® ( ) , / &
    온점 콜론 퍼센트 하이픈
    . : %
    느낌표 물음표 별표 작은따옴표 큰따옴표
    ! ? * ‘ ‘ ” “
    덧셈 기호 곱셈 기호 나눗셈기호 등호 아포스트로피
    + x ÷
    상표 기호
  • 전사 내용 기재 시, 앞뒤 공백이 포함될 경우 반려될 수 있습니다.

주의사항

1. [검수 통과] 

글씨 색상에 따라 작업 문자 사이 특수기호 제외 한글/ 숫자/영어 각각 작업
띄어쓰기에 따라 작업 줄바꿈에 따라 작업 테두리 포함하지 않고 작업

2. [작업 반려]

다른 글씨 색상 한 번에 작업 특수기호 포함 영어와 숫자 함께 작업
띄어쓰기 무시 줄바꿈 무시 테두리 포함해서 작업

작업 예시

  • 초록색 박스가 올바른 작업입니다.

바운딩 바운딩 박스를 타이트하게 작업
태깅 해당하는 대상(한글/영어/숫자)을 입력
내용 입력(전사) 문자 그대로 입력, 주의사항을 지켜서 입력

작업 방법

작업 방법

  • 마우스 왼쪽 버튼을 누른 상태로 드래그하면 바운딩 박스가 생성됩니다.
  • 마우스 오른쪽 버튼을 누른 상태로 이미지를 움직이면 이미지를 이동할 수 있습니다.
  • 마우스 커서를 이미지 위에 올려놓은 상태에서 마우스 휠로 이미지 크기를 조절할 수 있습니다.
  • 바운딩 박스가 잘못되었다면, [수정] 버튼을 누른 후에 크기를 조절하여 다시 [저장] 할 수 있고, [삭제] 버튼을 누른 후에 새롭게 바운딩 박스 생성할 수도 있습니다.
  • 크롬 자동 번역 옵션 제공을 비활성화해야 프로젝트를 정확히 진행할 수 있습니다.
Updated on 2021년 12월 29일

Was this article helpful?