상표 및 문서 OCR 라벨링

상표 및 문서 OCR 라벨링 가이드입니다. 아래 내용을 꼭 확인하시고 작업해주세요!

++가이드 업데이트된 내용입니다.

작업은 좌측 상단부터 순차적으로 하는 것이 권장되나, 중간에 글자들이 추가된 경우는 순서를 바꿀 수 없기에 필수 사항은 아닙니다. 검수시에 참고해주세요.

– 위 그림처럼 이미지 위쪽 배경처럼 찍힌 글자들은 바운딩하지 않습니다.

– 위 이미지 처럼 세로로 표시된 이미지들은 가로로 쓰여진 글자처럼 동일한 요령으로 (띄어쓰기 기준) 바운딩 처리해주시면 됩니다.

– 이미지를 확대한 경우, 실제로는 잘리지 않았는데 위 처럼 잘렸다고 반려처리된 경우가 많습니다. 이미지 확대 여부를 확인해서 정상적으로 작업되었는지 확인이 필요합니다.

– 이미지를 확대하여 위와 같이 바운딩 시에 글자가 잘리는 경우는 반려의 대상이 됩니다. 확대하실 때 글자가 잘리지 않을 수준으로 확대후 바운딩 처리 해주셔야 합니다.

– 반복되는 문의사항인데요. 의미단위로 구분하는 것이 아니라, 띄어쓰기 기준으로 바운딩처리해주셔야 합니다. 위의 사례는 “안전사고(갇힘)”을 한꺼번에 바운딩 처리해주셔야 합니다.

– 위의 그림의 경우에는 글자들이 곡선으로 나열되어 있기는 하지만, 어절 단위로 하나의 바운딩 박스로 처리할 수 있기에 글자별로 바운딩하지 않고 어절 단위로 바운딩 합니다.

– 위의 그림의 경우에는 로고 부분의 Yonsei University는 심한 곡선으로 위치 하고 있어서, 개별 글자로 바운딩해주셔야 합니다. 그 이외에 나머지 글자들은 어절 단위로 바운딩하시면 됩니다.

– 위의 그림의 경우에는 글자 사이에 간격이 넓은 경우는 의미로는 한 글자이지만, 공백이 크기에 개별 글자별로 바운딩해주시면 됩니다. “전   주   역”은 “전”,”주”,”역” 각각 바운딩 처리 해주시면 됩니다.

– 위의 그림에서는 “+피부안정성테스트”처럼 띄어쓰시가 없는 경우는 하나의 바운딩으로 처리하시면 됩니다.

작업은 좌측 상단부터 순차적으로 해주세요:)

1. 위 그림에서 바운딩할 어절(띄어쓰기로 구분되는 단위)을 선택하시고, 박스를 클릭하시면 글자를 입력할 수 있는 창이 열리게 됩니다. 이미지가 작아서 구분이 원활하지 않은 경우는, 마우스 스크롤을 이용하여 확대/축소하여 작업하실 수 있습니다.

2. 글자를 바운딩한 박스에서 글자와 박스 사이에 여백이 많은 경우에는 (반려 사유 해당), 박스를 미세 조정하셔서 최대한 여백이 없도록 합니다.

3. 마지막으로 박스 안에 글자 “계내금”을 입력하시고, 저장 버튼을 클릭하시면 됩니다.

4. 이미지안에 있는 모든 어절을 동일한 방식으로 박스를 선택하시고 텍스트를 입력하시면 됩니다.

주의 사항

– 위 그림에서 “소비자총부채 상환율” 부분은 “소비자총부채”와 “상환율”이 띄어쓰기로 구분된 경우는 각각 “소비자총부채”와 “상환율” 바운딩을 하고 입력을 합니다.

– 위의 그림처럼 “완화된 기준”을 띄워쓰기가 있음에도 하나로 입력하는 경우 반려 처리 됩니다.

– 위의 그림처럼 특수 기호 형태의 숫자인 경우에는 숫자 “1”만 입력하시면 됩니다.

-위의 그림처럼 글자와 바운딩 박스 사이에 여백이 거의 없는 것이 좋으나, 박스선이 글자를 침범하는 것도 반려 사유가 됩니다.

– 특수 기호의 경우에는 키보드에 표현된 기호외에는 입력하지 않습니다. 따라서, 위의 당구장 문자는 키보드에 기본으로 입력받는 기호가 아니므로, 바운딩하지 않습니다.

– 한국어 및 영어 외에는 바운딩 하지 않습니다. 일본어, 중국어, 한자, 베트남어, 태국어 등 모두 제외합니다. 특히, 베트남어 등은 표기는 알파벳으로 하지만, 발음 기호 등을 포함하고 있어서 바운딩 하지 않습니다.

– 위의 그림처럼 곡면에 자리잡고있어서 왜곡이 심한 글자는 바운딩하지 않습니다.

–  위의 그림의 “POWER”의 경우, 글자 사이에 띄어쓰기는 없지만, 글자들이 경사지게 위치하여 하나의 바운딩 박스로 처리되지 않기 때문에, 이 경우에는 “P”,”O”,”W”,”E”,”R”를 모두 개별 바운딩 처리합니다.

– 위의 그림의 하단에 있는 “입금계좌…” 부분처럼 글자가 잘린 경우에는 바운딩 하지 않습니다.

Updated on 2019년 11월 21일

Was this article helpful?