도심 대로변 간판 바운딩과 글자 OCR

주의 사항

  • 본 프로젝트의 데이터는 인공지능 학습용으로 사용됩니다.
  • 본 프로젝트는 아래 가이드 숙지 후에 작업이 가능합니다.
  • 반려된 건에 대해 수정하지 않고 다시 제출하는 경우, 3 이상 반려를 당할 경우 작업물이 삭제 될 수 있습니다.
  • 데이터 할당을 받기 위하여 대충 작업하고 반려받아 재작업하는 행위는 엄격히 금지됩니다. 발견 시 작업금지 회원이 될 수 있습니다.
  • 사진 당 바운딩해야하는 객체가 많은 작업입니다. 인내심을 가지고 꼼꼼히 작업하실 분만 참여해주세요!
  • 반려된 건에 대해 12시간 이내 재작업하지 않으면 작업물이 삭제됩니다.

프로젝트 소개

도심 대로변을 주행하는 차량에서 촬영한 이미지 내에 간판과 글자를 바운딩 후 전사하는 프로젝트 입니다. 

    1. 크게 보이는 간판 바운딩 후 프랜차이즈 여부 선택
    2. 크고 명확하게 보이는 글자 바운딩 후 따라쓰기

이 프로젝트는 차량 주행 중 간판 인식 AI 소프트웨어를 개발하는 데에 활용됩니다.

[좋은 예]

간판 바운딩

글자 OCR

 

작업 방법

1. 간판 바운딩

크고 명확하게 보이는 간판 바운딩 후 프랜차이즈 여부 태깅합니다.

작업

기준

  • 간판 기준
    • 상점, 영업소 등의 광고를 위하여 건물 외벽에 붙여놓은 나무, 플라스틱, 금속 등 재질의 표지판
    • 전광판
  • 간판이 아닌 기준 (바운딩하지 않음)
    • 스티커로 된 간판
    • 입간판
    • 현수막
    • 건물 이름 간판
    • 광고판
  • 바운딩 기준
    • 50%이상 가려진 간판은 바운딩하지 않음
    • 간판 영역만 타이트하게 바운딩
  • 예시

위 이미지에서 GLASSTOWER는 건물 이름이므로 바운딩하지 않음

위 이미지에서 좌측의 간판은 50%이상 가려져있으므로 바운딩하지 않음


– 위 이미지처럼 창문에 붙어있는 스티커는 간판으로 바운딩하지 않습니다.

프랜차이즈 종류 가나다 순 (총 47종)

BHC CU GS25 GS칼텍스 KFC
LG U+ MG새마을금고 SKT SK주유소 S-OIL
교촌치킨 국민은행 기아자동차 깐부치킨 네네치킨
농협 다이소 도미노 뚜레주르 롯데리아
맘스터치 미니스톱 미스터피자 버거킹 베스킨라빈스
빽다방 서브웨이 세븐일레븐 스타벅스 신한은행
올레KT 올리브영 요거프레소 우리은행 이디야커피
이마트24 투썸플레이스 파리바게트 페리카나 피자스쿨
피자헛 하나은행 한솥도시락 할리스 현대오일뱅크
현대자동차

2. 글자 OCR

크고 명확하게 보이는 글자 주변에 박스를 그리고 따라쓰거나 none을 입력합니다.

글자가 전혀 가려져 있지 않은 경우에만 글자 그대로 입력, 조금이라도 가려져 있으면 식별불가 선택해주세요 (11/26 추가)

작업

기준

  • 바운딩 기준
    • 띄어쓰기 단위
    • 사진을 확대하지 않고 인식되는 모든 글자 바운딩
      (스티커 간판, 입간판, 현수막, 표지판, 차량 번호판, 도로 속도 표시 등 모두 바운딩)
    • 한글/영어/숫자: 바운딩 후 전사
    • 그외 언어: 바운딩 후 식별불가 선택
    • 한글/영어/숫자 형태이나 사진 상 뭉개져서 식별이 잘 안되는 경우: 식별 불가 선택
    • 키보드로 입력가능한 특수기호는 입력 (가운뎃점은 마침표로 입력)
    • 띄어쓰기는 없지만 글자 서체, 굵기가 다른 경우에는 별도 바운딩 (의미 단위로)
  • 예시

위 이미지처럼 간판 안에서 크고 명확하게 보이는 글자를 바운딩합니다.

위 이미지에서GLASSTOWER는 간판 바운딩 대상이 아니었지만, 글자 OCR 대상입니다.
위 이미지의 좌측처럼 글자 일부가 가려진 경우는 [식별불가] 선택 후 none을 입력합니다.


– 위 이미지에서 “SC제일은행” 중 “은행”은 가려져서 글자로 보이지 않으므로 바운딩하지 않습니다. 명확하게 글자로 보이는 “SC제일”만 바운딩 후 입력합니다.
– 위 이미지에서 “BURGER” 중 “ER”이 가려져 글자로 볼수는 있지만 어떤 글자인지 확실히 알 수 없으므로 [식별불가] 선택 후 none 을 입력합니다.
– 위 이미지에서 “KING” 중 “I”가 완전히 가려져서 아예 안보이므로 “K”와 “NG”를 띄어져있다고 보고 따로 바운딩 합니다. “K”는 명확히 보이나, “NG”는 명확히 보이지 않으므로 “K”는 입력하고 “NG”는 [식별불가] 선택 후 none 을 입력합니다.


– 위 이미지처럼 창문 틀로 나뉘어져 있어도 띄어쓰기 단위로 바운딩합니다.

속성
  • 글자 종류
    • 한글/영어/숫자
    • 식별불가

작업 화면과 조작 방식

1. 작업화면

작업화면에 두 개의 이미지가 있습니다. 상단에는 간판 바운딩만, 하단에는 OCR만 해주세요.

상단에 있는 이미지에는 간판 바운딩 후 프랜차이즈 여부만 선택해주세요.

하단에 있는 이미지에는 글자 바운딩 후 해당 글자를 적어줍니다.

2. 조작 방식

  • 작업화면 상단에서 간판 바운딩 진행, 하단에서 글자 OCR 진행
  • 마우스 휠: 이미지 확대 / 축소
  • 마우스 왼쪽 버튼 클릭: 바운딩 박스 점 클릭, 점 3개 클릭 후 더블클릭하면 사각형 박스 생성
  • 마우스 오른쪽 버튼 클릭 후 드래그: 이미지 위치 이동

작업 예시

[간판 바운딩]
좋은 예 나쁜 예

간판 영역만 타이트하게 바운딩했습니다.

간판 뿐만 아니라 건물 이름과 광고판까지 바운딩 했습니다. 건물 이름과 광고판은 간판 바운딩 대상이 아닙니다.

[글자 OCR]
좋은 예 나쁜 예
하나의 띄어쓰기 단위 안에 글자 색깔이 달라도 함께 바운딩합니다.

하나의 띄어쓰기 단위 안에 글자 색깔이 달라 따로 바운딩했습니다. > 함께 바운딩해야합니다.

크고 명확하게 보이는 글자를 모두 바운딩했습니다.

크고 명확하게 보이는 글자를 바운딩하지 않았습니다.

간판 바운딩과 글자 OCR 차이

[간판바운딩]

글자OCR

[유의 사항]

위 이미지처럼 대소문자의 차이 때문에 크기 차이가 발생하는 경우에는 하나로 바운딩 후 입력해주세요 (위 이미지 반려)

위 이미지처럼 가운뎃 점이 있는 경우, 하나로 바운딩 후 입력할 때는 가운뎃 점 대신 마침표(.)를 입력해주세요 (위 이미지 검수 통과)

위 이미지에서 eco Air 365 가 있는 부분은 광고판 입니다. 간판이 아니므로 간판 바운딩 대상이 아닙니다. (위 이미지 검수 통과)

위 이미지처럼 상점 및 영업소 간판아 아닌 간판은 간판 바운딩 대상이 아닙니다. (위 이미지 반려)

위 이미지처럼 건물 전면에 측면으로 붙어있는 간판도 간판 바운딩 대상입니다. (위 이미지 반려)

위 이미지에서 “의원”은 하나의 의미 단위이므로 하나로 바운딩 합니다. (위 이미지 반려)

위 이미지에서 메가박스의 간판은 50% 이하로 가려져있으므로 바운딩합니다. (위 이미지 반려)

Updated on 2020년 12월 10일

Was this article helpful?