음성 데이터 타임라인 태깅 프로젝트

주의사항

  • 본 프로젝트의 데이터는 인공지능 학습용으로 사용됩니다.
  • 본 프로젝트는 아래 가이드 숙지 후에 작업이 가능합니다.
  • 반려된 건에 대해 수정하지 않고 다시 제출하는 경우, 3회 이상 반려를 당할 경우 작업 불가 대상이 될 수 있습니다.
  • 데이터 할당을 받기 위하여 대충 작업하고 반려받아 재작업하는 행위는 엄격히 금지됩니다. 발견 시 작업금지 회원이 될 수 있습니다.
  • 반려된 건에 대해 26시간 이내 재작업하지 않으면 작업물이 삭제됩니다.

프로젝트 소개

표준 문장(15개 단어)과 [아], [이]를 말하는 음성 데이터를 듣고 단어별로 타임 라인을 태깅하는 프로젝트 입니다.

  1. 개인 정보 보호를 위해 음성이 변조된 데이터 입니다.
  2. 녹음 된 데이터를 듣고, 하나의 어절마다 타임라인을 태깅해 주세요.
  3. 단어가 정확하게 들리는지 체크해 주세요.
  4. 정확하게 들린다면, 해당 단어가 무엇인지 선택해 주세요.

이 프로젝트는 AI 소프트웨어를 개발하는 데에 활용됩니다.

작업방법

  • 표준 문장의 15개 단어와 [아], [이]를 말하는 문장이 녹음된 데이터를 재생 합니다.
  • 아래의 기준에 맞게 말하기 시작하는 구간과 끝나는 구간의 타임 라인을 태깅 합니다.

    [표준 문장]

    1. 여름이 오면
    2. 이모댁에
    3. 가기로
    4. 어머니와
    5. 약속했습니다
    6. 시골에서는
    7. 오래된
    8. 나무아래에서
    9. 책을
    10. 읽기도 하고
    11. 얼음 같은
    12. 우물물에
    13. 수박을
    14. 담가 놓고
    15. 먹습니다
  • 태깅 된 구간이 말하고 있는 단어를 선택합니다.
  • [발화어절선택]을 눌러 말하고 있는 단어를 선택해주세요.
  • [발화 여부]와 [발음 정상 또는 비정상]을 선택해 주세요.
  • 말하는 음성이 누락된 경우에는 [발화 여부]-[누락]-[누락]을 선택해 주세요.
    • 음성이 누락되었더라도, 누락된 단어에 해당 될 것으로 예측되는 구간을 태깅해야 합니다.

반려 기준

  • 말하기 시작하는 타임 라인 구간과 끝나는 구간의 태깅이 잘못되어 있는 경우 반려 대상입니다.
  • 말하고 있는 단어가 잘못 선택되어 있는 경우 반려 대상입니다.
  • 음성이 누락된 구간에 단어가 선택되어 있는 경우 반려 대상입니다.

작업화면과 조작방식

1. 작업화면

2. 조작 방식

  1. 파형이 시작되는 부분을 클릭하여 임의로 start 타임 라인 막대를 생성합니다.
  2. 우측 하단에 + 버튼을 눌러 작업을 시작합니다.
    V. +, – 버튼 클릭 시 구간 위치를 0.1초 단위로 변경할 수 있습니다.
    V. 구간 반복 체크 시 strat 타임라인과 end 타임라인 사이의 구간을 반복하여 들을 수 있습니다.
  3. [발화 어절 선택] 아래 Select 을 눌러 말하고 있는 단어 또는 말해야 하는 단어를 선택해 주세요.
  4. [발화 여부] 3.발화 어절 선택 에서 선택한 단어를 읽은 경우 “정상”을 음성이 누락된 경우는 “누락”을 선택해 주세요.
  5. [발음 정상 또는 비정상] 단어를 제대로 발음하여 읽은 경우 “발음정상”을 잘못 읽은 경우 “비정상”을 음성이 누락된 경우 “누락”을 체크해 주세요.
  6. [저장 버튼]을 눌러 저장해 주세요.
    V. 잘못된 작업이 있다면 저장 버튼과 동일한 위치에 있는 수정 버튼을 눌러 수정 가능합니다.
  7. 작업 저장이 끝나면 [작업 제출] 버튼을 눌러 작업을 종료해주세요.
Updated on 2021년 7월 28일

Was this article helpful?