영상 전사 : 음성을 텍스트로 보여줘!

주의사항

  • 본 실습 프로젝트는 아래 가이드 숙지 후에 작업 가능합니다.

프로젝트 소개

영상 속 음성을 듣고 기준에 맞게 전사(받아쓰기)하는 프로젝트입니다.

    1. 영상 파일 재생하기
    2. 내용 듣기(일상 대화)
    3. 전사 작업
      일상 대화(대화체): 말하는 사람별로 구간을 지정하여 전사(받아쓰기).

이렇게 완성된 결과물은 음성을 텍스트로 변환하는 소프트웨어 개발에 활용되고 있습니다.

작업 기준

1. [작업 내용]

  1. 영상을 재생하여 화자의 말을 들어주세요.
  2. 기준에 따라 구간을 지정해주세요.
    일상 대화(대화체) 기준:  말하는 사람
  3. 말하는 사람(화자)의 성별(남자/여자)을 선택해주세요.
  4. 지정된 구간 내용을 전사(받아쓰기)해주세요.
  5. 전사(받아쓰기) 후에 맞춤법 검사기로 맞춤법 및 띄어쓰기를 확인하고 저장해주세요. (맞춤법 검사기)

    맞춤법 검사기로 교정되지 않더라도 한글 맞춤법이 적용될 수 있습니다. “너”의 사투리인 “니”라고 정확히 발음된 경우 “니”라고 전사해주세요.

2. [작업 범위]

  • 구간 지정 범위: 음성이 시작되는 부분 ~ 음성이 끝나는 부분

    음, 어, 아, 으 등과 같은 의미 없는 간투어로 시작하는 경우 음성이 시작되는 부분부터 지정하되 간투어는 전사(받아쓰기)에서 제외해주시면 됩니다.

  • 중복 구간은 지정할 수 없습니다.

    0:00:00 ~0:03:12를 전사(받아쓰기) 후 저장했다면 다음 작업에서는 0:03:12 이후부터 구간 지정 가능합니다. 재생 버튼으로 빨간 실선을 원하는 구간까지 움직인 후 플러스 버튼을 눌러 추가 전사(받아쓰기)를 진행해주세요.

반려 메시지 의미
별 표시가 있는 곳으로 이동해야 올바르게 수정된 것입니다.

반려 메시지에서 나타나는 (위치)점과 방향을 확인하고 컨트롤 바를 별 표시로 이동하여 구간을 수정해 주세요.

3. [전사 규칙]

  • 대화체에서 줄 바꿈이 들어가면 반려될 수 있습니다. 한 줄로 전사해 주세요.
    검수 통과 작업 반려
    안녕하세요. 크라우드웍스입니다. 안녕하세요.

    크라우드웍스입니다.

  • 문장부호는 마침표(.)와 물음표(?)만 전사(받아쓰기) 대상입니다.
    그 외 기호인 쉼표(,), 느낌표(!), 줄임표(…), 물결표(~), 붙임표(-), 줄표(–) 등은 전사(받아쓰기) 대상이 아닙니다.

    A: 안녕하세요. 크라우드웍스입니다. (O)
    A: 안녕하세요~ 크라우드웍스입니다. (X)
  • 숫자, 외래어, 기호 등은 기호가 아닌 문자 소리 나는 대로 한글로 작성해 주세요.
    이때, 숫자 다음에 한글이 온다면 사이에 띄어쓰기가 필요합니다.
    (숫자+띄어쓰기+한글)
    맞춤법 검사기 결과에 다른 표기가 맞는다고 해도
    숫자는 이 규칙을 따라 전사(받아쓰기)해 주세요.

    대화 전사(받아쓰기)  내용
    3시 45분 세 시 사십오 분
  • 대화 이외 잡음은 전사(받아쓰기) 대상이 아닙니다.
    대화 중간에 들어간 의미 없는 음, 어, 아, 으 등의 간투어도 잡음입니다.

    대화 전사(받아쓰기)  내용
    음, 저는 점심을 어… 안 먹으려고 했어요. 저는 점심을 안 먹으려고 했어요.
  • 제출하기 전 맞춤법 검사기를 꼭 사용해주세요.
    맞춤법이나 띄어쓰기가 틀리면 반려 대상입니다. 공백(빈 칸)이나 줄바꿈이 포함되지 않게 주의해주세요.

    검수 통과 작업 반려
    (공백_스페이스 바)
    작업 반려
    (줄바꿈_엔터)

작업 예시

일상 대화(대화체) > 말하는 사람별로(목소리 변경) 구간을 지정하여 전사(받아쓰기)

ex.음성 내용: [A: 안녕하세요. 크라우드웍스입니다. B: 안녕하세요. 잘 지내셨지요?]

A: 안녕하세요. 크라우드웍스입니다. (O)
마지막 마침표를 제외하고 중간에 들어가는 마침표 뒤에 띄어쓰기 한 칸 넣어주세요.
A: 안녕하세요. / A: 크라우드웍스입니다.(X)

작업 화면과 작업 방법

1. 작업 화면

*이미지를 클릭하여 확대 후 확인해주세요!



2. 작업 방법


1) 작업을 시작하기 위하여 화면 오른쪽 + 버튼을 눌러주세요.
* 전체 음성을 들어보고 전사(받아쓰기)하기 쉬운 재생속도로 조절해주세요.

2) 전사(받아쓰기)하고자 하는 구간을 지정해주세요.
구간 시작점(노란색 바)과 구간 종료점(초록색 바) 마우스로 드래그하여 구간을 지정할 수 있습니다.
또한, 구간이동에서 초 단위를 선택하여 구간 위치를 지정할 수 있습니다.

3) 말하는 사람(화자)이 남자인지, 여자인지 선택해주세요.

4) 전사 규칙에 맞게 전사(받아쓰기)해주세요.

5) 맞춤법 및 띄어쓰기를 확인한 후, [저장] (노란색) 버튼을 눌러 저장해주세요.

  • 크롬 자동 번역 옵션 제공을 비활성화해야 실습 프로젝트를 정확히 진행할 수 있습니다.
  • 출처: 본 실습 프로젝트에서 사용되는 데이터는 AI HUB 공공데이터 입니다.
Updated on 2022년 8월 8일

Was this article helpful?