화학 논문 태깅 프로젝트

주의사항

  • 본 프로젝트의 데이터는 인공지능 학습용으로 사용됩니다.
  • 본 프로젝트는 아래 가이드 숙지 후에 작업이 가능합니다.
  • 반려된 건에 대해 수정하지 않고 다시 제출하는 경우, 3회 이상 반려를 당할 경우 작업 불가 대상이 될 수 있습니다.
  • 데이터 할당을 받기 위하여 대충 작업하고 반려받아 재작업하는 행위는 엄격히 금지됩니다. 발견 시 작업금지 회원이 될 수 있습니다.
  • 반려된 건에 대해 26시간 이내 재작업하지 않으면 작업물이 삭제됩니다.

프로젝트 소개

영어로 작성된 화학 관련 논문을 읽고 속성값을 태깅하는 프로젝트입니다.

  1.  PDF 파일과 작업 화면을 동시에 보고 비교하며 진행합니다.
  2. 논문에서 말하고자 하는 물성에 대한 정보만 태깅합니다.
  3. 반드시 가이드를 숙지한 뒤 프로젝트를 진행해 주세요.

이 프로젝트는  AI 소프트웨어를 개발하는 데에 활용됩니다.

 

[모니터링 게시판 운영 안내]

  • 본 프로젝트는 모든 작업자를 대상으로 daily 모니터링 중 입니다.
  • 불량률 10%
    • 주의 조치
    • 주의 조치 사유 안내
  • 불량률 20% ~ 30% 미만 / 또는 주의 조치 2회 이상
    • 해당 프로젝트 참여 제한 조치
    • 참여 제한 조치 사유 안내
    • 1일 불량률 40% 이상일 경우 주의 조치 없이 바로 참여 제한 조치 적용
  • 게시글 내에 각 조치가 시행된 일자와 사유를 안내 드립니다.
  • 매일 오후 3시에 업데이트 된 내용을 확인 후 작업에 바로 적용 부탁 드립니다.

참고사항

  • [클릭] 고객사 피드백 링크
  • 해당 작업의 목표는 논문 본문에서 말하고자 하는 데이터를 표로 정리할 수 있게끔 태깅하는 것입니다.
  • 논문에서 핵심적으로 비교하여 실험하고자 하는 material을 논문의 결론 부분에서 읽고 파악 후 표를 그려놓으면 태깅하기 쉽습니다.

  • 대부분의 논문에서는 이런 데이터값을 피겨나 표로 가지고 있기 때문에 참고하시어 해당값이 본문에 나올 때 태깅하시면 됩니다.

  • material마다 property의 v-unit이 달라지는 경우는 아래의 이미지처럼 표로 정리할 때 다른 값이 들어갑니다.
  • 그러면 각각의 material, property, v-unit으로 태깅하시면 됩니다.

  • v-unit은 material 별로 달라지지 않는 이상 개개로 태깅하지 않습니다.

검수자의 팁

  1. 논문에 등장하는 모든 material/value/property를 태깅할 필요는 없습니다. 그러나 논문이 말하고자 하는 중요한 데이터는 반드시 단어로 태깅이 되어야 합니다.
  2. 작업창을 확인하시기 전에 논문을 먼저 확인부탁드립니다. 대부분 논문이 흐름이 비슷하기 때문에 한 두 번 과정이 손에 익으면 빠르게 작업할 수 있습니다.
  3. material property value값 이후 등장하는 단위에 대해서

    1.  v-unit (value unit 약자)로, 작업 조건에 해당하는 내용에 대해서는 c-unit (condition unit 약자)으로, 나머지는 그냥 unit을 체크하시면 됩니다.

    2. 예를 들어, 100 nit하에서 측정시 4.5 cd/A, 500 nit 하에서 측정시 5.8 cd/A, 1000nit 하에서 측정시 9.8 cd/A 라는 데이터값이 있다고 할 때 nit가 c-unit, cd/A가 v-unit에 해당합니다.

    3. 그러나 c-unit을 택해야 하는 경우는 예시로 든 것 같은 LED나 배터리 관련 논문에나 빈번합니다.

    4. 현재 작업중인 주제의 논문에서는 다양한 측정 조건보다 condition자체로 태깅될 수 있는 경우가 더 많으니 unit 태깅이 필요한 경우는 대부분 v-unit에 해당한다고 보셔도 됩니다.

  4. 현재 작업하는 주제의 논문들에서 태깅이 필요할만한 c-unit

    1. 각기 다른 농도 조건

      • 10mg/ml와 20mg/ml의 tensile strength를 각각 측정

    2. 각기 다른 온도 조건

      • 250도와 350도에서 kinetic constant를 각각 측정

    3. rheology 측정의 shear rate이 여러 개로 달라질 때

      • 100s-1에서 viscosity 와 같은 경우

    4.  보통 하나, 많아야 두어개 나타나고 말아서 구를 통째로 condition으로 잡아도 무방합니다.
  5. 덧붙여, c-unit과 v-unit이 따로 설정된 이유
    • LED나 배터리 관련 논문들에서 voltage, nit, cd/A 등의 유닛이 반복적으로 섞여가며 나오기 때문으로 추측됩니다.
  6. 아래 관리자가 작업/검수하는 과정을 참고해 주세요.

[CO2 플라스틱, 생분해성 플라스틱 분야 논문 본문 흐름]

① 물질 합성
  • 주로 process, measurement로 문장 태깅되는 내용들
② 분석 (IR, NMR, TEM, SEM, XRD, XPS 등등)
  • 주로 analysis로 문장 태깅되는 내용들
③ degradation 특성 (Tg, Tm, Tmax, weight loss, TGA 등 결과)
  1. 단어 태깅 대상이 주로 등장 (property, value, material, unit)
  2. 시간 및 기타 조건에 대해서는 condition으로 처리 (예: initial, after 28days, in 2 hours, yard compost 등)
  3. 가이드 내 작업 예시 1번 참고
④ mechanical property (tensile strength, young moduluus 등)
  • 단어 태깅 대상이 주로 등장 (property, value, material, unit)

[개별 논문 작업 과정]

① 단어 태깅 대상 확인
  1. 제목과 메인 데이터(피겨 또는 테이블) 확인, 논문이 이야기하고자 하는 데이터가 본문에 등장할 때 태깅
  2. 대부분의 경우 숫자값(데이터)이 나올 때 value, unit이 나오며 앞뒤로 material이 있음
  3. 데이터 앞뒤의 material명은 주로 축약형이므로 나중에 논문을 다시 살펴보며 full name 태깅
② 문장 태깅 대상 확인
  • experimental section의 내용은 대부분 process, measurement이므로 읽어보고 태깅
③ 해당 논문의 태깅 대상에 대해 파악 후 (메모, 별도 표시하면 편리) 작업창에서 작업 시작
  • 태깅 대상 앞뒤로 캡션이나 페이지, reference number등이 들어가 있는 경우는 필요한 부분만 태깅해서 같은 항목으로 체크해주시면 됩니다.
  • 예) pure silk fibroin from Figure 3, parts c and d, nanofibrous membranes (SF NM)

material1 : SF NM
material1, full name : silk fibfroin
material1, full name : nanofibrous membranes

FAQ

  1. 반려 수정 시 material 번호가 중간에 빠지게 됩니다. 순서를 지키지 않아도 되나요?

    • material 번호는 순서대로 넘버링해주세요.

    • 해당 논문에서 데이터 값이 없는 material은 제외하고 순서대로 넘버링합니다.

  2. property 태깅 시 fullname 없이 약자만 있는 경우에는 어떻게 하나요? (예시: Melting temperature 없이 약자인 tm만 적혀 있는 경우)

    • 일반적으로 약자가 fullname 없이 통용되는 경우에는 약자만 property로 태깅합니다.

  3. 결과 파트에서 Mechanism과 수식 만들어서 결과낸 값도 태깅 대상인가요?

    •  물질별로 데이터가 있다면 태깅 대상입니다.

  4. fullname 태깅 시 중복 태깅 가능한가요?

    • fullname 태깅 목적은 논문에 대해 아무 사전 지식이 없을 때에도 material과 fullname을 알 수 있게 하기 위함입니다. 순서가 섞이지 않거나, 약어가 중복되게 들어가지 않아도 이해가 된다면 모두 태깅하지 않아도 됩니다.

    • 예를 들어 polylactic acid (PLA) tensile strength 23.5 MPa 와 같은 데이터가 있다면 material과 fullname은 각각 PLA , polylactic acid으로 태깅하시면 됩니다.

    • 그러나 PLA-PVP-CNT composite과 같이 모두 약어로만 이루어진 material은 어느 약어가 어느 fullname인지 직관적으로 알아차리기는 어렵습니다.

    • 따라서 polylactic acid (PLA), polyvinylpyrrolidone (PVP), carbonnanotube (CNT)이 모두 fullname으로 태깅 되어야합니다.

    • ratio별 mixing, blend, composite 같은 경우 위와 같이 각각의 약어를 포함시켜 태깅하시면 중복 태깅으로 인한 번거로움을 피할 수 있으니 참고 부탁드립니다.

  5. condition 지정 시 어떤 property의 condition인지 지정해줘야 하나요?

    • 논문에 따라 다릅니다. property를 측정할 때마다 condition이 다르다면 어떤 property의 condition인지 지정해야하는 경우도 있습니다.

  6. 분석(IR, NMR, TEM, SEM, XRD, XPS 등등)은 주로 analysis로 문장 태깅이 되는 부분이라고 이해하고 있습니다. 근데 가끔 TEM 또는 SEM 이미지를 통해 평균 길이를 작성한 논문이 있는데, 이런 경우에는 Property, value로 따로 결과 태깅을 해야하나요?

    • 평균 길이와 같이 단일 수치로 의미를 갖는 숫자값이 나오는 경우는 property, value로 태깅하시면 됩니다.

  7. material 태깅 시 ratio가 포함되어 있는 경우 fullname 태깅은 어떻게 하나요?

    • ratio로 샘플명이 정해진 경우에는 ratio가 fullname에 포함되어야 합니다.

  8. 같은 property에서 단위가 MPa. GPa로 표현되어 있으면 별도 태깅하나요?

    • 해당하는 material별로 태깅합니다.

  9. 실험방법 Tagging시에는 실험에 사용된 약품도 함께 태깅 되어야 하는 게 맞나요?

    • process 태깅시 reagents/process가 한번에 나와있는 경우가 많은데 이런 경우 한번에 태깅하시면 되고 아닌 경우는 나눠서 process 태깅하시면 됩니다.

    • reagents가 본문에 없는 경우를 제외하고는 태깅하신다고 생각하시면 됩니다.

  10. 결과 수치값 중 태깅 대상이 아닌 값들은?

    1. 해당 논문의 실험결과가 아닌 경우

    2. 실험방법/측정방법에 해당하는 경우

    3. 단일 수치로는 의미를 갖기 어려운 NMR, IR, XRD등 데이터 (2차적으로 해석된 데이터는 경우에 따라 포함됨)

  11. Condition에서 under air 처럼 at 40°C 이면 at도 포함해서 태깅하면 되는 건가요?

    • 해당 온도조건이 하나나 둘 정도로 나와있다면 구 전체를 태깅하시면 됩니다.

    • 온도별로 작업을 달리 하였다면 condition 40, c-unit °C와 같이 작업하시면 됩니다.

  12.  about, approximately, near, range 등이 태깅 범위 포함인가요?

    • 기본적으로 value작업시에는 숫자값만을 지정합니다.

    • 단, 최소/최대값을 물질별로 태깅 불가능한 범위를 언급할때는 ~ 등을 포함하는 방향으로 태깅합니다.

  13. value unit을 지정할때, material도 함께 지정해야하는건가요?
    • material마다 property의 v-unit이 달라지는 경우는 각각의 material,property,v-unit으로 태깅하시면 됩니다.
    • v-unit은 기본적으로는 property와 같이 가는 태깅단어입니다.
    • 따라서 개개의 태깅이 필요하지는 않습니다만 기존에 설명드린 바와 같이, material 별로 v-unit을 다르게 지정하는 경우가 종종 있습니다.
    • (스케일이 달라지는 때) 이런 경우라면 material별로 v-unit을 지정하셔야합니다.
    • 그 외의 일반적 경우에는 따로 지정하실 필요 없습니다.
  14. 만일 CNT와 graphene oxide를 mix한 소재에 대해 mat 1, mat 2, mat 3으로 CNT + 1, 5, 10wt% GO 가 각각 태깅되고 value를 갖고 있는 상황에서 본문 중에 ‘CNT + GO fibers의 B값은 1~10이다.’라는 문장이 나왔고 이와 관련된 table에서는 GO의 wt% 비율을 1 ~ 10 wt% 까지 달리한 총 10개의 B 값이 나와있다고 하면 본문의 property B값 1~10에 대한 mat, value의 태깅은 어떻게 되어야할까요?

    • 정확한 수치대신 평균치 근처의 범위값으로만 설명하고 있는 경우는 표를 참조하여 mat 1 + value = 1 과 mat 3 + value = 10 으로 개별 태깅
    • 모든 material을 묶어서 설명하는 내용이 계속적으로 반복된다면 mat 4: CNT + GO fibers / value: 1~10으로 태깅
  15. fullname 태깅 중 PDF는 정상인데 작업 화면에서는 중간에 “and studies”가 들어가 fullname이 분리된 경우에는 어떻게 태깅하나요?
    • 예시: relative polyesters, 12 such as poly(butylene and studies funrandicarboxylate) (PBF)
    • poly(butylene 와 furandicarboylate로 나누어서 각각 PBF fullname으로 태깅합니다.

작업방법

1. 단어 태깅

[태깅값]

  1. Material
  2. Property
  3. Condition
  4. Value
  5. Unit
  6. Fullname

[태깅 규칙]

  • 단어 태깅의 목표는 해당 논문에서 실험한 내용을 표로 도식화하는 것입니다. 따라서 해당 논문에서 실험한 데이터만 태깅 대상입니다.
    1. 서론, 결론, reference 논문 내용은 태깅하지 않습니다.
    2. 수식, table, figure, caption에 있는 내용은 태깅하지 않으며 본문 내에 텍스트로 존재하는 부분만 태깅합니다. (table 및 figure에 존재하는 데이터라고 해도 본문에 없는 경우 태깅하지 않습니다.)
    3. 데이터의 절대적인 수치가 없는 경우 (상대 수치로 나타나있거나 문장으로 서술되어 있는 경우) 태깅 대상이 아닙니다.
    4. material이 혼합물인 경우 혼합비율을 포함하여 material로 지정합니다.
      예) CdSe quantum dot with Cd:Se 8:1라고 되어있는 경우 전체가 material1로 태깅되어야 합니다. 혼합비가 condition에 들어가지 않도록 주의 부탁드립니다.

    5. material/property/value는 각각 매칭되도록 태깅이 필요하며 해당하는 데이터의 가장 가까운 것으로 태깅하면 됩니다. 동일한 material의 중복 태깅은 필요하지 않으며 full name이 데이터값보다 훨씬 앞에 존재하는 경우는 full name을 먼저 태깅하면 됩니다.

  • 태깅 영역 시작과 끝 부분에 공백이 포함되지 않게 태깅해 주세요.

2. 문장 태깅

[태깅값]

  • process : 기술 문서의 전체 실험 조건은 process로 태깅해 주세요.
  • measurement : 기술 문서 중 측정 장비 또는 측정 조건 관련 내용은 measurement로 태깅해 주세요.
  • analysis : 측정결과를 분석하는 내용은 analysis로 태깅해 주세요.

[태깅 규칙]

  • 문장 태깅은 일반적으로 article의 experimental section에 해당하는 내용이며, process/measurement/analysis 부분에 해당하는 전체 문장을 각각에 맞도록 태깅하면 됩니다. 여기에 해당하는 상세데이터는 단어로 태깅하지 않습니다. (IR data나 NMR data 각각의 수치 등은 모두 문장으로 태깅합니다.)

  • 태깅 영역 시작과 끝 부분에 공백이 포함되지 않게 태깅해 주세요.

3. 반려 기준

  • 태깅이 올바르게 되어 있지 않은 경우 반려 대상입니다.
  • 누락된 태깅 대상이 있는 경우 반려 대상입니다.

4. 주의 사항

  • 작업 화면 진입 단계에서 로딩이 느릴 수 있습니다. 창을 닫지 말고 기다려 주세요.

작업예시

[작업 환경 세팅]

  • 논문 PDF 파일과 크라우드웍스 작업 화면을 비교할 수 있도록 두 개의 창을 띄워주세요.
  • 예시 이미지는 좌측이 논문 PDF 파일 뷰어, 우측이 크라우드웍스 작업 화면을 띄워놓은 상태입니다.

[작업 예시 PDF 파일 다운로드]

논문 PDF 파일 작업 화면 내 텍스트

작업화면과 조작방식

1. 작업 화면

  • 모든 이미지는 클릭 시, 큰 화면으로 확인 가능합니다.
이미지 예시 조작 방법
1. 작업을 진행할 논문 제목과 URL을 확인해 주세요. 논문의 총 페이지 수를 작성한 뒤 저장을 눌러 주세요.

2. 태깅 대상 문장이나 단어를 드래그 합니다. 드래그 된 영역은 파란 바탕색으로 나타나며, 앞뒤 공백이 포함되지 않도록 드래그 해야 합니다.

3. 태깅한 영역에 철자 누락, 공백 포함 등이 없이 잘 되어 있는지 확인해 주세요.

4. Slelct 우측의 삼각형을 눌러 주세요.

5. 태깅한 영역에 맞게 단어 또는 문장을 선택해 주세요.

6. 선택한 속성에 따라 라벨 영역이 변경됩니다. 해당하는 라벨 값을 선택해 주세요.

7. 태깅이 올바르게 되었다면 저장을 눌러 주세요.

8. 논문 내 해당하는 단어, 문장이 모두 선택되었다면 작업 제출을 눌러 주세요.

2. 크롬 자동 번역 OFF

① 크롬 우측 상단에서 [ 크롬 맞춤 설정 및 제어 ]로 진입합니다.

[ 설정 ]을 클릭해 주세요.

③ 좌측 메뉴에서 [ 고급 ]을 클릭해 주세요.

좌측 메뉴에서 [ 언어 ]를 클릭해 주세요.

[ 언어 ] 탭을 클릭해주세요. 숨겨진 창이 보입니다.

⑥ 언어 설정 중 [ 이 언어로 된 페이지에 대한 번역 옵션 제공 ]을 이미지와 같이 비활성화 해주셔야 합니다.

  • 위 기능을 설정하지 않을 경우, 반려 메시지가 자동 번역되어 정확한 안내를 받지 못하게 되니 꼭 설정 부탁드립니다.
Updated on 2022년 1월 11일