컴퓨터/데이터 라벨링

라벨러 업무 이해

book_lover 2024. 3. 19. 11:48

디지털 댐이란?

"디지털 뉴딜 정책의 핵시미 사업, 데이터 댐"

  • 공공기간, 민간기업이 데이터를 수집 후 가공하여 유용한 정보를 재구성한 집합 시스템
  • 라벨러, 리뷰어, 매니저, 강 등 직업 생성

데이터 가공 주요 Issue

  • 데이터 분석 및 활용을 위해 약 80% 수집 및 가공에 소요
  • 고품 데이터 수집의 어려움

https://www.researchgate.net/figure/What-data-scientists-spend-the-most-time-doing-7_fig2_335577003
https://www.shaip.com/blog/what-is-data-labeling-everything-a-beginner-needs-to-know/

데이터 라벨러란?

사람이 자료를 모아주고 컴퓨터가 이해해 줄 수 있는 방법으로 변환
데이터 라벨링 =  데이터 어노테이션 = 태깅 → 가공

https://medium.com/@takouasaadani/understanding-data-labels-and-data-labeling-definition-types-and-how-it-works-for-machine-b7c85b52c593

  • 데이터라벨링 - 객체를 구분하여 이름을 붙이는 것 
    • 수집된 자료
    • 데이터라벨링
    • 라벨링 된 자료
정확한 데이터 가공의 핵심은 데이터라벨러
  • 데이터 라벨링은 인공지능이 학습할 수 있도록 이미지 또는 영상 데이터에 이름을 붙여주는 가공 작업을 말한다.
  • 데이터 라벨링 = 데이터 어노테이션 =  데이터 어노테이션

스포츠 산업에서 AI는 어떻게 사용 될까?

https://blog-ko.superb-ai.com/case-study-sports2i/

데이터 가공 프로세스

https://casit.co.kr/40

FAQ

  • 컴퓨터 활용수준 - 메일 계정 보유, 파일 첨부 하여 발신 가능, 첨부 파일 다운 가능, 압축 풀기 가능 등 온라인으로 업무 할당 받고 업무 결과 보내는 것에 문제가 없어야 함
  • OA - PPT, 엑셀
  • 근무 시간대  - 보수 지급 조건은 프로젝트에 따라 사간제 또는 업무 할당량으로 결정, 시간제는 하루 최대 8시간
  • 근무형태 - 재택, 상용직 외에는 협의
  • 정규직 전화가능 여부 - 매니저 이상만 가능
  • 4대보험 가입 - 위촉직, 계약직, 정규직
  • 채용우대조건 - IT 계열 우대

AI 학습데이터넷 구축이론

인공지능 알고리즘 유형

  • 지도 학습
  • 비지도 학습
  • 강화 학습
    https://ittrue.tistory.com/35

 

인공지능학습용 데이터

  • 인공지능이 학습 할 수 있도록 이미지 위에 객체를 박스로 표시하거나 영역의 테두리를 쳐서 해당 객체가 목적에 맞게 정보를 입력한 데이터

똑똑한 인공지능을 만들기 위해 가장 중요한 것은?

  • 고품질의 학습용 데이터

데이터 구축 과정

https://velog.io/@markany/data-management-process
https://www.medifonews.com/mobile/article.html?no=168425

활용 분야

https://ettrends.etri.re.kr/ettrends/158/0905002116/0905002116.html