ABC 부트캠프 데이터 탐험가 4기

[29 일차] ABC 부트캠프 : 기술나눔활동(데이터 라벨링)

marriina 2024. 8. 17. 22:52

1. Bounding Box (바운딩 박스)
Bounding Box는 이미지 속 객체를 네모 박스로 감싸는 작업을 의미합니다. 예를 들어, 고양이 사진이 있다면, 고양이의 위치를 사각형 박스로 표시합니다. 이는 객체 검출(object detection) 모델에서 주로 사용됩니다. 이 작업을 통해 모델은 이미지 내에서 객체의 위치를 인식하고 해당 객체를 식별할 수 있습니다.
2. Segmentation (세그멘테이션)
Segmentation은 이미지 속 객체의 윤곽을 따라 선을 그려주는 작업입니다. 이는 바운딩 박스보다 더 정밀하게 객체의 형태를 나타낼 수 있습니다. Segmentation 작업을 통해 모델은 객체의 정확한 모양과 경계를 이해하게 됩니다. 예를 들어, 사람의 실루엣을 따라 선을 그리면, 모델은 사람의 정확한 외형을 파악할 수 있습니다.
3. Keypoints (키포인트)
Keypoints는 객체의 중요한 특징이나 지점을 강조하는 작업입니다. 예를 들어, 사람의 얼굴에서 눈, 코, 입과 같은 주요 특징을 포인트로 표시할 수 있습니다. 이는 주로 포즈 추정(pose estimation)이나 얼굴 인식(face recognition) 같은 작업에 사용됩니다. 모델은 이러한 키포인트를 통해 객체의 자세나 특징을 더 잘 파악할 수 있습니다.
4. TQA (텍스트 기반 질문 생성 및 답변)
TQA는 주어진 본문을 바탕으로 질문을 만들고, 그에 대한 정답을 생성하는 작업입니다. 예를 들어, 긴 글이 주어졌을 때, 그 글을 이해하고 관련된 질문을 만들어 내며, 그 질문에 대한 정답을 제시하는 것입니다. 이는 주로 자연어 처리(NLP) 분야에서 사용되며, 문서의 이해 능력을 테스트하거나 자동으로 질문을 생성하는 AI 모델 개발에 활용됩니다.
5. BQAL (이미지 기반 질문 생성 및 답변)
BQAL은 이미지 속 콘텐츠를 바탕으로 질문을 만들고, 그에 대한 정답을 생성하는 작업입니다. 예를 들어, 한 장의 이미지가 주어졌을 때, 그 이미지에 대한 질문을 만들고, 그 질문에 대한 정답을 생성하는 것입니다. 이 작업은 시각적 질문 응답(VQA: Visual Question Answering) 시스템에서 사용되며, 모델이 이미지의 내용을 이해하고 관련 질문에 답할 수 있도록 돕습니다.
6. Semantic Segmentation (시맨틱 세그멘테이션)
Semantic Segmentation은 이미지 속 각 픽셀을 특정 클래스에 할당하여 객체를 구분하고 색칠하는 작업입니다. 예를 들어, 도로 이미지에서 도로, 차, 사람 등 각 객체를 각각 다른 색으로 칠하는 것입니다. 이 작업은 객체의 위치뿐만 아니라, 그 객체의 모양과 경계를 픽셀 단위로 파악하는 데 중요한 역할을 합니다. Semantic Segmentation은 자율 주행, 의료 영상 분석 등에서 널리 사용됩니다.

데이터 라벨링 작업들은 AI와 머신러닝 모델이 세상을 더 잘 이해하고, 그에 따라 올바르게 행동할 수 있도록 하는 중요한 역할을 합니다. 각 작업은 고유한 목적과 방법을 가지고 있으며, 이들을 잘 이해하고 수행하는 것이 고성능 AI 시스템 개발의 핵심입니다.