학습용 데이터셋 구축 안내서

최대 1 분 소요

  • 데이터 구축 프로세스: 데이터 획득 → 데이터 검사 → 데이터 정제
  • 데이터 획득: 대상지 선정 → 빛의 양(조도) 확인 → 촬영 수행
  • 데이터 검사: saturate 여부 확인하여 saturate가 되면 해당 이미지 배제, 화질이 불량하거나(흔들림, 초점 불일치 등), 렌즈 이물질 등으로 잘 보이지 않는 이미지의 경우 배제
  • 데이터 정제: 파일 포맷이나 해상도 변환

일관된 이미지 품질을 유지하기 위해 변환 파일 포맷과 해상도 등을 정의해야 합니다. 또한, 데이터 구축 과정에서는 실제로 모델을 학습시켜서 올바른 예측 결과가 나오는지 확인하여 데이터 획득이 제대로 진행되고 있는지 점검하는 것이 좋습니다.

Saturate가 되면 해당 픽셀 값이 최대값으로 고정되어 더 이상의 정보를 담을 수 없게 되어 이미지의 특정 부분이 흰색이나 검은색으로만 표현됩니다. 이 경우 이미지 내의 세부적인 정보가 유실되어 결과적으로 학습 모델의 성능에 영향을 미칠 수 있습니다. 따라서 데이터셋을 촬영할 때는 적절한 조명과 카메라 설정을 사용하여 saturate를 최소화하도록 노력해야 합니다. 또한, 데이터 정제 단계에서는 화질이 불량하거나 렌즈 이물질 등으로 잘 보이지 않는 영상의 경우 배제하여 학습 데이터셋의 품질을 높여야 합니다.

참고문헌

[1] 인공지능 학습용 데이터셋 구축 안내서

댓글남기기