Search

기획

선정 배경

🎯 이번 스터디의 5월 프로젝트 주제로 딥러닝 기반 이미지 처리를 선정하였다.
그 이유는 다음과 같다.

  • 팀원 다수가 이미지 처리 경험을 보유하고 있어 기술 진입 장벽이 낮다.
  • 단순 전처리를 넘어서, 결함 분류 및 탐지 알고리즘까지 확장 가능한 주제가 필요했다.
  • 특히 반도체 머신비전 분야는 결함을 얼마나 빠르고 정확하게 탐지하느냐에 초점을 맞추기 때문에,
    프로젝트의 목표가 명확하고 집중도가 높다.
  • 공개된 문서나 논문에 정확도 및 처리 속도에 대한 기준 지표가 명시되어 있어,
    실제 실습 결과를 기반으로 객관적인 성과 비교가 가능하다.

이러한 요소들은 학습 목표와 실무 연계를 동시에 충족할 수 있는 조건이 되며,
딥러닝 데이터 설계 및 실험 환경 구성에 적합한 주제로 판단하였다.


리서치

🔍 프로젝트를 시작하기에 앞서, 산업 현장에서 머신비전이 실제로 어떻게 운영되고 있는지를 리서치했다.
특히 AI 모델 개발과 현장 운영 간의 간극, 그리고 향후 모델 개발 자동화 가능성에 주목했다.


모델 학습

🧠 비전 검사 모델을 만들기 위해서는 실제 데이터를 수집하고, 라벨링을 진행해야 한다.
이후 모델을 학습시키고, 성능을 검증하고 개선하는 과정을 반복한다.

이런 일련의 과정을 완료하는 데에는 수주에서 수개월이 걸린다.
라벨링 품질, 도메인 전문성, 하드웨어 리소스 등에 따라 기간이 더 길어지기도 한다.

그러나 최근에는 AI의 발달로 이 개발 시간이 단축될 수 있는 가능성도 보인다.

➡️ 딥러닝 AI 발달 예측 포스트 보기


모델 실행

⚡ 모델이 일단 완성되면, 운영 단계에서는 속도와 안정성이 최우선이다.

  • 사전 정의된 결함만을 대상으로
  • GPU 가속을 통해 초당 수백~수천 장의 이미지 처리
  • 현장에서는 모델이 변경되지 않고 고정 상태로 반복 사용

운영자는 모델의 내부 구조나 학습 방식에 개입하지 않으며,
검사 장비에 고정된 형태로 실시간 분석을 수행한다.

머신비전의 현장 적용 방향: 온디바이스 AI


검사 요건

📌 프로젝트 타깃으로 설정한 반도체 다이 수준의 결함 분류에서는 다음과 같은 성능 요건이 요구된다:

  • 결함 분류 처리 시간: 200ms 이하 / 다이 1개 기준

요약

📊 성능 기준

항목 내용
다이 크기 약 10mm × 10mm
카메라 분해능 픽셀당 약 2μm
이미지 해상도 약 250만 픽셀 (예: 2500×1000)
단일 이미지 용량 약 23MB
분류 속도 요구사항 1다이당 200ms 이하

📝 이와 관련한 세부 기술자료는 별도 포스트로 정리 예정


🧭 데이터 설계

문제 분류

유형 설명 난이도 추천 기술 및 모델
🧠 분류 (Classification) 이미지에 불량이 있는지 여부만 판단 ★☆☆ ResNet, EfficientNet
📍 위치 검출 (Detection) 이미지 내 불량의 위치와 경계 표시 ★★☆ YOLOv5, Faster R-CNN
⚠️ 이상 감지 (Anomaly Detection) 정상이 아닌 패턴을 자동 식별 (라벨 없이 비지도 학습) ★★★ AutoEncoder, GANomaly

데이터 구성 방식

모델 구조가 다르면 라벨링 방식과 데이터 디렉토리 구조도 달라진다.

모델 구조에 따라 데이터 구성 방식이 어떻게 달라지는지 궁금하다면
➡️ 데이터 구성 가이드 포스트 보기


🦋 증강과 전처리의 필요성

모델 학습에는 다양한 데이터를 생성하기 위해 Augmentation이 필요하다.
아래는 그 부연 설명과 전처리의 필요성에 관한 포스트이다.

➡️ Augmentation이 필요한 이유 보기


🧾 데이터셋 구성 전략

  • Train / Validation / Test 분할 비율을 정하고, 클래스 불균형 문제를 해결해야 한다.
  • 교차 검증(K-fold) 전략을 사용할 경우, 데이터 누수(Data Leakage)를 방지할 수 있도록 주의한다.

고려 포인트

  • 데이터셋 간 도메인 격차(domain drift)를 고려
  • 불균형 데이터 처리: 샘플링, 클래스 가중치 등 활용
  • 누수 방지: 이미지 중복 여부, 순서 기반 분할 방지

✅ 마무리

향후 “모델링 & 학습 평가”, “배포 & 운영” 단계에서 이 기획 내용이 기반이 된다.
기획 단계에서 탄탄한 구조를 세우는 것이 전체 프로젝트 완성도를 좌우한다.

left
right

C

Contents