머신 비전에서 실제값(ground truth)은 각 이미지 또는 비디오 프레임에 대한 정확한 레이블 또는 답을 의미합니다. 이러한 레이블은 시스템이 무엇이 옳고 그른지 학습하는 데 도움이 됩니다. 고품질 실제값은 정확도, 정밀도, 재현율, 그리고 균형 정확도를 측정하는 데 중요한 역할을 합니다. 교집합(Intersection over Union)이나 평균 정밀도(Mean Average Precision)와 같은 지표는 실제값에 기반하여 예측이 실제값과 일치하는지 확인합니다. 실제값 머신 비전 시스템은 이러한 신뢰할 수 있는 레이블을 사용하여 모델을 학습, 검증 및 테스트하여 실제 작업에서 결과의 신뢰성을 보장합니다.
주요 요점
- 기준 진실은 머신 비전 시스템이 학습하고 개선하는 데 도움이 되는 이미지와 비디오에 대한 올바른 레이블이나 답변을 의미합니다.
- 고품질 실제 데이터 정확하고 신뢰할 수 있는 결과를 보장하기 위해 모델을 학습, 검증, 테스트하는 데 필수적입니다.
- 인간의 전문 지식과 AI 도구를 결합하면 라벨링 속도가 빨라지고 실제 데이터의 품질이 향상됩니다.
- 명확한 지침, 정기적인 점검, 엄격한 품질 관리를 통해 실제 데이터의 일관성과 신뢰성이 유지됩니다.
- 다양하고 잘 검증된 기준 데이터를 사용하면 공정하고 안전하며 효과적인 머신 비전 시스템을 구축하는 데 도움이 됩니다.
머신 비전의 실제 진실
정의
Ground Truth는 머신 비전 작업에서 각 이미지, 비디오 프레임 또는 데이터 포인트에 대한 정답이나 레이블을 설명합니다. 머신 러닝에서 Ground Truth 데이터는 알고리즘이 학습하고 개선하는 데 사용하는 기준이 됩니다. 전문가 또는 훈련된 주석 작성자는 일반적으로 카메라나 기타 센서의 이미지를 면밀히 검토하여 이러한 레이블을 생성합니다. 이들은 객체 주위에 상자를 그리거나, 텍스트 인식을 위한 영역을 표시하거나, 이미지의 각 부분에 범주를 할당할 수 있습니다.
실제 데이터에는 경계 상자, 분할 마스크, 심지어 객체의 세부 윤곽까지 포함될 수 있습니다. 예를 들어, 텍스트 인식에서 주석 처리기는 사진 속 단어나 글자의 정확한 위치를 강조 표시합니다. 이 과정에서는 Labelbox나 Clarifai와 같은 주석 플랫폼을 자주 사용하며, 이러한 플랫폼은 레이블링 작업을 관리하고 체계화하는 데 도움을 줍니다. 실제 데이터의 정확성은 명확한 목표, 신중한 레이블링, 그리고 엄격한 품질 검증에 달려 있습니다.
아래 표는 일반적인 유형의 기준 데이터와 그 용도를 보여줍니다.
실제 데이터 유형 | 사용 사례 예시 | 상품 설명 |
---|---|---|
경계 상자 | 카메라에서의 객체 감지 | 자동차, 사람 또는 동물 주위에 사각형을 그립니다. |
분할 마스크 | 의료 영상, 농업 | 각 픽셀을 종양 또는 식물의 일부로 표시합니다. |
텍스트 주석 | 문서의 텍스트 인식 | 스캔한 이미지에서 단어나 문자를 강조 표시합니다. |
이진 레이블 | 공장의 품질 관리 | 항목을 "불량" 또는 "양호"로 표시하세요 |
중요성
실제 데이터(Ground Truth)는 머신 비전 시스템 구축 및 테스트에서 핵심적인 역할을 합니다. 정확한 실제 데이터가 없으면 모델은 객체를 인식하고, 텍스트를 읽고, 신뢰할 수 있는 예측을 수행하는 방법을 학습할 수 없습니다. 고품질 실제 데이터는 시스템의 작동 상태를 측정하고 개선 방향을 제시하는 데 도움이 됩니다.
- 머신러닝 모델은 정답 데이터를 학습 데이터로 사용합니다. 이를 통해 정답과 오답을 구분하는 능력을 학습할 수 있습니다.
- 텍스트 인식에서 기준 실측 라벨은 각 단어가 나타나는 정확한 위치를 보여줍니다. 이는 시스템이 카메라에서 들어오는 새로운 이미지를 읽는 법을 배우는 데 도움이 됩니다.
- 실제 데이터는 다음과 같은 주요 지표를 지원합니다. 정확도, 정밀도, 재현율 및 F1 점수이러한 지표는 팀이 다양한 모델을 비교하고 가장 적합한 모델을 선택하는 데 도움이 됩니다.
최근 연구에서는 실제 환경에서 기준 진실이 머신 비전을 어떻게 개선하는지 보여주었습니다.
- MNIST 및 CIFAR-10과 같은 벤치마크 데이터 세트는 기준 진실 레이블을 사용하여 시스템 출력과 정답을 비교합니다.
- 정확도, 정밀도, 재현율, AUC와 같은 측정항목은 시스템이 얼마나 개선되는지 측정합니다.
- A/B 테스트는 데이터를 두 그룹으로 나누어 새로운 시스템을 공정하게 테스트합니다.
- p값과 신뢰 구간과 같은 통계적 검정을 통해 개선이 실제인지 확인할 수 있습니다.
- 코헨의 d와 같은 효과 크기 측정 기준은 변화의 실질적인 영향을 보여줍니다.
- 한 전자 제조업체는 실제 데이터를 사용하여 결함 감지율을 93.5%에서 97.2%로 개선했으며, 다른 작업에 부정적인 영향을 미치지 않았습니다.
- 실험에서는 신뢰할 수 있는 결과를 보장하기 위해 동일한 조건과 대규모 표본 크기를 사용했습니다.
- 실제 데이터를 바탕으로 성공을 정의하고, 공정한 테스트 그룹을 준비하며, 개선 사항을 검증했습니다.
아래 표는 기준 진실이 어떻게 다양한 평가 지표를 지원하는지 보여줍니다.
메트릭 | 평가에서의 역할 | 실제 사례 |
---|---|---|
정확성 | 정확한 예측을 측정합니다 | 높은 정확도는 강력한 성능을 의미합니다 |
Precision | 예측된 양성 결과 중에서 실제 양성 결과를 계산합니다. | 높은 정밀도로 잘못된 경보 감소 |
소환 | 모든 실제 양성 중에서 참 양성을 계산합니다. | 높은 리콜률로 더 많은 실제 사례 포착 |
F1 점수 | 정밀도와 재현율의 균형을 맞춥니다. | 불균일한 데이터에 유용합니다 |
Union 교차로 | 예측 위치와 실제 위치 사이에 중복되는 부분이 있습니다. | 카메라를 이용한 객체 감지에 중요 |
평균 평균 정밀도 | 클래스 및 임계값에 따른 평균 정밀도 | 텍스트 인식 및 객체 감지에 사용됨 |
주사위 계수 | 세분화 작업의 유사성 측정 | 의료 영상에서 흔히 볼 수 있는 |
Jaccard 색인 | 세분화에서 중복을 비교합니다 | 농업의 품질 검사에 사용됨 |
- 팀은 이중 통과 라벨링 및 전문가 검토와 같은 엄격한 라벨링 방법을 사용하여 기준 진실 정확도를 개선합니다.
- 전문가 검증을 통한 크라우드소싱은 텍스트 인식과 같은 작업에 대한 데이터 품질을 높입니다.
- 주석 플랫폼은 프로세스를 모니터링하고 실수를 조기에 포착하는 데 도움이 됩니다.
실제 데이터는 다양한 연령이나 배경 등 다양한 집단의 이미지를 포함함으로써 편향을 줄이는 데 도움이 됩니다. 이를 통해 모델이 모든 사람에게 효과적으로 작동하고 드물지만 중요한 사례도 처리할 수 있습니다. 텍스트 인식에서 실제 데이터에 대한 명확한 레이블을 사용하면 모델이 특정 결정을 내린 이유를 더 쉽게 이해할 수 있습니다.
모델 개발에서의 역할
훈련 및 검증
Ground Truth는 모든 Ground Truth 머신 비전 시스템 개발에 중요한 역할을 합니다. 훈련, 머신 러닝 모델 실제 데이터를 사용하여 이미지 분류, 객체 감지 또는 텍스트 인식 방법을 학습합니다. 예를 들어, 객체 감지에서 모델은 각 차량 또는 트럭 주변에 경계 상자가 그려진 차량 이미지를 수신합니다. 모델은 추측된 값을 실제 값 레이블과 비교하여 이러한 차량을 식별하는 방법을 학습합니다.
다음은 검증입니다. 팀은 별도의 실제 데이터 세트를 사용하여 모델의 성능을 확인합니다. 이 단계는 모델 설정을 미세 조정하고 최적의 알고리즘을 선택하는 데 도움이 됩니다. 텍스트 인식에서 검증 데이터는 모델이 보이지 않는 이미지에서 새로운 단어나 문자를 읽을 수 있는지 보여줍니다. 모델에 오류가 있는 경우, 엔지니어는 실제 데이터와 더 일치할 때까지 모델을 조정합니다.
실제 사용자별로 데이터를 그룹화하는 사용자 수준 데이터 분할은 모델이 실제 환경에서 얼마나 잘 작동할지에 대한 더 정확한 예측을 제공합니다. 이 방법은 실제 그룹화를 존중하여 더 정확한 검증 결과를 도출합니다. 또한, 모델이 새로운 데이터에 대해 더 잘 일반화되도록 도와줍니다.
정확도, 정밀도, 재현율, F1 점수와 같은 성능 지표는 모두 실제값(ground truth)에 따라 달라집니다. 팀은 모델의 예측값을 실제값 레이블과 비교하여 모델의 학습 효율을 확인합니다. 예를 들어, 첨단 운전자 보조 시스템에서 모델은 차량, 보행자, 도로 표지판을 감지해야 합니다. 실제값 데이터는 각 물체의 정확한 위치를 보여주므로, 모델은 안전한 의사결정을 내리는 법을 학습할 수 있습니다. 이러한 과정은 실제 주행에서 안전성과 신뢰성을 보장합니다.
아래 표는 기준 진실이 어떻게 다양한 머신 비전 작업을 지원하는지 보여줍니다.
태스크 | 실제 진실 예제 | 모델 출력 비교… |
---|---|---|
객체 감지 | 차량 주변의 경계 상자 | 예측된 상자 |
이미지 분할 | 도로 및 보도용 픽셀 마스크 | 예측 마스크 |
텍스트 인식 | 거리 표지판의 단어 위치 | 예측된 텍스트 위치 |
운전자 모니터링 | 머리 자세와 시선 방향 | 예상 운전자 주의 |
정확한 지상 실측 데이터를 포함하는 고품질 학습 데이터와 검증 데이터는 모델 성능에 직접적인 영향을 미칩니다. 팀이 잘 구조화된 지상 실측 데이터를 사용하면 더 나은 기준 예측과 향상된 검증 결과를 얻을 수 있습니다. 지상 실측 데이터와 모델 성능 간의 이러한 연관성은 많은 머신러닝 프로젝트에서 명확하게 드러납니다.
테스트 및 교정
테스트 및 캘리브레이션은 실제 머신 비전 시스템이 생산에 들어가기 전 마지막 단계입니다. 개발팀은 테스트 데이터라고 불리는 새로운 실제 데이터 세트를 사용하여 모델이 이전에 본 적이 없는 이미지에서 얼마나 잘 작동하는지 측정합니다. 이 단계에서는 모델이 새로운 차량, 도로 풍경 또는 텍스트 인식 작업에 일반화할 수 있는지 확인합니다.
보정은 모델의 신뢰도 점수가 실제 결과와 일치하는지 확인합니다. 예를 들어, 모델이 차량 존재 여부를 90% 확신한다고 가정하면 약 90%의 확률로 정확해야 합니다. 제조 분야에서 Philips Consumer Lifestyle BV와 같은 회사는 테스트 및 보정에 실제 값을 사용하면 품질 저하 없이 라벨링 작업을 3~4% 줄일 수 있음을 보여주었습니다. 이들은 보정 플롯과 지표를 사용하여 모델의 예측이 실제 값과 일치하는지 확인합니다. 팀이 새로운 보정 방법을 사용하더라도 실제 값은 모델 품질을 확인하는 데 있어 여전히 중요한 기준입니다.
실제 데이터는 모든 성능 점검에서 신뢰할 수 있는 기준이 됩니다. 팀은 예측값을 실제 데이터와 비교하여 정밀도, 재현율, 평균 제곱근 오차와 같은 지표를 계산합니다. 또한 데이터 드리프트(데이터 표류)를 모니터링하는데, 이는 모델의 예측값이 시간이 지남에 따라 실제 데이터와 달라지는 것을 의미합니다. 이러한 현상이 발생하면 팀은 정확도를 높게 유지하기 위해 최신 실제 데이터를 사용하여 모델을 재학습합니다.
차선 유지 및 충돌 경고와 같은 고급 ADAS 기능에서 지상 실측 데이터는 시스템이 모든 조건에서 차량과 도로 위험 요소를 감지할 수 있도록 보장합니다. 운전자 모니터링 시스템은 지상 실측 데이터를 사용하여 모델이 운전자의 시선 방향을 추적할 수 있는지 확인합니다. 이를 통해 시스템이 모든 운전자에게 제대로 작동하도록 보장하여 안전성을 향상시킵니다.
지도 학습은 모든 단계에서 실제 데이터에 의존합니다. 학습부터 테스트까지, 실제 데이터는 모델을 안내하고, 진행 상황을 확인하며, 실제 작업에서 모델의 신뢰성을 유지합니다.
실제 데이터 수집
출처 및 방법
지상 실측 데이터는 머신 비전 분야의 다양한 소스에서 수집됩니다. 카메라, 라이더, 레이더가 가장 일반적인 센서입니다. 카메라는 색상과 질감을 포착하여 객체 분류 및 장면 이해에 유용합니다. 라이더는 레이저 펄스로 거리를 측정하여 상세한 3D 지도를 생성합니다. 레이더는 거리와 속도를 감지하며 악천후에서도 잘 작동합니다. 테스트 차량은 종종 이 세 가지 센서를 함께 사용합니다. 이러한 조합은 개발자가 센서 출력을 비교하고 실제 환경에서 지상 실측 데이터와 일치시키는 데 도움이 됩니다. 연구에 따르면 라이더는 고해상도 3D 매핑을 제공하는 반면, 레이더는 비나 안개 속에서도 뛰어난 성능을 발휘합니다. 카메라는 객체 인식에는 뛰어나지만 깊이와 악천후에는 어려움을 겪을 수 있습니다. 이러한 센서의 데이터를 융합하면 정확도와 신뢰성이 향상되며, 특히 첨단 운전자 보조 시스템(ADAS) 및 고급 ADAS 기능에서 더욱 그렇습니다.
연구자들은 여러 가지 방법을 사용하여 실제 데이터를 수집합니다.
- 컴퓨터 그래픽으로 생성된 합성 데이터 세트
- 테스트 차량에서 수집된 실제 데이터 세트
- AI 도구를 사용한 자동 주석
- 숙련된 전문가의 수동 주석
- 인간과 기계의 입력을 혼합한 결합된 접근 방식
IEEE PAMI와 같은 주요 저널과 Mikolajczyk 및 Schmidt 방법론과 같은 프레임워크는 실제 사실을 얻기 위한 모범 사례를 안내합니다.
라벨링 및 주석
레이블링과 주석은 원시 센서 데이터를 사용 가능한 지상 실측 데이터로 변환합니다. 주석 작성자는 카메라, 라이더, 레이더 이미지에 상자를 그리거나, 영역을 표시하거나, 지점에 레이블을 지정합니다. 고급 주석 도구 Amazon SageMaker Ground Truth, Keylabs, SuperAnnotate와 같은 도구는 이러한 프로세스의 속도를 높이는 데 도움이 됩니다. 이러한 도구는 AI를 사용하여 레이블을 제안하고, 담당자가 이를 확인하고 수정합니다. MIT와 Google의 연구에 따르면 레이블 지정에서 사소한 오류라도 모델 정확도를 몇 퍼센트까지 낮출 수 있습니다. 명확한 지침, 전문가 교육, 그리고 품질 검사를 통해 주석의 신뢰성을 향상시킬 수 있습니다. 의료 및 자율주행차와 같은 산업은 이러한 고급 기법의 이점을 활용하여 모델 성능을 향상시킵니다.
팁: 인간의 전문 지식과 AI 지원 도구를 결합하면 오류가 줄어들고 대규모 데이터 세트에 레이블을 지정하는 속도가 빨라집니다.
도전
실제 데이터(ground truth data)를 얻는 데는 여러 가지 어려움이 따릅니다. 주관성은 주석 작성자가 이미지에 레이블을 지정하는 방식에 영향을 미칠 수 있으며, 특히 객체가 불분명하거나 겹치는 경우 더욱 그렇습니다. 대규모 팀이나 시간이 지남에 따라 일관성을 유지하기는 어렵습니다. 데이터 세트가 카메라, 라이더, 레이더에서 수집한 수백만 장의 이미지로 증가함에 따라 확장성 문제가 발생합니다. 양적 연구는 표본 편향, 데이터 손실, 인간과 자동화된 레이블 간의 불일치와 같은 문제를 강조합니다. 적절한 평가 지표를 선택하는 것 또한 중요합니다. 예를 들어, 의료 영상이나 농업 분야에서는 일부 지표가 전문가의 판단과 일치하지 않을 수 있습니다. 신중한 표본 추출 전략과 정기적인 품질 점검을 통해 이러한 문제를 해결할 수 있지만, 실제 데이터를 얻는 것은 여전히 복잡한 작업입니다.
Ground Truth 머신 비전 시스템의 품질
라벨링 지침
명확한 라벨링 가이드라인은 팀이 머신 비전을 위한 신뢰할 수 있는 기준 진실 데이터를 생성하는 데 도움이 됩니다. 팀은 각 라벨 유형에 대한 예시를 포함한 자세한 지침을 작성합니다. 이 지침은 텍스트 인식 작업에서 차량이나 단어와 같은 객체를 표시하는 방법을 설명합니다. 주석 담당자는 이러한 단계를 따라 실수를 줄이고 결과의 일관성을 유지합니다. 정기적인 교육 및 피드백 세션을 통해 주석 담당자는 업데이트를 이해하고 반복적인 오류를 방지할 수 있습니다. 팀은 종종 두 번째 담당자가 각 라벨을 검토하는 이중 확인을 수행합니다. 또한 코헨의 카파와 같은 지표를 사용하여 주석 담당자 간의 일치도를 측정합니다. 일치도가 높으면 기준 진실 데이터가 신뢰할 수 있음을 의미합니다.
팁: 새로운 오류가 발생하면 지침을 업데이트하세요. 이렇게 하면 작업 변경 시에도 기준 머신 비전 시스템의 정확성을 유지할 수 있습니다.
인간-기계 협업
인간의 기술과 기계의 도움을 결합하면 라벨링 속도와 정확도가 향상됩니다. 인간 참여형(Human-in-the-Loop) 시스템을 통해 전문가는 AI 도구가 제안한 라벨을 검토하고 수정할 수 있습니다. 이러한 팀워크는 오류를 포착하고 실제 데이터의 품질을 향상시키는 데 도움이 됩니다. 실시간 협업을 통해 팀은 특히 차량이나 텍스트 인식 과제가 포함된 복잡한 이미지에서 실수를 신속하게 수정할 수 있습니다. 능동 학습 전략은 AI를 활용하여 인간이 라벨링할 가장 중요한 샘플을 선택합니다. 의사 라벨링과 같은 하이브리드 방식은 인간의 판단과 자동화된 제안을 결합합니다. 이러한 접근 방식은 팀이 소규모 데이터 세트에서 종종 77% 이상의 높은 정확도를 달성하고, 정밀도와 재현율이 균형을 이루도록 지원합니다.
검증 및 제어
강력한 검증 및 제어 프로세스를 통해 실제 데이터(ground truth data)의 신뢰성을 유지합니다. 팀은 예방적 조치와 사후 대응적 조치를 모두 활용합니다. 예방적 조치에는 숙련된 주석 작성자 고용, 엄격한 절차 준수, 그리고 자동화 도구를 사용하여 오류를 조기에 포착하는 것이 포함됩니다. 사후 대응적 조치에는 오류 확인, 피드백 제공, 그리고 프로세스 업데이트가 포함됩니다. 팀은 벤치마크를 설정하고 품질 지표 진행 상황을 추적합니다. 데이터 품질, 모델 정확도, 그리고 공정성을 측정하여 문제를 파악합니다. 정기적인 감사와 다층적인 검토를 통해 높은 기준을 유지합니다. 일부 조직은 사람의 확인과 자동화된 제어를 결합하여 98~99.99%의 정확도를 달성합니다.
메트릭 카테고리 | 지표/벤치마크 | 목적/Ground Truth 머신 비전 시스템과의 관련성 |
---|---|---|
데이터 품질 | 누락된 값, 유형 불일치, 범위 위반의 비율 | 신뢰할 수 있는 기준 진실 및 모델 입력 데이터 품질에 중요한 입력 데이터 무결성을 보장합니다. |
모델 품질 | 정확도, 정밀도, 재현율, F1 점수(분류), MAE, MSE(회귀) | 실제 기준 정렬 및 모델 정확성을 검증하는 데 필수적인 예측 성능 측정 |
세그먼트별 성과 | 코호트 또는 슬라이스(예: 고객 그룹, 위치)에 대한 평가 | 실제 결과나 데이터 문제를 나타낼 수 있는 모델 성능의 변화를 감지합니다. |
프록시 메트릭 | 기준 진실이 지연될 때의 휴리스틱(예: 클릭되지 않은 추천의 비율) | 실제 레이블을 사용할 수 없는 경우 모델 저하의 초기 신호를 제공합니다. |
드리프트 감지 | 입력 드리프트(특징 분포 변화), 출력 드리프트(예측 분포 변화) | 기준 진실 관련성과 모델 정확도를 저하시킬 수 있는 데이터 또는 모델 동작의 변화를 모니터링합니다. |
공정성과 편견 | 예측 패리티, 동등 확률, 통계적 패리티 | 모델이 차별하지 않도록 보장하고 실제 데이터 세트와 모델 출력의 공정성과 신뢰성을 유지합니다. |
다양하고 검증된 레이블을 포함하는 골든 데이터 세트를 생성하면 팀에게 강력한 벤치마크를 제공할 수 있습니다. 이를 통해 취약점을 파악하고 실제 환경에서 사용할 수 있도록 머신 비전 시스템을 개선하는 데 도움이 됩니다.
정확한 지상 실측 데이터는 머신 비전 시스템의 핵심입니다. 고품질 데이터는 모델이 차량을 감지하고 실제 작업의 안전을 지원하는 데 도움이 됩니다. 팀은 강력한 데이터 관리 및 정기적인 점검에 집중해야 합니다.
개선을 위한 다음 단계:
- 라벨링 가이드라인 검토
- 주석을 위한 새로운 도구 사용
- 최근의 실제 사실에 대한 연구를 연구하세요
신뢰할 수 있는 실제 결과는 더 나은 결과와 더 안전한 기술로 이어집니다.
자주 묻는 질문
머신 비전에서 기준 진실이란 무엇인가?
Ground Truth는 각 이미지나 비디오에 대한 정답을 의미합니다. 전문가들은 객체, 텍스트 또는 영역에 레이블을 지정하여 이러한 정답을 생성합니다. 머신 비전 시스템은 Ground Truth를 사용하여 예측을 학습하고 확인합니다.
AI 모델에 있어서 기준 진실이 중요한 이유는 무엇입니까?
Ground Truth는 AI 모델이 무엇이 옳고 그른지 판단하는 데 도움을 줍니다. 모델은 추측한 값을 Ground Truth 레이블과 비교합니다. 이 과정은 정확도가 향상됩니다 팀이 진행 상황을 측정하는 데 도움이 됩니다.
팀은 어떻게 실제 데이터를 수집하나요?
팀은 카메라, 라이더 또는 레이더를 사용하여 이미지를 수집합니다. 주석 도구 객체나 텍스트에 라벨을 붙이는 데 사용됩니다. 때로는 더 빠른 결과를 위해 사람의 작업과 AI의 제안을 결합하기도 합니다.
팀은 실제 사실과 관련해 어떤 어려움에 직면합니까?
팀은 종종 이미지 불분명, 라벨링 담당자 간의 의견 차이, 그리고 방대한 데이터와 같은 문제에 직면합니다. 일관된 지침과 정기적인 점검은 이러한 문제를 줄이는 데 도움이 됩니다.
기계가 스스로 기준 데이터에 레이블을 지정할 수 있을까요?
기계가 AI를 사용하여 라벨을 제안할 수 있지만, 대부분의 라벨은 여전히 사람이 검토하고 수정합니다. 사람이 직접 확인하므로 데이터의 정확성과 신뢰성이 유지됩니다.