Amazon SageMaker Clarify – 데이터 편향성 감지를 통한 기계 학습 모델의 투명성 개선
Amazon SageMaker Clarify – 데이터 편향성 감지를 통한 기계 학습 모델의 투명성 개선 오늘 Amazon SageMaker Clarify를 발표하게 되어 매우 기쁩니다. Amazon SageMaker의 새로운 기능인 Clarify는 이해관계자와 고객에게 모델의 동작을 설명함으로써 기계 학습(ML) 모델의 바이어스를 감지하고 투명성을 개선하는 데 도움이 됩니다. 데이터 세트에 존재하는 통계 패턴을 학습하는 훈련 알고리즘에 의해 ML 모델이 구축되기 때문에 몇 가지 질문이 즉시 떠오릅니다. 첫째, ML 모델이 특정 예측을 제시하는 이유를 설명할 수 있다면 좋지 않을까? 둘째, 모델링하려는 실제 문제가 데이터 세트로 충실히 설명되지 않는다면 어떻게 될까? 이러한 문제를 감지할 수는 있을까? 이러한 문제로 인해 감지할 수 없는 방식으로 일종의 바이어스가 발생하지는 않을지. 이러한 질문들은 추측에 근거한 것이 절대 아닙니다. 매우 현실적이며 그 영향의 범위는 매우 넓을 수 있습니다. 바이어스 문제부터 시작합시다. 비정상적인 신용 카드 거래를 감지하는 모델을 연구하고 있다고 가정합시다. 다행히 대다수의 거래는 합법적이며 데이터 세트의 99.9%를 차지합니다. 즉, 십만 개 중에서 100개인 0.1%만 [ more… ]