프로젝트 주제
Byte Degree 과제로 진행했던 URBANSOUND8K 음성 분류 프로젝트입니다.
데이터 설명
텐서플로우 데이터셋 중 하나인 URBANSOUND8K 입니다. 기계 학습 및 음향 처리 연구를 위해 개발된 대규모 음향 데이터 세트입니다. 이 데이터 세트는 도시 환경에서 녹음된 10개의 오디오 클래스를 포함하고 있습니다. 10개의 클래스는 다음과 같습니다.
A numeric identifier of the sound class:
0 = air_conditioner
1 = car_horn
2 = children_playing
3 = dog_bark
4 = drilling
5 = engine_idling
6 = gun_shot
7 = jackhammer
8 = siren
9 = street_music
Self-Feedback
•
모델이나 하이퍼파라미터 튜닝을 다방면으로 진행하지 못한 점이 아쉽고, unbalanced dataset 이기 때문에 confusion matrix , AUC, ROC 등을 시각화한 부분을 따로 보고서에 추가했는데 이를 한 파일 안에 녹여내지 못한 점이 아쉽게 느껴집니다.
.png&blockId=c1d34259-a859-4dca-a9da-6dc03aa171b4)
.png&blockId=a7549b16-9010-433d-ad2a-fd69d1a198fa)
.png&blockId=a7549b16-9010-433d-ad2a-fd69d1a198fa&width=256)
