기금넷 공식사이트 - 복권 조회 - 3D ResNet 관련 논문 해석 및 모델 테스트

3D ResNet 관련 논문 해석 및 모델 테스트

비디오 데이터 처리에서 3DCNN의 우수한 성능으로 인해 3D 컨볼루션이 ResNet 네트워크에 도입되었습니다. 3D-ResNet은 ActivityNet과 Kinetics에서 학습되었으며, ActivityNet에서는 과적합이 발생한 반면, 많은 양의 데이터가 있는 Kinetics에서는 C3D 및 기타 네트워크보다 성능이 더 좋은 것으로 나타났습니다.

ImageNet에서 사전 학습된 모델이 널리 사용되기 때문에 저자는 2DCNN 사전 학습된 모델의 성공을 모방하고 3DResNet 기반의 Kinetics에서 사전 학습 결과를 제공하고자 합니다.

저자는 ResNet-18을 기반으로 다양한 데이터 세트에 대한 테스트를 수행했으며 18개 레이어만 있는 네트워크가 소수의 데이터 세트 UCF101, HMDB-51 및 ActivityNet에 대해 과적합을 수행한다는 것을 증명했습니다. 가장 많은 양의 데이터를 보유한 Kinects에서 최고입니다. UCF101과 같은 소규모 데이터 세트에서 더 높은 정확도를 얻으려면 Kinects 사전 훈련된 모델을 기반으로 미세 조정할 수 있습니다. 아래 사진은 UCF101과 HMDB-51을 미세조정한 결과입니다: