기금넷 공식사이트 - 헤지 펀드 - 이미지 분할 알고리즘 요약

이미지 분할 알고리즘 요약

이미지 처리의 많은 작업은 이미지 분할과 불가분의 관계에 있습니다. 이미지 분할은 cv 에서 매우 중요하기 때문에 먼저 이미지 분할에 일반적으로 사용되는 알고리즘을 요약해 보겠습니다.

기계 학습과 심도 있는 학습 시간에 접촉하는 것은 짧지 않다. 나는 여러 가지 관련 지식을 보았지만 결코 총결한 적이 없다. 이 문장 후, 나는 엔지니어링 관점에서, 전통적인 기계 학습 알고리즘과 전통적인 컴퓨터 비주얼 라이브러리 알고리즘, 심도 있는 학습에 일반적으로 사용되는 알고리즘과 논문, 다양한 플랫폼의 모델 변환, 정량화 및 서비스 배포에 이르기까지 가능한 한 자세한 요약을 할 것이다.

일반적으로 사용되는 이미지 분할 알고리즘은 크게 다음 범주로 나눌 수 있습니다. 이미지의 에너지 표준, 가장자리 추적 및 기타 방법의 효과로 인해 특정 문제 만 해결할 수 있습니다. 효과는 이상적이지 않습니다. 여기서 자세히 설명하지 않습니다. 물론 이진화 자체도 간단한 이미지를 분할할 수 있습니다. 하지만 이진화 알고리즘에는 많은 것들이 있습니다. 문장 한 편을 만들어 보겠습니다. 여기서는 군말을 하지 않는다.

1. 가장자리 기반 이미지 분할 알고리즘:

이미지 그라데이션 기존 알고리즘 연산자를 사용하는 것은 Sobel, Roberts, prewitt, Laplace 및 canny 입니다.

이러한 알고리즘의 기본 사상은 적절한 컨볼 루션 산자를 사용하여 이미지를 컨볼 루션하는 것이다. 이미지에 해당하는 그라데이션 이미지를 얻을 수 있습니다. (이미지의 그라데이션 이미지가 산자 컨볼 루션을 통해 그림 1 을 얻을 수 있는 이유에 대해서는 아래 볼륨 및 역수의 개념을 검토하여 직접 유도해 보십시오. ) 이미지의 가장자리는 종종 이미지 픽셀 차이가 크고 그라데이션이 큰 곳이기 때문입니다. 따라서 적절한 컨볼 루션 커널을 통해 이미지의 그라데이션 이미지, 즉 이미지의 가장자리 이미지를 얻습니다. 2 차 산자의 유도는 1 차와 비슷하다. 장점: 기존의 산자 그라데이션 감지는 적절한 컨볼 루션 코어로 컨볼 루션하면 해당 가장자리 이미지를 빠르게 얻을 수 있습니다. 단점: 이미지의 가장자리가 반드시 정확하지는 않습니다. 복잡한 이미지의 그라디언트는 이미지의 가장자리뿐만 아니라 이미지 내부의 색상과 텍스처에도 나타날 수 있습니다.

-응? 심화 학습 방법에 기반한 hed 와 RCF 도 있습니다. 이러한 모든 네트워크는 동일한 심각한 결함을 가지고 있기 때문에 hed 네트워크만 예로 들 수 있습니다. Hed 는 FCN 및 VGG 를 기반으로 한 개선 사항입니다. 동시에 6 가지 손실을 도입하여 훈련을 최적화하고, 여러 단계의 가장자리를 여러 계층으로 출력한 다음, 하나의 훈련 가중치를 통해 각 레이어의 가장자리 결과를 융합합니다. Hed 네트워크 구조는 다음과 같습니다.

Github 의 hed 구현을 참조할 수 있는 비교적 완전한 그라데이션 맵을 얻을 수 있습니다. 장점: 이미지의 그라데이션 세부 사항과 가장자리 무결성이 기존의 가장자리 산자보다 훨씬 좋습니다. 그러나 hed 는 가장자리 이미지 내부의 가장자리를 잘 구분할 수 없습니다. 물론, 우리는 스스로 손실을 바꿀 수 있고, 외부 이미지 가장자리만 맞추려고 시도할 수 있다. 하지만 가장 치명적인 문제는 vgg 기반 hed 의 네트워크 표현 능력이 제한되어 있어 이미지가 배경과 가깝거나 이미지가 배경 부분과 융합된 사진에 대해서는 hed 가 무력해 보인다는 점이다.

지역 분할에 기반한 알고리즘;

일반적으로 사용되는 영역 분할 방법에는 유전 알고리즘, 영역 성장 알고리즘, 영역 분할 병합, 유역 알고리즘 등이 결합된 기존 알고리즘이 있습니다. 여기서 전통적인 알고리즘의 아이디어는 비교적 간단하고 이해하기 쉽다. 모르는 곳이 있으면 함께 공부에 대해 토론하는 것을 환영합니다. 여기서는 너무 많은 분석을 하지 않는다.

영역과 의미에 기반한 심도 있는 학습 분할 알고리즘은 이미지 분할 및 연구의 주요 방향입니다. 예를 들어 FCN 시리즈의 전체 볼륨 네트워크, 클래식 의료 이미지 분할에 일반적으로 사용되는 unet 계열, rcnn 계열 아래 발전한 maskrcnn, 18 끝 PAnet 등이 있습니다. 의미 기반 이미지 분할 기술은 의심할 여지 없이 이미지 분할 기술의 주류가 될 것이다.

그 중에서도 심도 있는 학습 의미에 기반한 다른 관련 알고리즘도 간접적으로 또는 직접 이미지 분할에 적용할 수 있습니다. 예를 들어, 고전적인 이미지 매트 문제. 18 에는 많은 훌륭한 알고리즘과 논문이 등장했다. 심도 있는 이미지 매트, MIT 의 의미 소프트 분할 (SSS) 은 매우 효과적입니다.

의미 기반 이미지 분할은 다른 기존 알고리즘보다 훨씬 우수합니다. 이미지 분할 문제를 해결할 때 처음으로 hed 네트워크를 사용해 보았습니다. 최종 효과는 이상적이지 않다. 저도 github 를 참고해서 hed 를 조금 미세 조정했지만 여러 번 시도한 후에도 위에서 언급한 이유로 포기했습니다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 스포츠명언) FCN 시리즈 네트워크로 전환합니다. 그러나 fcn 은 이미지와 배경 융합 문제를 해결할 수 없다. 융합 이미지의 분할에는 더 큰 감각과 융합되지 않은 원본 이미지 세부 사항이 모두 필요하기 때문에 단일 원본 FCN 네트워크를 정확하게 분할하기가 어렵습니다. 중간에 다른 많은 관련 네트워크를 테스트했는데 효과가 좋지 않다. 야생과 원본 이미지의 세부 사항을 고려하여 resnet 과 densenet 을 이미지 피쳐 추출의 기본 요소로 사용해 보십시오. 마지막으로 unet 시리즈 네트워크를 테스트했습니다.

Unet 의 원래 모델은 그림과 같습니다. 자신과 파충류의 사진을 찍어서 나는 거의 1000 장의 사진을 수집했다. 품질이 좋지 않은 사진과 내용이 비슷한 그림을 삭제하다. 파충류는 결국 160 여 장의 사진을 수집했다. 자체 사진을 찍고 200 장의 사진을 수집한 후 PS 를 사용하여 가장자리 이미지를 수동으로 업데이트하고 이미지 향상 변환, 약 300*24 의 사진을 사용합니다. 기본 unet 네트워크 성능은 비교적 일반적입니다. Unet 의 일반 컨볼 루션 레이어를 resnet 으로 변경하면 네트워크의 표현 능력이 크게 향상됩니다. Resnet 이 resnet 10 1 으로 변경되면 부분적으로 혼합된 이미지도 잘 분할할 수 있습니다. 그러나 unet 의 모델 볼륨은 허용되지 않습니다.

마지막 단계에서, 우리는 maskrcnn 의 인스턴스 분할을 보았다. Maskrcnn 은 RCNN rcnn, fasterrcnn 에서 개발되었습니다. 그래서 저는 maskrcnn 에 자신의 훈련 데이터와 라벨 사진을 추가하여 훈련을 했습니다. Maskrcnn 의 결과는 만족스럽지 않고 가장자리 위치는 다른 알고리즘에 비해 약간 거칠다. 제품 응용에서는 분명히 적합하지 않다. -응?

그래프 기반 분할 알고리즘

심도 있는 학습을 기반으로 한 Deepgrab 은 그다지 만족스럽지 않다. Deepgrab 의 git 작성자인 Backbone 은 DeepGrab BV2 의 네트워크 구조를 채택했습니다. 원지가 완전히 설치되지 않았습니다.

원래 주소 참조: https://arxiv.org/pdf/1707.00243.pdf. 。

전체 구조는 인코더 및 디코더와 유사합니다. Resent 10 1 기반 구조는 deeplab 의 모델 볼륨, 속도, 분할 정밀도 등에 대한 현재 요구 사항을 충족하지 못하기 때문에 아직 세심한 연구가 수행되지 않았습니다. 나는 이전에 컴퓨터 비전과 관련된 지식점을 대략적으로 요약했다. 모바일 터미널 모델에 대해 논의한 후에는 모듈에서 모바일 터미널 모델의 적용을 요약해 보겠습니다.

시간이 정말 제한되어 있기 때문이다. 여기서는 각 알고리즘을 자세히 설명하지 않습니다. 나중에 기본 기계 학습 알고리즘부터 시작하겠습니다.