Kilka egzemplarzy tego samego obiektu po wykryciu obrazów przy użyciu CNN

Question 1

Nowy w NN's. CNN można nauczyć wykrywać jeden obiekt na obrazie. Jednak co zrobić, jeśli każdy obraz w zestawie danych może zawierać dowolną n # obiektów. Nie tworzy, czy to problem dla CNNS, ponieważ wyjściowy gęsta warstwa powinna być stałym rozmiarze? Jak można rozwiązać ten problem?

Na przykład: Powiedzmy, że losowo wybrał 2 zdjęcia z tego zestawu. Obraz 1 zawiera 2 obiektu, a obraz 2 zawiera 5 obiektów. Etykieta y dla img1 będzie zawierać współrzędne ograniczające ramy dla 2 obiektów; etykieta y dla img2 będzie zawierać współrzędne dla 5 obiektów-wektor y o wiele więcej, niż img1.

Możliwe rozwiązanie? :

Trzeba by było znaleźć zdjęcie z największą liczbą obiektów (należy to wartość "M"). Załóżmy również, że obiekt ma 4 współrzędne. Jeśli M = 5, potrzebuję wektor y jest równa 20. Jeśli obraz zawiera 1 obiekt wektor y będzie zawierać 4 niezerowych wartości I 16 zerowych wartości. 4 niezerowych wartości będą reprezentować współrzędne, a 16 zerowych wartości będą reprezentować współrzędne innych nieistniejących obiektów.

Question 2

Podstawowym sposobem klasyfikacji wielu obiektów jest wykorzystanie segmentacji. Odbywa się to poprzez segmentacja obrazu wejściowego na kilka dziedzin i transmisji każdego obszaru w sieć neuronową.

Jest to jednak bardzo prosty sposób, a obecnie istnieje wiele zaawansowanych algorytmów, które wykonują segmentację automatycznie.

Zazwyczaj klasyfikacja kilka obiektów decyduje się w dwóch etapach: najpierw łódź oferty dziedzinie, aby odgadnąć, jakie części obrazu zawierają obiekt.

Drugi - to algorytm klasyfikacji dostępnych regionów.

źródło img

Reda El Hail · Answer 1 · 2021-11-21T05:58:06

Podstawowym sposobem klasyfikacji wielu obiektów jest wykorzystanie segmentacji. Odbywa się to poprzez segmentacja obrazu wejściowego na kilka dziedzin i transmisji każdego obszaru w sieć neuronową.

Jest to jednak bardzo prosty sposób, a obecnie istnieje wiele zaawansowanych algorytmów, które wykonują segmentację automatycznie.

Zazwyczaj klasyfikacja kilka obiektów decyduje się w dwóch etapach: najpierw łódź oferty dziedzinie, aby odgadnąć, jakie części obrazu zawierają obiekt.

Drugi - to algorytm klasyfikacji dostępnych regionów.

źródło img

Coś takiego, jak szybciej R-CNN przeprowadza segmentację za pomocą RPN do ekstrakcji cech, które uważa za istotne? Czy dobrze to rozumiem? Poza tym, jak będzie wyglądać wektor y, biorąc pod uwagę, że dla obrazów istnieją zmienne barwne prognozowania.

Kilka egzemplarzy tego samego obiektu po wykryciu obrazów przy użyciu CNN

Pytanie

Najlepsza odpowiedź

W innych językach

Ta strona jest w innych językach

Popularne w tej kategorii

Najczęściej zadawane pytania w tej kategorii