Witam wszystkich, poszukuje jakichś ciekawych informacji na temat splotowych sieci neuronowych (CNN- Convolutional Neural Network). Zaimplementowałem i zbudowałem już kilka wielowarstwych sieci o wstecznej propagacji błedów. Chciałbym zbudować teraz sieć CNN, czy może mi ktoś wyjaśnić jakie są różnice pomiędzy tymi sieciami? Chciałbym zobaczyć jakiś ogólny schemat jak to wygląda itp..
Dzieki za material, chodz przyznam ze nie rozumie jeszcze kilku spraw. Po pierwsze gdybym mial inne okno wejsciowe tj 20x20 pix to jak mam dobrac ilosc map w warstwie drugiej i trzeciej, jak dobrac ich rozmiar oraz rozmiar kernela itd..
Po drugie (to tak dla pewnosci) czy piksele(neurony) z kernela to sa wejscia do jednego neuronu (+bias) w mapie ?
Trzecie: Dlaczego kernel przeskakuje co 2 piksele?
DarekCV napisał(a)
Dzieki za material, chodz przyznam ze nie rozumie jeszcze kilku spraw. Po pierwsze gdybym mial inne okno wejsciowe tj 20x20 pix to jak mam dobrac ilosc map w warstwie drugiej i trzeciej, jak dobrac ich rozmiar oraz rozmiar kernela itd..
Rozmiar taki, żeby dało się symetrycznie dobrać kernele (wielkość kernela oraz przesunięcie). Ilość map jest dowolna - kwestia eksperymentowania (u mnie taka liczba jest dlatego, że w tutorialu taka była).
DarekCV napisał(a)
Po drugie (to tak dla pewnosci) czy piksele(neurony) z kernela to sa wejscia do jednego neuronu (+bias) w mapie ?
Tak, neuron w mapie jest połączony z kernelem oraz z biasem.
DarekCV napisał(a)
Trzecie: Dlaczego kernel przeskakuje co 2 piksele?
Podobno daje to lepsze "wyniki" - pozwala dostrzec elementy pisma. Gdyby kernele były odosobnione (bez części wspólnych), pewne elementy mogłyby być nierozpoznane, jeśli leżałyby akurat na granicy dwóch kerneli. "Część wspólna" o szerokości/wysokości równej 2 wydaje się być odpowiednia.
Ok, a co z współdzielonymi wagami skoro mamy 13x13 neuronow w jednej mapie a map jest 6 to mamy1014 neuronow po 25+1 polaczen do kernela to powinno byc 26364 połaczen. Po tym co przeczytalem tutaj : http://www.codeproject.com/KB/library/NeuralNetRecognition.aspx?display=Print troche zglupialem, w tym tutorialu pisza ze dla tych 26364 polaczen jest 156 wag. Nie za bardzo wiem jak one sa wspoldzielone myslalem ze skoro jest 13 przesuniec w rzedzie i 13 w kolumnie to powinno byc ich 169?