Witam,
używam dwóch GPU w sieci neuronowej, ale powoduje to strasznie spowolnienie porównując z innym komputerem z jednym GPU. Jak mogę wyłączyć jeden GPU?
Linux Ubuntu.
W czym symulujesz tę Twoją sieć?
Z jakim GPU porównujesz?
Może to Twoje jest po prostu znacznie słabsze? ;-p
Nie mam pojęcia co się dzieje. TITAN MA 12GB a GTX 1050 4GB.... To nie 11 min., a 3 min. powinno trwać uczenie.
GTX1050:
Epoch 1/1
200/200 [==============================] - 490s 2s/step - loss: 1.8045 - rpn_class_loss: 0.0629 - rpn_bbox_loss: 0.4044 - mrcnn_class_loss: 0.3132 - mrcnn_bbox_loss: 0.5639 - mrcnn_mask_loss: 0.4601 - val_loss: 2.6684 - val_rpn_class_loss: 0.0712 - val_rpn_bbox_loss: 1.0801 - val_mrcnn_class_loss: 0.3276 - val_mrcnn_bbox_loss: 0.6830 - val_mrcnn_mask_loss: 0.5066
CPU times: user 12min 22s, sys: 29.9 s, total: 12min 51s
Wall time: 8min 40s
GTX TITAN X:
Epoch 1/1
200/200 [==============================] - 461s 2s/step - loss: 1.7415 - rpn_class_loss: 0.0592 - rpn_bbox_loss: 0.4563 - mrcnn_class_loss: 0.2490 - mrcnn_bbox_loss: 0.5253 - mrcnn_mask_loss: 0.4517 - val_loss: 1.9419 - val_rpn_class_loss: 0.0657 - val_rpn_bbox_loss: 0.6273 - val_mrcnn_class_loss: 0.2827 - val_mrcnn_bbox_loss: 0.5468 - val_mrcnn_mask_loss: 0.4194
CPU times: user 4min 34s, sys: 7.73 s, total: 4min 42s
Wall time: 10min 32s
network: Mask RCNN
Keras version: 2.2.4
Tensorflow version: 1.12.0
CUDA Version 9.0.176
cudnn 7.0.5
Zdajesz sobie sprawę, że rozmiar VRAM nie robi praktycznie żadnej różnicy? ;-p
Patrz na taktowanie zegarów, liczbę rdzeni CUDA, prędkość szyn itd.
na poczatek to bym wyjał jedna karte i sprawdził czy rzeczywiście przypuszczenia sa trafne.
Nie są. Wyłączyłem używając keras jedną karte. Czas ten sam. Więc nie wiem, co jest grane. Dlaczego tak się dzieje.
To co zauważyłem to że ta słabsza karta cały czas stałym tempem działa, a da druga: szybko 1,2,3,4,5 a potem na 6 sie zawiesza na 3s...