Witajcie. Opracowuje model roofline dla koprocesora Intel Xeon Phi, aby wyznaczyć sobie maksymalną wydajność teoretyczną oraz praktyczną dla mojego algorytmu. Wszystko ładnie pieknie, tylko nie wiem jak wyznaczyć intensywność obliczeń algorytmu [Flop/bajt]. Algorytm oblicza 5-puntkwe stencile. Oto pseudokod:

for(int i=1; i<m-1; ++i) {
   for(int j=1; j<n-1; ++j) {
       outMax[i][j] = max( inMax[i][j], inMax[i][j-1], inMax[i][j+1],
                           inMax[i-1][j], inMax[i+1][j] );
   }
}
swap(inMax, outMax)

for(int i=1; i<m-1; ++i) {
   for(int j=1; j<n-1; ++j) {
      outMin[i][j] = min( inMin[i][j], inMin[i][j-1], inMin[i][j+1],
                          inMin[i-1][j], inMin[i+1][j] );
   }
}
swap(inMax, outMax)

Czy mógłby mi ktoś wytłumaczyć jak się to liczy? Z góry dziękuje :)