{"41795":{"id":41795,"votes":4,"views":0,"text":"i to jest mirko o jakie nic nie robi\u0142em\r\nquality content!","html":"<p>i to jest mirko o jakie nic nie robi\u0142em<br \/>\nquality content!<\/p>\n","parent_id":41794,"url":"https:\/\/4programmers.net\/Mikroblogi\/View\/41794#comment-41795","created_at":"2019-02-09T22:29:34+01:00","updated_at":"2019-02-09T22:29:34+01:00","comments":[],"user":{"id":71375,"name":"grski","is_online":false,"photo":"https:\/\/4programmers.net\/uploads\/photo\/jwJE4lNr7aECywnAUNZKzP3fyaH1DKD8JgmwZJSg.png","deleted_at":null,"is_blocked":false},"permissions":{"update":false,"moderate":false},"type":"microblog","assets":[],"is_sponsored":false,"metadata":"eyJpdiI6IlhHeXNmZUhSVlRPUjg1aGFsUzEwSWc9PSIsInZhbHVlIjoiMXUzazl3aUdyU1hUYys4RVFSMEpqeHhUUXlnaFZ5em5FQWgzOEJUR1g4TzJKc1VaamtxZnJsZm9xUThBUVRsdSIsIm1hYyI6IjE1ZjYzNWI3MzZjOTk0OWNiODM1N2ZmYjVjMDNhNDAxNDA1YTQzNjMwYjM3ZmRmMDdhY2RmYjc3MzQ2MWY2MTkiLCJ0YWciOiIifQ==","deleted_at":null},"41797":{"id":41797,"votes":1,"views":0,"text":"Szanuj\u0119! Gdyby tylko nie ten Mac Pro :-)","html":"<p>Szanuj\u0119! Gdyby tylko nie ten Mac Pro :-)<\/p>\n","parent_id":41794,"url":"https:\/\/4programmers.net\/Mikroblogi\/View\/41794#comment-41797","created_at":"2019-02-10T01:02:44+01:00","updated_at":"2019-02-10T01:02:44+01:00","comments":[],"user":{"id":78956,"name":"Hispano-Suiza","is_online":false,"photo":"https:\/\/4programmers.net\/uploads\/photo\/5c\/5c26743c1c2bd.png","deleted_at":null,"is_blocked":false},"permissions":{"update":false,"moderate":false},"type":"microblog","assets":[],"is_sponsored":false,"metadata":"eyJpdiI6IlhGakh2b0tFaEFxUmJRT1lveTRjVFE9PSIsInZhbHVlIjoiSzFKNXkyUFRoVmJjNXlXTWdtemNSanhlcmlkNjhyak85c0xPYTg3MEhGeUlxV2RsSEtuM0pyb01sTTJweVlIQiIsIm1hYyI6IjM1MzRlMTg3ZmYxOTJjYzc4M2ZjODk0NWQ4ZTg3MmMyNGVkYWRjNjg0MTgyMjFkOTIzMzMzOGU0NDM4ZjFlMjIiLCJ0YWciOiIifQ==","deleted_at":null},"41798":{"id":41798,"votes":0,"views":0,"text":"W\u0142a\u015bnie czytaj\u0105c tamten wpis zastanawia\u0142em si\u0119, czy mo\u017cna zamieni\u0107  operacje pixelwise na co\u015b szybszego.","html":"<p>W\u0142a\u015bnie czytaj\u0105c tamten wpis zastanawia\u0142em si\u0119, czy mo\u017cna zamieni\u0107  operacje pixelwise na co\u015b szybszego.<\/p>\n","parent_id":41794,"url":"https:\/\/4programmers.net\/Mikroblogi\/View\/41794#comment-41798","created_at":"2019-02-10T02:28:23+01:00","updated_at":"2019-02-10T02:28:23+01:00","comments":[],"user":{"id":86261,"name":"Visual Code","is_online":false,"photo":"https:\/\/4programmers.net\/uploads\/photo\/59\/598bf272279b0.png","deleted_at":null,"is_blocked":false},"permissions":{"update":false,"moderate":false},"type":"microblog","assets":[],"is_sponsored":false,"metadata":"eyJpdiI6IkZkcmJGOHNjTnBxTThSd2RUeHhET2c9PSIsInZhbHVlIjoiUVQ5VVpIQTQ3Z3BBYmwyZTFQV3VGRTh1VWVVSTRvWkVLZktDaS9xeVNZVnNlcCtoQjRCbCtualQ3ZXpPaFJjUCIsIm1hYyI6Ijg5Njc2MzdlMjc5Mzc3ZmMyZGY5NzZlOTM1N2QzZjI0YmU0YTQ3Y2JkNDYzYmQ1YWY3ZWI4N2U2NDk1N2I5OWMiLCJ0YWciOiIifQ==","deleted_at":null},"41801":{"id":41801,"votes":1,"views":0,"text":"@Hispano-Suiza: Sam nie kupi\u0142em, s\u0142u\u017cbowy ;p","html":"<p><a class=\"mention\" data-user-id=\"78956\" href=\"https:\/\/4programmers.net\/Profile\/78956\" rel=\"ugc,nofollow\">@Hispano-Suiza<\/a>: Sam nie kupi\u0142em, s\u0142u\u017cbowy ;p<\/p>\n","parent_id":41794,"url":"https:\/\/4programmers.net\/Mikroblogi\/View\/41794#comment-41801","created_at":"2019-02-10T09:14:37+01:00","updated_at":"2019-02-10T09:14:37+01:00","comments":[],"user":{"id":52045,"name":"xxx_xx_x","is_online":false,"photo":"https:\/\/4programmers.net\/uploads\/photo\/5c\/5c5ffd80b4272.jpg","deleted_at":null,"is_blocked":false},"permissions":{"update":false,"moderate":false},"type":"microblog","assets":[],"is_sponsored":false,"metadata":"eyJpdiI6Ik8rNHJpTUtJZWdOOW1mVng5T0pmcVE9PSIsInZhbHVlIjoiQVhTUW0yand2cUpBemFYaDR6QWMwd1VlWkNlaXdlV0dPVCsvLzg0bEQrS0xNZ1Q3QUFhODZ2eCtITzh5QTZPcCIsIm1hYyI6ImUzOTE1ZjgxMjA2OTA0MDM1NzM0ZTNhODdkOGYxMGNmNGNhNWQ5NDRmZDYyMmJjNTVjM2E3NWI2OWFmZDQ1MTMiLCJ0YWciOiIifQ==","deleted_at":null},"41802":{"id":41802,"votes":0,"views":0,"text":"@{Visual Code}: Optymalizacja cache to ciekawy temat i ma zwykle ogromny wp\u0142yw na przetwarzanie du\u017cej ilo\u015bci danych. NA potrzeby cache powstaj\u0105 osobne algorytmy np cache-blocking do mno\u017cenia macierzy.","html":"<p><a class=\"mention\" data-user-id=\"86261\" href=\"https:\/\/4programmers.net\/Profile\/86261\" rel=\"ugc,nofollow\">@Visual Code<\/a>: Optymalizacja cache to ciekawy temat i ma zwykle ogromny wp\u0142yw na przetwarzanie du\u017cej ilo\u015bci danych. NA potrzeby cache powstaj\u0105 osobne algorytmy np cache-blocking do mno\u017cenia macierzy.<\/p>\n","parent_id":41794,"url":"https:\/\/4programmers.net\/Mikroblogi\/View\/41794#comment-41802","created_at":"2019-02-10T09:17:23+01:00","updated_at":"2019-02-10T09:17:23+01:00","comments":[],"user":{"id":52045,"name":"xxx_xx_x","is_online":false,"photo":"https:\/\/4programmers.net\/uploads\/photo\/5c\/5c5ffd80b4272.jpg","deleted_at":null,"is_blocked":false},"permissions":{"update":false,"moderate":false},"type":"microblog","assets":[],"is_sponsored":false,"metadata":"eyJpdiI6IkIyVWh6MHp6TkN6NnhTMXVVMWk2R0E9PSIsInZhbHVlIjoiNm1jY3NCMlV2TUx5aWdzN1BocDFVVHdEL3lWempSSzZDT1FhNVhmaG0vSDJyZlFuWDBmTytSZ3NVdUY5WlRaSCIsIm1hYyI6Ijg2NjYwOWUxNDA1MTgyZTFkNjNkMTY3NzBmZDJlYTJiMjU0OTA1YjBmYTdiMGIzZGIzMWJlOGFjOGE3NTZmYjIiLCJ0YWciOiIifQ==","deleted_at":null},"41803":{"id":41803,"votes":0,"views":0,"text":"Szacun","html":"<p>Szacun<\/p>\n","parent_id":41794,"url":"https:\/\/4programmers.net\/Mikroblogi\/View\/41794#comment-41803","created_at":"2019-02-10T09:32:52+01:00","updated_at":"2019-02-10T09:32:52+01:00","comments":[],"user":{"id":59683,"name":"baant","is_online":false,"photo":"https:\/\/4programmers.net\/uploads\/photo\/5b\/5b39dfec341a5.png","deleted_at":null,"is_blocked":false},"permissions":{"update":false,"moderate":false},"type":"microblog","assets":[],"is_sponsored":false,"metadata":"eyJpdiI6InVtNE9hT3R0OGs4UFhOSE1mdDdJaFE9PSIsInZhbHVlIjoiNGFTVFo4L1VYVVpSa3cxREVUbHo1eVlTQjkvVi84eTVIZS9QcVd2WlZjMnFWejBPWWlPUlpEeCtxNXdVVm1OTyIsIm1hYyI6IjYyMDYyOGRjOWM4ZjNkMjk3YzBlYTFkNDk4MmM2MTI3NTAyODVlNWI5YmQzOGIwMmJkNjFiMmQ1MjczOWQ5ZWIiLCJ0YWciOiIifQ==","deleted_at":null},"41816":{"id":41816,"votes":0,"views":0,"text":"Problem wynika raczej ze zwi\u0119kszonej liczby dost\u0119p\u00f3w do cache w og\u00f3le, ni\u017c wi\u0119kszej liczby chybie\u0144 w cache - pod warunkiem, \u017ce obraz jest przechowywany w ci\u0105g\u0142ym obszarze, bez tych nieszcz\u0119snych dope\u0142nie\u0144. Ale bitmapa jako ```char*``` nie b\u0119dzie mie\u0107 tego problemu.\r\n\r\nSwoj\u0105 drog\u0105, pr\u00f3bowa\u0142e\u015b sprawdzi\u0107, czy i jak\u0105 korzy\u015b\u0107 przyniesie zast\u0105pienie ```uint32``` przez ```uint64``` i\/lub w\u0142\u0105czenie SSE?","html":"<p>Problem wynika raczej ze zwi\u0119kszonej liczby dost\u0119p\u00f3w do cache w og\u00f3le, ni\u017c wi\u0119kszej liczby chybie\u0144 w cache - pod warunkiem, \u017ce obraz jest przechowywany w ci\u0105g\u0142ym obszarze, bez tych nieszcz\u0119snych dope\u0142nie\u0144. Ale bitmapa jako <code>char*<\/code> nie b\u0119dzie mie\u0107 tego problemu.<\/p>\n<p>Swoj\u0105 drog\u0105, pr\u00f3bowa\u0142e\u015b sprawdzi\u0107, czy i jak\u0105 korzy\u015b\u0107 przyniesie zast\u0105pienie <code>uint32<\/code> przez <code>uint64<\/code> i\/lub w\u0142\u0105czenie SSE?<\/p>\n","parent_id":41794,"url":"https:\/\/4programmers.net\/Mikroblogi\/View\/41794#comment-41816","created_at":"2019-02-10T20:30:56+01:00","updated_at":"2019-02-10T20:30:56+01:00","comments":[],"user":{"id":92941,"name":"superdurszlak","is_online":false,"photo":"https:\/\/4programmers.net\/uploads\/photo\/5c\/5cfd3048ba2b1.jpg","deleted_at":"2022-04-24T21:51:55.000000Z","is_blocked":false},"permissions":{"update":false,"moderate":false},"type":"microblog","assets":[],"is_sponsored":false,"metadata":"eyJpdiI6IkdFeEUwT3hJMTdla0p6dCtIbFhTd0E9PSIsInZhbHVlIjoiL1BldDQ3dll1TFdGd3lwWjdpL3pnVzBEa0lEY1g0dXVRZ1NIUjdReW5pVGdXZzBRTGhvQVY1SVhBSzJvbll3eCIsIm1hYyI6IjZiN2FkYmFjZDI5YmE4ZTFjNDZmZGRhZjBiNDQyNDJmNTE1MmY1ZDI4MWExYWJmODQwOTZkYzBkYmNkNDA0YWEiLCJ0YWciOiIifQ==","deleted_at":null},"41817":{"id":41817,"votes":0,"views":0,"text":"Mo\u017cna jeszcze u\u017cy\u0107 u\u0142o\u017cenia RGBN gdzie 4-ty bajt jest nie u\u017cywany na docelowym obrazku. Zysk jest taki \u017ce mo\u017cna robi\u0107 operacje specyficzne dla danego koloru no i ka\u017cda linia (a nie tylko co kt\u00f3ra\u015b) jest wyr\u00f3wnana do 4 bajt\u00f3w.","html":"<p>Mo\u017cna jeszcze u\u017cy\u0107 u\u0142o\u017cenia RGBN gdzie 4-ty bajt jest nie u\u017cywany na docelowym obrazku. Zysk jest taki \u017ce mo\u017cna robi\u0107 operacje specyficzne dla danego koloru no i ka\u017cda linia (a nie tylko co kt\u00f3ra\u015b) jest wyr\u00f3wnana do 4 bajt\u00f3w.<\/p>\n","parent_id":41794,"url":"https:\/\/4programmers.net\/Mikroblogi\/View\/41794#comment-41817","created_at":"2019-02-10T22:34:18+01:00","updated_at":"2019-02-10T22:34:18+01:00","comments":[],"user":{"id":48869,"name":"vpiotr","is_online":false,"photo":"https:\/\/4programmers.net\/uploads\/photo\/5f\/5f9df87cb6749.jpg","deleted_at":"2022-05-14T20:38:46.000000Z","is_blocked":false},"permissions":{"update":false,"moderate":false},"type":"microblog","assets":[],"is_sponsored":false,"metadata":"eyJpdiI6ImRmbkx5Y1AzZkR5RFNtM1Y2emtVUkE9PSIsInZhbHVlIjoiVjF3c2tyQjNkTUtWcXFNYkZsUHZlc1Fla0hKZDVxNmdXMHdISjU3cmwyY3FkSGJlRG9rL2lMdFpvWk1ES1NPcCIsIm1hYyI6ImE0MWU2YWEwOTUzYWM2YjVjMmI2Y2FjOGVjYTNjZGYxMGYzNGU1NjBlMmIxODU1Yzg3ZDM4MmNiMTU3OGVmYjciLCJ0YWciOiIifQ==","deleted_at":null},"41819":{"id":41819,"votes":0,"views":0,"text":"@superdurszlak: co do cache miss, to problem g\u0142\u00f3wnie obs\u0142ugi kilku tablic (tablica obrazu i tablica palety), kt\u00f3re wsp\u00f3\u0142dziel\u0105 cache wi\u0119c wzajemnie si\u0119 wyw\u0142aszczaj\u0105. \r\nuint64 na pewno poprawi\u0142o by wydajno\u015b\u0107 dla procesor\u00f3w 64 bitowych, kt\u00f3re radz\u0105 sobie z takimi operacjami za pomoc\u0105 jednej instrukcji w innym przypadku emulowa\u0142o by to dost\u0119p 2 razy po 32 bity o ile wiem.  Co do SSE, to prawdopodobnie kompilator sam je stosuje przy optymalizacji O2 i O3, zawsze mo\u017cna skompilowa\u0107 kod do postaci asm i sprawdzi\u0107.","html":"<p>@superdurszlak: co do cache miss, to problem g\u0142\u00f3wnie obs\u0142ugi kilku tablic (tablica obrazu i tablica palety), kt\u00f3re wsp\u00f3\u0142dziel\u0105 cache wi\u0119c wzajemnie si\u0119 wyw\u0142aszczaj\u0105.<br \/>\nuint64 na pewno poprawi\u0142o by wydajno\u015b\u0107 dla procesor\u00f3w 64 bitowych, kt\u00f3re radz\u0105 sobie z takimi operacjami za pomoc\u0105 jednej instrukcji w innym przypadku emulowa\u0142o by to dost\u0119p 2 razy po 32 bity o ile wiem.  Co do SSE, to prawdopodobnie kompilator sam je stosuje przy optymalizacji O2 i O3, zawsze mo\u017cna skompilowa\u0107 kod do postaci asm i sprawdzi\u0107.<\/p>\n","parent_id":41794,"url":"https:\/\/4programmers.net\/Mikroblogi\/View\/41794#comment-41819","created_at":"2019-02-10T23:23:52+01:00","updated_at":"2019-02-10T23:23:52+01:00","comments":[],"user":{"id":52045,"name":"xxx_xx_x","is_online":false,"photo":"https:\/\/4programmers.net\/uploads\/photo\/5c\/5c5ffd80b4272.jpg","deleted_at":null,"is_blocked":false},"permissions":{"update":false,"moderate":false},"type":"microblog","assets":[],"is_sponsored":false,"metadata":"eyJpdiI6IldYSCt2QmlzWUgveHY3LzUxMDd1WlE9PSIsInZhbHVlIjoiSnIvblRQdkp0QVNKMXowRnJVbndjdG9TR041U3JJVm5jOXJLeFY4YmNiR3hKYUNRd1h5UXVYS01aaytwTmNLOCIsIm1hYyI6ImIzNmNhNjY0Njc0OTVhZDdlNTU1OTRkZTk0NGViOWIyMmQ4MDI5NWFiMDk4M2JmZjcyYTRmYzJmMmRhN2U5MTkiLCJ0YWciOiIifQ==","deleted_at":null},"41820":{"id":41820,"votes":0,"views":0,"text":"@vpiotr tak jest to rozwi\u0105zanie, ale do\u015b\u0107 kosztowne pami\u0119ciowo i moze sie okaza\u0107 strza\u0142em w stop\u0119. Obraz 1920x1080 w 24 bpp ma 6mb, natomiast w 32 ma a\u017c 8mb, wi\u0119c te dwa dodatkowe 2mb trzeba przepcha\u0107 przez magistral\u0119.\r\nCo do przetwarzania bitmap 24bpp mo\u017cna pos\u0142u\u017cy\u0107 si\u0119 trikiem z rozwijaniem p\u0119tli, odczytujemy 12 bajt\u00f3w(3 raz po 4) i z nich sami wypakowujemy 4 kolory.","html":"<p>@vpiotr tak jest to rozwi\u0105zanie, ale do\u015b\u0107 kosztowne pami\u0119ciowo i moze sie okaza\u0107 strza\u0142em w stop\u0119. Obraz 1920x1080 w 24 bpp ma 6mb, natomiast w 32 ma a\u017c 8mb, wi\u0119c te dwa dodatkowe 2mb trzeba przepcha\u0107 przez magistral\u0119.<br \/>\nCo do przetwarzania bitmap 24bpp mo\u017cna pos\u0142u\u017cy\u0107 si\u0119 trikiem z rozwijaniem p\u0119tli, odczytujemy 12 bajt\u00f3w(3 raz po 4) i z nich sami wypakowujemy 4 kolory.<\/p>\n","parent_id":41794,"url":"https:\/\/4programmers.net\/Mikroblogi\/View\/41794#comment-41820","created_at":"2019-02-10T23:30:02+01:00","updated_at":"2019-02-10T23:30:02+01:00","comments":[],"user":{"id":52045,"name":"xxx_xx_x","is_online":false,"photo":"https:\/\/4programmers.net\/uploads\/photo\/5c\/5c5ffd80b4272.jpg","deleted_at":null,"is_blocked":false},"permissions":{"update":false,"moderate":false},"type":"microblog","assets":[],"is_sponsored":false,"metadata":"eyJpdiI6IkpsK1pMbCtPekluMGE5TWlvZ056UkE9PSIsInZhbHVlIjoiVTJXVW1QNWRheHFHbTZGaStYT1lzSVFiZ0JjeTJhdzBZYklCNE8yQWtGYm4rbkFkZUhOZ1Y2U3d3TWxtLzRHdCIsIm1hYyI6ImQyY2MxYWZkYTM5YWFjNjRhODZmMjE0M2EwMjJiNjY1MDgyNjc1ODA5Yzc4YTg2YWRhMWFkMWM1YTc1M2NiNjAiLCJ0YWciOiIifQ==","deleted_at":null},"41821":{"id":41821,"votes":0,"views":0,"text":"zd\u0105\u017cy\u0142em sprawdzi\u0107 w Compiler Explorer pisz\u0105c m\u00f3j poprzedni komentarz, u\u017cycie SSE przez kompilator trzeba wymusi\u0107 flagami, przynajmniej w GCC i Clang, nie jestem pewien jak z ICC","html":"<p>zd\u0105\u017cy\u0142em sprawdzi\u0107 w Compiler Explorer pisz\u0105c m\u00f3j poprzedni komentarz, u\u017cycie SSE przez kompilator trzeba wymusi\u0107 flagami, przynajmniej w GCC i Clang, nie jestem pewien jak z ICC<\/p>\n","parent_id":41794,"url":"https:\/\/4programmers.net\/Mikroblogi\/View\/41794#comment-41821","created_at":"2019-02-10T23:30:46+01:00","updated_at":"2019-02-10T23:30:46+01:00","comments":[],"user":{"id":92941,"name":"superdurszlak","is_online":false,"photo":"https:\/\/4programmers.net\/uploads\/photo\/5c\/5cfd3048ba2b1.jpg","deleted_at":"2022-04-24T21:51:55.000000Z","is_blocked":false},"permissions":{"update":false,"moderate":false},"type":"microblog","assets":[],"is_sponsored":false,"metadata":"eyJpdiI6Ii9HeElzbkVGTXFkOFJEVUxCZE5kNHc9PSIsInZhbHVlIjoia1dxMU56TTdUemJadzNNRVpoOUtLYlJvVGx6MjJyZDJjNTcrMG5tbFZiNHNVV3pkNXlOWXNpa1FheXdwOFV2MiIsIm1hYyI6IjU1YWQ0ZjA1NDFlY2E0NTk5MGI3OWVlN2E0OTYyODg0Njc1NzFmMTAzODgwOGZkNjlkYzc4MmRhMmI4MjViNzUiLCJ0YWciOiIifQ==","deleted_at":null},"41822":{"id":41822,"votes":0,"views":0,"text":"Btw. co do wyw\u0142aszczania z cache - problem b\u0119dzie tylko w wariancie z palet\u0105 a i to zak\u0142adaj\u0105c, \u017ce faktycznie dojdzie do wyw\u0142aszcze\u0144. Podejrzewam, \u017ce nie, bo odwo\u0142ania do palety powinny mie\u0107 przyzwoit\u0105 lokalno\u015b\u0107 czasow\u0105 i potencjalnie r\u00f3wnie\u017c przestrzenn\u0105 (paleta b\u0119dzie siedzie\u0107 w 4 liniach cache po 64B ka\u017cda, wi\u0119c prawdopodobie\u0144stwo odwo\u0142ania do danej linii b\u0119dzie raczej spore, w dodatku jest pewnie jaka\u015b korelacja mi\u0119dzy s\u0105siednimi kolorami na obrazie), poza tym cache miss bed\u0105 g\u0142\u00f3wnie wprzypadku tablicy image, do kt\u00f3rej odwo\u0142ania s\u0105 liniowe, ka\u017cdy bajt czytany i zapisywany jest raz wi\u0119c si\u0142\u0105 rzeczy b\u0119dziesz mia\u0142 compulsory cache miss. Paleta jest czytana cz\u0119sto wi\u0119c ryzyko wypadni\u0119cia z L1 cache b\u0119dzie raczej niskie, a z L2 czy L3 to ju\u017c w og\u00f3le ;)","html":"<p>Btw. co do wyw\u0142aszczania z cache - problem b\u0119dzie tylko w wariancie z palet\u0105 a i to zak\u0142adaj\u0105c, \u017ce faktycznie dojdzie do wyw\u0142aszcze\u0144. Podejrzewam, \u017ce nie, bo odwo\u0142ania do palety powinny mie\u0107 przyzwoit\u0105 lokalno\u015b\u0107 czasow\u0105 i potencjalnie r\u00f3wnie\u017c przestrzenn\u0105 (paleta b\u0119dzie siedzie\u0107 w 4 liniach cache po 64B ka\u017cda, wi\u0119c prawdopodobie\u0144stwo odwo\u0142ania do danej linii b\u0119dzie raczej spore, w dodatku jest pewnie jaka\u015b korelacja mi\u0119dzy s\u0105siednimi kolorami na obrazie), poza tym cache miss bed\u0105 g\u0142\u00f3wnie wprzypadku tablicy image, do kt\u00f3rej odwo\u0142ania s\u0105 liniowe, ka\u017cdy bajt czytany i zapisywany jest raz wi\u0119c si\u0142\u0105 rzeczy b\u0119dziesz mia\u0142 compulsory cache miss. Paleta jest czytana cz\u0119sto wi\u0119c ryzyko wypadni\u0119cia z L1 cache b\u0119dzie raczej niskie, a z L2 czy L3 to ju\u017c w og\u00f3le ;)<\/p>\n","parent_id":41794,"url":"https:\/\/4programmers.net\/Mikroblogi\/View\/41794#comment-41822","created_at":"2019-02-10T23:38:47+01:00","updated_at":"2019-02-10T23:38:47+01:00","comments":[],"user":{"id":92941,"name":"superdurszlak","is_online":false,"photo":"https:\/\/4programmers.net\/uploads\/photo\/5c\/5cfd3048ba2b1.jpg","deleted_at":"2022-04-24T21:51:55.000000Z","is_blocked":false},"permissions":{"update":false,"moderate":false},"type":"microblog","assets":[],"is_sponsored":false,"metadata":"eyJpdiI6IjF3UkwwMFkyMjk5bG1OOTU5bnN0eGc9PSIsInZhbHVlIjoiQXd6eGh1c1M4TWdPdTNiYWpudUtSVXJJbHpTWmxaOXZDd0JiMENYT0tHOEpvb1cwL1lQK1NFM0VSYVZ4cmtzbSIsIm1hYyI6ImUxMGJkN2YyYjc5MjYzZTlmMzJlMjIxM2JmNTFlZWM3MWQxYmMzNzVkZThiMDVlODFmNTkwMTJhOWY5NzQ2MmQiLCJ0YWciOiIifQ==","deleted_at":null},"41825":{"id":41825,"votes":0,"views":0,"text":"@superdurszlak: Nie do ko\u0144ca, linie s\u0105 oceniane w ca\u0142o\u015bci czyli 16 warto\u015bci palety mie\u015bci si\u0119 w jednej linii cache. Odwo\u0142ania do palety s\u0105 na tyle losowe \u017ce nie podbijaj\u0105\u00a0\u017cywotno\u015bci takiego bloku zbyt dobrze. W praktyce zbyt ci\u0119\u017cko jednoznacznie stwierdzi\u0107\u00a0co robi CPU, mo\u017cna si\u0119\u00a0kierowa\u0107 tylko og\u00f3lnymi za\u0142o\u017ceniami, kt\u00f3re i tak znowu zale\u017c\u0105 od architektury:)","html":"<p>@superdurszlak: Nie do ko\u0144ca, linie s\u0105 oceniane w ca\u0142o\u015bci czyli 16 warto\u015bci palety mie\u015bci si\u0119 w jednej linii cache. Odwo\u0142ania do palety s\u0105 na tyle losowe \u017ce nie podbijaj\u0105\u00a0\u017cywotno\u015bci takiego bloku zbyt dobrze. W praktyce zbyt ci\u0119\u017cko jednoznacznie stwierdzi\u0107\u00a0co robi CPU, mo\u017cna si\u0119\u00a0kierowa\u0107 tylko og\u00f3lnymi za\u0142o\u017ceniami, kt\u00f3re i tak znowu zale\u017c\u0105 od architektury:)<\/p>\n","parent_id":41794,"url":"https:\/\/4programmers.net\/Mikroblogi\/View\/41794#comment-41825","created_at":"2019-02-11T09:08:14+01:00","updated_at":"2019-02-11T09:08:14+01:00","comments":[],"user":{"id":52045,"name":"xxx_xx_x","is_online":false,"photo":"https:\/\/4programmers.net\/uploads\/photo\/5c\/5c5ffd80b4272.jpg","deleted_at":null,"is_blocked":false},"permissions":{"update":false,"moderate":false},"type":"microblog","assets":[],"is_sponsored":false,"metadata":"eyJpdiI6Im9JdS9BN2FLcStNTTFBRk5CK0xZL3c9PSIsInZhbHVlIjoiSE1TTjM4VmdYTXJQM1YySzFoNlZEMHk4Z1JaUGFjVFpGSGg0aGpGekVIZWRhakZZMUFQLzlCR3A4VlU3eGhYbiIsIm1hYyI6ImJjZGRkZjFjYWQ0YmE0NjllODE0ZWY5MzI3MTUwZDQ4Y2RhZjRhMDE4NmQxYzk0OTAzYmY2YTBmOTdjZGFlM2YiLCJ0YWciOiIifQ==","deleted_at":null},"41826":{"id":41826,"votes":0,"views":0,"text":"zawsze mogliby\u015bmy da\u0107 sobie spok\u00f3j z ja\u0142ow\u0105 dyskusj\u0105 i odpali\u0107 cachegrinda... ale takie dywagacje s\u0105 ciekawsze :D","html":"<p>zawsze mogliby\u015bmy da\u0107 sobie spok\u00f3j z ja\u0142ow\u0105 dyskusj\u0105 i odpali\u0107 cachegrinda... ale takie dywagacje s\u0105 ciekawsze :D<\/p>\n","parent_id":41794,"url":"https:\/\/4programmers.net\/Mikroblogi\/View\/41794#comment-41826","created_at":"2019-02-11T09:28:46+01:00","updated_at":"2019-02-11T09:28:46+01:00","comments":[],"user":{"id":92941,"name":"superdurszlak","is_online":false,"photo":"https:\/\/4programmers.net\/uploads\/photo\/5c\/5cfd3048ba2b1.jpg","deleted_at":"2022-04-24T21:51:55.000000Z","is_blocked":false},"permissions":{"update":false,"moderate":false},"type":"microblog","assets":[],"is_sponsored":false,"metadata":"eyJpdiI6ImVYZHZoeDZFY1JONFdGclRjcFVSYWc9PSIsInZhbHVlIjoiNk94RFltd1ZmZFFwUFR3R0JLaGhwSVlLK0lBZkRiKzY1QjhUWkdOL2hCM21qcGJ6N1dTVXNNVTMzdzh6dm10OCIsIm1hYyI6ImU2MzE3YjVlNmIxMzAzMmZmYWQ5OWQ0M2JhODFhMjBjZWIzMjFlYjI1MWQ5YWVlZjA5OTQzNjU2Mjg3NDZiYTIiLCJ0YWciOiIifQ==","deleted_at":null},"41839":{"id":41839,"votes":0,"views":0,"text":"Nie zna\u0142em tego, ciekawe na ile ta symulacja jest wiarygodna i dla jakich procesor\u00f3w?","html":"<p>Nie zna\u0142em tego, ciekawe na ile ta symulacja jest wiarygodna i dla jakich procesor\u00f3w?<\/p>\n","parent_id":41794,"url":"https:\/\/4programmers.net\/Mikroblogi\/View\/41794#comment-41839","created_at":"2019-02-11T12:00:54+01:00","updated_at":"2019-02-11T12:00:54+01:00","comments":[],"user":{"id":52045,"name":"xxx_xx_x","is_online":false,"photo":"https:\/\/4programmers.net\/uploads\/photo\/5c\/5c5ffd80b4272.jpg","deleted_at":null,"is_blocked":false},"permissions":{"update":false,"moderate":false},"type":"microblog","assets":[],"is_sponsored":false,"metadata":"eyJpdiI6IkYrVjdjeklDNzJWK3Fqa2EyQUZ4ZEE9PSIsInZhbHVlIjoiZDRyZ1YzanR1MTFHN3cxdGk3a1MrYXJUSDhqbXI2TFZWaGh0TkFubXRXR1NFNE5LV2RMSmlnM2FSa1d2dXdrMyIsIm1hYyI6ImI0NDZlMGFjNDg5OTcyMjM2YzM2MmY3NzI3YzhkYmRhNDc5ZjJmM2JkZmE3MzQxZjFkYzcxNTk4OWIyZDc2NmUiLCJ0YWciOiIifQ==","deleted_at":null},"41846":{"id":41846,"votes":0,"views":0,"text":"W\u0105tpi\u0119 by by\u0142a w 100% precyzyjna, tym bardziej \u017ce symuluje tylko L1 i LL cache (pomijaj\u0105c L2 je\u015bli masz 3-poziomowy - uzasadnienie jest takie \u017ce podobno ma niewielkie znaczenie), ale jak robili\u015bmy w tym semestrze na HPC analizy teoretyczne, to cachegrind dawa\u0142 liczby dost\u0119p\u00f3w zgodne z przewidywanymi i w miar\u0119 sensowne liczby chybie\u0144 (cho\u0107 ci\u0119\u017cko to oszacowa\u0107 analizuj\u0105c algorytm) - natomiast taki perf stat rzuca\u0142 czasami tak absurdalnymi liczbami, \u017ce w og\u00f3le nie traktowali\u015bmy go powa\u017cnie.Zreszt\u0105 perf analizuje ca\u0142o\u015b\u0107 wykonania, wi\u0119c chc\u0105c przeanalizowa\u0107 konkretny fragment trzeba kombinowa\u0107 z wykonaniem z i bez fragmentu - kolejna okazja do b\u0142\u0119d\u00f3w pomiarowych.","html":"<p>W\u0105tpi\u0119 by by\u0142a w 100% precyzyjna, tym bardziej \u017ce symuluje tylko L1 i LL cache (pomijaj\u0105c L2 je\u015bli masz 3-poziomowy - uzasadnienie jest takie \u017ce podobno ma niewielkie znaczenie), ale jak robili\u015bmy w tym semestrze na HPC analizy teoretyczne, to cachegrind dawa\u0142 liczby dost\u0119p\u00f3w zgodne z przewidywanymi i w miar\u0119 sensowne liczby chybie\u0144 (cho\u0107 ci\u0119\u017cko to oszacowa\u0107 analizuj\u0105c algorytm) - natomiast taki perf stat rzuca\u0142 czasami tak absurdalnymi liczbami, \u017ce w og\u00f3le nie traktowali\u015bmy go powa\u017cnie.Zreszt\u0105 perf analizuje ca\u0142o\u015b\u0107 wykonania, wi\u0119c chc\u0105c przeanalizowa\u0107 konkretny fragment trzeba kombinowa\u0107 z wykonaniem z i bez fragmentu - kolejna okazja do b\u0142\u0119d\u00f3w pomiarowych.<\/p>\n","parent_id":41794,"url":"https:\/\/4programmers.net\/Mikroblogi\/View\/41794#comment-41846","created_at":"2019-02-11T12:26:41+01:00","updated_at":"2019-02-11T12:26:41+01:00","comments":[],"user":{"id":92941,"name":"superdurszlak","is_online":false,"photo":"https:\/\/4programmers.net\/uploads\/photo\/5c\/5cfd3048ba2b1.jpg","deleted_at":"2022-04-24T21:51:55.000000Z","is_blocked":false},"permissions":{"update":false,"moderate":false},"type":"microblog","assets":[],"is_sponsored":false,"metadata":"eyJpdiI6IjhyYTBGbjRwRS9MNkdmVnR1dnVYM2c9PSIsInZhbHVlIjoiVllwVFNheUZ5UlB3ZDQxYzYwUldOMXlPaHo1VmhYWWpHdkJaR3h0Q09FVUJ2VkJEY0ptTFJVWU16REZzZWFJSyIsIm1hYyI6ImQ0OWU1NmU4MzlhOGI1ODM5MzgxYjU2NzdjNjNjYmZhMmFiNzljMThlMDE1ZjBkM2Y0NjUzMDZhZTdhYjhjMjEiLCJ0YWciOiIifQ==","deleted_at":null},"41912":{"id":41912,"votes":0,"views":0,"text":"\u0141adny post. Jakkolwiek, jak widz\u0119 takie co\u015b `pal[i] = (unsigned char)(i >> 1);` to zawsze si\u0119 zastanawiam:  W 2019 naprawd\u0119 nadal nie masz zaufania do swojego kompilatora i on `i\/2` nie ogarnie?  Mo\u017ce czas kompilator zmieni\u0107? Do tego to jest w prekalkulacji - zerowy wp\u0142yw na dzia\u0142anie systemu. Do tego.. w\u0142asnie ze wzgl\u0119du na cache na nowych prockach pewnie i tak nie ma znaczenia. Btw. mo\u017cesz zmierzy\u0107, jestem ciekaw czy si\u0119 nie myl\u0119.... (tylko prosz\u0119 o nie robienie dowcip\u00f3w z wy\u0142\u0105czaniem optymalizacji).","html":"<p>\u0141adny post. Jakkolwiek, jak widz\u0119 takie co\u015b <code>pal[i] = (unsigned char)(i &gt;&gt; 1);<\/code> to zawsze si\u0119 zastanawiam:  W 2019 naprawd\u0119 nadal nie masz zaufania do swojego kompilatora i on <code>i\/2<\/code> nie ogarnie?  Mo\u017ce czas kompilator zmieni\u0107? Do tego to jest w prekalkulacji - zerowy wp\u0142yw na dzia\u0142anie systemu. Do tego.. w\u0142asnie ze wzgl\u0119du na cache na nowych prockach pewnie i tak nie ma znaczenia. Btw. mo\u017cesz zmierzy\u0107, jestem ciekaw czy si\u0119 nie myl\u0119.... (tylko prosz\u0119 o nie robienie dowcip\u00f3w z wy\u0142\u0105czaniem optymalizacji).<\/p>\n","parent_id":41794,"url":"https:\/\/4programmers.net\/Mikroblogi\/View\/41794#comment-41912","created_at":"2019-02-11T20:28:34+01:00","updated_at":"2019-02-11T20:28:34+01:00","comments":[],"user":{"id":78878,"name":"jarekr000000","is_online":false,"photo":"https:\/\/4programmers.net\/uploads\/photo\/5cIlMfkx6weODwKhSuw9fZip5BrITVTjCyDbb3Pr.jpg","deleted_at":null,"is_blocked":false},"permissions":{"update":false,"moderate":false},"type":"microblog","assets":[],"is_sponsored":false,"metadata":"eyJpdiI6Im5Sa3d1UURuT3VHOHBEekJCMWtycUE9PSIsInZhbHVlIjoia0VkcFNJVS9nb1NkbnFDaTVVYzRNUFlDd1NlcnEyRDRvYnpLbVBCeEZmd0hPU0NhTlozMGZsWEc2YVZvbU51QiIsIm1hYyI6IjE5N2Y3YTgyZWZmMzJkYTUwODVjZDQ4OGI1Mjc2NjYyMWVlMjM4N2JmNWMzYWMxMjIyYzMzYmRiOTdkZDg2ZWUiLCJ0YWciOiIifQ==","deleted_at":null},"41914":{"id":41914,"votes":0,"views":0,"text":"@jarekr000000: dla mnie ma to taka sama czytelno\u015b\u0107, a plus jest taki \u017ce w debug jednak dzia\u0142a to szybciej dla niekt\u00f3rych algorytm\u00f3w. Po prostu nie widz\u0119 r\u00f3\u017cnicy w tych zapisach i preferuje ten.","html":"<p><a class=\"mention\" data-user-id=\"78878\" href=\"https:\/\/4programmers.net\/Profile\/78878\" rel=\"ugc,nofollow\">@jarekr000000<\/a>: dla mnie ma to taka sama czytelno\u015b\u0107, a plus jest taki \u017ce w debug jednak dzia\u0142a to szybciej dla niekt\u00f3rych algorytm\u00f3w. Po prostu nie widz\u0119 r\u00f3\u017cnicy w tych zapisach i preferuje ten.<\/p>\n","parent_id":41794,"url":"https:\/\/4programmers.net\/Mikroblogi\/View\/41794#comment-41914","created_at":"2019-02-11T23:53:34+01:00","updated_at":"2019-02-11T23:53:34+01:00","comments":[],"user":{"id":52045,"name":"xxx_xx_x","is_online":false,"photo":"https:\/\/4programmers.net\/uploads\/photo\/5c\/5c5ffd80b4272.jpg","deleted_at":null,"is_blocked":false},"permissions":{"update":false,"moderate":false},"type":"microblog","assets":[],"is_sponsored":false,"metadata":"eyJpdiI6Ii9RVHpxd09nbm9McHJ1ZldDNW9Kemc9PSIsInZhbHVlIjoiWldXQ09LZHRmY2RRNVpkY3JDaTlTUDZvaDZsa0NUTW8zdUh3RjZpMm1yQnl3a2R4eE9FdHJlYXRJOEVhTDBvOCIsIm1hYyI6Ijg5Y2FmYWE0MzRkNzM5OWViYWNlMzAzYWE1MzU3Mjk4ZWJlMGNiOTkyZWYzZjU5MTE1ODMxMmE3NWRhOTcyZmEiLCJ0YWciOiIifQ==","deleted_at":null},"41916":{"id":41916,"votes":0,"views":0,"text":"czemu po prostu na CPU nie policzycie? zwyk\u0142y shader by za\u0142atwi\u0142 sprawe","html":"<p>czemu po prostu na CPU nie policzycie? zwyk\u0142y shader by za\u0142atwi\u0142 sprawe<\/p>\n","parent_id":41794,"url":"https:\/\/4programmers.net\/Mikroblogi\/View\/41794#comment-41916","created_at":"2019-02-12T04:10:18+01:00","updated_at":"2019-02-12T04:10:18+01:00","comments":[],"user":{"id":37933,"name":"krwq","is_online":false,"photo":null,"deleted_at":null,"is_blocked":false},"permissions":{"update":false,"moderate":false},"type":"microblog","assets":[],"is_sponsored":false,"metadata":"eyJpdiI6Ijl3T0pxYXBZSk1GbVlsTXpkUUpZSHc9PSIsInZhbHVlIjoiNStBSy9RM1B4WGxRN2RPS0hxMU5GYVFLOGdzS1EycHVCZ0psbktkOU1RSkovVWFuOXFSVFR3QWFzeWIxWUhGSCIsIm1hYyI6IjMyNzlhYzNhNTRhMTZkMzg1NzNjY2FiYTlkN2Y4ZGE3MTA2MzkwYmZiYTliZTZmNjA5OTg0YTI5ZGZmNjcyNTUiLCJ0YWciOiIifQ==","deleted_at":null}}