Katalogowanie

0

Pytanie raczej bardzo ogólne, ale troszkę związane z algorytmami.
Mam programy o rozmiarze co najwyżej 256 bajtów (Marooned chyba domyśla się o czym mówię user image b).
Czyli teoretycznie takich programów może być 256^256 (prawie).
Chcę je skatalogować (poumieszczać w odpowiednich folderach, ew. podpiąć pod jakąś bazę danych), ale tak, żeby najbardziej zbliżone do siebie programy trafiły do możliwie bliskich siebie katalogów. Czyli np. przyjmując, że te programy traktujemy jak liczby, to programy, które całe są identyczne, ale ostatnie ich bajty różnią się tylko trafiłyby do tych samych podkatalogów.
To oczywiście tylko przykład i to bardzo nieefektywny.
Pytanie jest takie:
Według jakiego kryterium te programy powinny być segregowane? To oczywiście musi odbywać się automatycznie (tzn. program musi przyporządkować do odpowiedniej grupy).
Trochę nakombinowałem ;p

0

Marooned chyba domyśla się o czym mówię user image

  1. Ja się nie domyślam, ja wiem :-). Ale bardzo mnie zastanawia sens tego zadania.
  2. Niewiele jest osób używających tej emotki user image. Dryo

chyba domyśla się o czym mówię
user image

  1. A co do samego pytania, to może rozdzielać je według entropii zbioru? Taka mi się myśl nasunęła.
0
  1. Ja się nie domyślam, ja wiem :-). Ale bardzo mnie zastanawia sens tego zadania.

Taka dziwna myśl nasuneła mi się, że możnaby generować automatycznie takie programy. I zobaczyć jakie dziwactwa z tego by wyszły. Jak policzyłem ile takich mikro programów może być, to mi się odechciało generować, ale chęć kolekcjonowania pozostała. Jak cudowne rzeczy mieszczą się w tych mikroprogramach to sam wiesz. Dla tych co nie wiedzą to niech zerkną tutaj http://www.256b.com (mam nadzieję, że nie skłamałem w linku).

  1. Niewiele jest osób używających tej emotki user image. Dryo

chyba domyśla się o czym mówię
user image

Ciekaw jestem jak długo trzeba będzie czekać na naprawę tego buga.

  1. A co do samego pytania, to może rozdzielać je według entropii zbioru? Taka mi się myśl nasunęła.

Hmm. Ja zastanawiałem się nad czymś w stylu częstotliwości występowania poszczególnych wartości i jakiś średnich. Ale z entropią znacznie łatwiej jest obliczyć i pomieścić takie dane. Może w tym kierunku powinniśmy iść.

1 użytkowników online, w tym zalogowanych: 0, gości: 1