Projekt pt. "Algorytm kompresji metodą Huffmana" - jak zacząć?

0

Hej, za dwa tygodnie mam do oddania projekt o podanej wyżej tematyce. Robię go razem z moim kolegą, który jest bardziej ogarnięty jeśli chodzi o programowanie, jednak nie wiemy jak się za to zabrać. Gadaliśmy z prowadzącym i powiedział tyle co nic: napisać algorytm w kodzie który coś kompresuje i zrobić do tego dokumentację. Inne osoby też się dopytywały co i jak z różnych tematów, jednak też nie jasno wytłumaczył. Jedyna pomoc w Was :) Proszę o podpowiedzenie jak się do tego zabrać, krok po kroku. Nie oczekuję zrobienia za mnie roboty, tylko podpowiedzenia od czego konkretnie to zacząć. I jeszcze dodam, że podstawy programowania zaczęliśmy równolegle z tym projektem. Na jednym przedmiocie się tego uczymy (programowanie w języku C), a na drugim (projekt) wymagają, że my mamy to już umieć i zrobić projekt. Trochę to wszystko dziwne... Ale nic, proszę o pomoc i bardzo dziękuję za wszystkie pomocne odpowiedzi :)

PS. W załączniku wymagania projektu. Czytałem to, jednak nie wiem jak się do nich zastosować w przypadku kompresji (co konkretnie ma mi program kompresować?).

1

Przede wszystkim najpierw zacznijcie od googlowania :)
http://www.programminglogic.com/implementing-huffman-coding-in-c/

0

Mozesz spojrzeć jak to jest w RFC z deflate. Zlib jest opensurce.

yo.

0

Kodowanie Huffmana to bardzo prosty algorytm, kod nie powinien zająć więcej niż kilkadziesiąt linijek.W czym konkretnie jest problem? Tutaj są przykładowe implementacje w wielu językach: http://rosettacode.org/wiki/Huffman_coding. Nie polecam zaglądania do kodu zlib, bo tam jest to o wiele bardziej skomplikowane.

0

Po wciśnięciu "jedynki" program jakby zawiesza się i nic dalej się nie dzieje...


#include <stdio.h>
#include <stdlib.h>
#include <math.h>

#define len(x) ((int)log10(x)+1)

/* Node of the huffman tree */
struct node{
  int value;
  char letter;
  struct node *left,*right;
};

typedef struct node Node;

/* 81 = 8.1%, 128 = 12.8% and so on. The 27th frequency is the space. Source is Wikipedia */
int englishLetterFrequencies [27] = {81, 15, 28, 43, 128, 23, 20, 61, 71, 2, 1, 40, 24, 69, 76, 20, 1, 61, 64, 91, 28, 10, 24, 1, 20, 1, 130};

/*finds and returns the small sub-tree in the forrest*/
int findSmaller (Node *array[], int differentFrom){
  int smaller;
  int i = 0;

  while (array[i]->value==-1)
    i++;
  smaller=i;
  if (i==differentFrom){
    i++;
    while (array[i]->value==-1)
      i++;
    smaller=i;
  }

  for (i=1;i<27;i++){
    if (array[i]->value==-1)
      continue;
    if (i==differentFrom)
      continue;
    if (array[i]->value<array[smaller]->value)
      smaller = i;
  }

  return smaller;
}

/*builds the huffman tree and returns its address by reference*/
void buildHuffmanTree(Node **tree){
  Node *temp;
  Node *array[27];
  int i, subTrees = 27;
  int smallOne,smallTwo;

  for (i=0;i<27;i++){
    array[i] = malloc(sizeof(Node));
    array[i]->value = englishLetterFrequencies[i];
    array[i]->letter = i;
    array[i]->left = NULL;
    array[i]->right = NULL;
  }

  while (subTrees>1){
    smallOne=findSmaller(array,-1);
    smallTwo=findSmaller(array,smallOne);
    temp = array[smallOne];
    array[smallOne] = malloc(sizeof(Node));
    array[smallOne]->value=temp->value+array[smallTwo]->value;
    array[smallOne]->letter=127;
    array[smallOne]->left=array[smallTwo];
    array[smallOne]->right=temp;
    array[smallTwo]->value=-1;
    subTrees--;
  }

  *tree = array[smallOne];

return;
}

/* builds the table with the bits for each letter. 1 stands for binary 0 and 2 for binary 1 (used to facilitate arithmetic)*/
void fillTable(int codeTable[], Node *tree, int Code){
  if (tree->letter<27)
    codeTable[(int)tree->letter] = Code;
  else{
    fillTable(codeTable, tree->left, Code*10+1);
    fillTable(codeTable, tree->right, Code*10+2);
  }

  return;
}

/*function to compress the input*/
void compressFile(FILE *input, FILE *output, int codeTable[]){
  char bit, c, x = 0;
  int n,length,bitsLeft = 8;
  int originalBits = 0, compressedBits = 0;

  while ((c=fgetc(input))!=10){
    originalBits++;
    if (c==32){
      length = len(codeTable[26]);
      n = codeTable[26];
    }
    else{
      length=len(codeTable[c-97]);
      n = codeTable[c-97];
    }

    while (length>0){
      compressedBits++;
      bit = n % 10 - 1;
      n /= 10;
      x = x | bit;
      bitsLeft--;
      length--;
      if (bitsLeft==0){
        fputc(x,output);
        x = 0;
        bitsLeft = 8;
      }
      x = x << 1;
    }
  }

  if (bitsLeft!=8){
    x = x << (bitsLeft-1);
    fputc(x,output);
  }

  /*print details of compression on the screen*/
  fprintf(stderr,"Original bits = %d\n",originalBits*8);
  fprintf(stderr,"Compressed bits = %d\n",compressedBits);
  fprintf(stderr,"Saved %.2f%% of memory\n",((float)compressedBits/(originalBits*8))*100);

  return;
}

/*function to decompress the input*/
void decompressFile (FILE *input, FILE *output, Node *tree){
  Node *current = tree;
  char c,bit;
  char mask = 1 << 7;
  int i;

  while ((c=fgetc(input))!=EOF){

    for (i=0;i<8;i++){
      bit = c & mask;
      c = c << 1;
      if (bit==0){
        current = current->left;
        if (current->letter!=127){
          if (current->letter==26)
            fputc(32, output);
          else
            fputc(current->letter+97,output);
          current = tree;
        }
      }

      else{
        current = current->right;
        if (current->letter!=127){
          if (current->letter==26)
            fputc(32, output);
          else
            fputc(current->letter+97,output);
          current = tree;
        }
      }
    }
  }

  return;
}

/*invert the codes in codeTable2 so they can be used with mod operator by compressFile function*/
void invertCodes(int codeTable[],int codeTable2[]){
  int i, n, copy;

  for (i=0;i<27;i++){
    n = codeTable[i];
    copy = 0;
    while (n>0){
      copy = copy * 10 + n %10;
      n /= 10;
    }
    codeTable2[i]=copy;
  }

return;
}

int main(){
  Node *tree;
  int codeTable[27], codeTable2[27];
  int compress;
  char filename[20];
  FILE *input, *output;

  buildHuffmanTree(&tree);

  fillTable(codeTable, tree, 0);

  invertCodes(codeTable,codeTable2);

  /*get input details from user*/
  printf("Type the name of the file to process:\n");
  scanf("%s",filename);
  printf("Type 1 to compress and 2 to decompress:\n");
  scanf("%d",&compress);

  input = fopen(filename, "r");
  output = fopen("output.txt","w");

  if (compress==1)
    compressFile(input,output,codeTable2);
  else
    decompressFile(input,output, tree);

  return 0;
}
Po wciśnięciu "jedynki" program jakby zawiesza się i nic dalej się nie dzieje...

1 użytkowników online, w tym zalogowanych: 0, gości: 1