Zaawansowana kompresja dzwieku...

0

Zastanawiam sie nad wykorzystaniem algorytmow fft do kompresji dzwieku podobnej do mp3...
Mialoby to dzialac mniej wiecej tak:
1 - pobierz kawalek danych,
2 - FFT
3 - skonwertuj dane z FFT na wykres typu rectangle
4 - wywal z danych wykresu:
a) najnizsze czestotliwosci
b) najwyzsze czestotliwosci
c) wszytsko co jest ponizej pewnej granicy (slyszalnosci)
d) dzwieki posrednie
5 - przeksztalc przerobiony wyres z powrotem na dane FFT
6 - IFFT (inverse fft)
7 - wywal na wyjscie (karta dzwiekowa)

Czy jest sens probowac zrealizowac to w praktyce ??

0

Jeszcze dorzuć usunięcie dźwięków cichych przy obecności innych głośnych w innych kanałach i dla przyjemności możesz się bawić :)
A tak w ogóle to na stronie instytutu Fraunhoffera jest opis działania algorytmu kompresji do mp3

0

Heh czytałem troszke o mp3 ale wolałbym sobie <ort>rzycie </ort>utrudnic i samemu cos napisac :)

0

To może ogg?? :D

0

Czy jest sens probowac zrealizowac to w praktyce ??

No ba! Jak nie jak tak :) Ja sie bawilem kompresja grafiki i w sumie tez tylko dla siebie :) Ale udalo mi sie cos takiego zrobic ze obrazki takie jak np rysunki techniczne kompresowane sa lepiej niz png zajmuja mniej wiecej 70% tego co ten sam plik png To chyba calkiem niezly wynik :) Proboj proboj moze wyjdzie cos z tego dobrego :) Geates tez od czegos zaczynal :d

0

O ile wiem, jest problem z inverse fft:

fft robi sie z pewnej liczby probek (sporej, jesli rozdzielczosc zwlascza w niskich f ma byc jaka taka). Wynik jest wiec okreslony nie dla punktu, a dla pewnego przedzialu czasowego. Po inversie masz 'rozmazanie' w tym przedziale. Dla fft 1024 i f_samp 44.1 jest to rzedu 1/44 sek, czyli b. duzo.

0

O ile wiem, jest problem z inverse fft:
(ciach)
Dla fft 1024 i f_samp 44.1 jest to rzedu 1/44 sek, czyli b. duzo.

Ej, chyba coś nie tak. Owszem, fft sygnału objętego oknem prostokątnym ma kiepską rozdzielczość częstotliwościową, ale zawsze ifft(fft(x)) = x (z dokładnością arytmetyki zmiennoprzecinkowej), więc samo zastosowanie transformaty nie ma znaczenia dla jakości sygnału.

BTW: próbował się ktoś bawić przesuwaniem częstotliwości dźwięku? Napisałem skrypt dla Matlaba, który robi w ten sposób nieziemskie rzeczy z dźwiękiem :-) mogę go udostępnić chętnym... [browar]

1 użytkowników online, w tym zalogowanych: 0, gości: 1