Porównywanie dwóch Wav-ów

0

Jak porównać, w ilu procentach dwa pliki WAV są do siebie podobne???

0

wlasnei tez szukam na to odpowiedzi bo proboje zrobic rozpoznawanie mowy, a moglo by to byc na zasadzie, nagrywa do wava i porownoje z szablonem... a wie ktos jak zrobic syntezator mowy ??

0

Niebanalne, wprost to efekt mizerny będzie ...
10 lat temu się tym interesowałem (to się chyba analizę FFT robiło) ale jak człek wsiąknie w te bazy w robocie to mu tylko nos czasami wystaje i se w domu w Delphi porzeźbi.

Pozdrawiam

Kris

0

Bardzo trudne zagadnienie (chyba powinno wylądować w dziale Gorące Tematy.
Najpierw należałoby zdefinować, co oznacza, że dwa dźwięki są podobne. Prawdopodobnie istotne są tutaj odczucia słuchacza. Więc należałoby to liczyć jako pewnego rodzaju średnią ważoną. Wiadomo np., że lepiej słyszymy dźwięki w granicach 1-3 kHz niż np. skrajne 20 Hz czy 20 kHz (ja to już tego ostatniego to pewnie nie usłyszę, a to pierwsze to co najwyżej mój żołądek może poczuć). Tak samo trzeba brać pod uwagę dźwięk polifoniczny. Nakładanie się głośnego dźwięku oraz cichego powoduje, że raczej tego cichego nie usłyszymy (choć w postaci cyfrowej w wave przy porównywaniu jedynie częstotliwości może być kolosalna różnica). Tak samo jest ze wzrostem częstotliwości i innymi charakterystycznymi zjawiskami, które powodują troszkę inne odczuwanie przez nas dźwięków, niżby to wynikało z tych liczb określających dźwięk.
Nie wspominam tutaj już o przesunięciu dźwięku względem siebie czy też nieznacznym wydłużeniu lub skróceniu sygnału (dla nas prawie nieodczuwalne, ale w cyferkach to jest duża różnica).

Do takich zagadnień przydałby się człowiek, znający się na ludzkich zmysłach :)

0

To już było:

http://4programmers.net/Forum/viewtopic.php?id=851#938

PS. W tamtym poście pisałem m.in. o niejakim Remezie, który sprowadzał mowę do uproszczonej postaci (suma 3 czystów tonów o częstotliwościach odwzorowujących częstotliwości 3 najsilniejszych formantów oryginalnego sygnału) i było to zrozumiałe. Ostatnio czytałem, że są kłopoty z powtórzeniem tego w innych laboratoriach. Możliwe wiec, że Remez popełnij jakiś błąd... sprawa nie jest tak prosta jak sie wydawało.

0

<font color="darkblue">Też kiedyś się tym interesowałem :-)
...Tyle że ja chciałem sobie zrobić w kompie głosowe logowanie
(zamiast wpisywać hasło literkami >> nagrać je do jakiegoś *.wav'a i niech komp je rozpozna ;-) )
Tu jest o tyle prościej, że porównywałby tylko z jednym wzorcem i w dodatku nie mógłby przecież za bardzo uogólniać (tak by :-D nie potraktował hasła wypowiedzianego przez moją siostrę jak te przeze mnie).

[stuk] tyle że niczego interesującego nie znalazłem i przestałem zajmować się tym tematem [glowa] </span>

0

Jak na mój gust, to z tym "słuchaniem" haseł, to nie najlepszy pomysł... Musiałbyś mieć gdzieś zapisane wav'y, które po oddtworzeniu odpowiadałyby na bardzo proste pytanie... "Jakie jest hasło?" :) Nie jest to raczej najbezpieczniejszy sposób przechowywania...

0

Jak na mój gust, to z tym "słuchaniem" haseł, to nie najlepszy pomysł... Musiałbyś mieć gdzieś zapisane wav'y, które po oddtworzeniu odpowiadałyby na bardzo proste pytanie... "Jakie jest hasło?" :) Nie jest to raczej najbezpieczniejszy sposób przechowywania...

Jak ktos nie zna hasla, to sie nie dostanie do kompa :-)

0

Tak... Ale wyobraź sobie, że masz powiedzmy ze trzech userów, każdy swoje hasło i swoje zasoby nim zabezpieczone. Teraz jeden z nich wchodzi na swoje hasło i może przeczytać... podsłuchać hasła innych, i dostać się do ich zasobów... A przechowywanie wava na dysku, do którego dostęp byłby strzeżony hasłem nie ma sensu, bo żeby je odczytać NAJPIERW musiałbyś uzyskać do niego dostęp... i jeszcze jedno... system operacyjny (a już na pewno windows) nie zabezpieczy cię przed wejściem "niepożądanych gości" - mam u siebie dyskietkę, która (w wyniku błędu) po włożeniu do stacji zawiesza kompa, za drugim razem przy próbie odczytu resetuje ustawienia biosa i WIO masz dostęp w zasadzie do wszystkiego... Nie jest miło nie??? :)
P.S.: W biosie ustawiasz sobie start z dyskietki, potem w zależności od systemu wkładasz dyskietkę startową DOS'a albo linuxa - w DOSie dostajesz się do dysku windowsowego, za to z dyskietki linuxowej bez pytania o hasło logujesz się na roota, i masz dostęp do wszystkiego (podobnie z innymi systemami)
P.S. 2: Mam za to inny pomysł... komputer mógłby robić jedną rzecz... rozpoznawać głos, niezależnie od hasła, osoby, która chce się zalogować... To by było raczej bezpieczniejsze... :)

0

Adam.Pilorz: a słyszałeś o funkcjach jednostronnych służących do szyfrowania? To pierwsze używane metody szyfrowania w komputerach (w systemach wielodostepowych).

0

Adam.Pilorz >> ty mnie po prostu nie zrozumiałeś!!

Nie chodzi o to żeby komp z głosu odczytał <font color="red">chasło</span> >> tylko żeby rozpoznał <font color="red">hasło</span> powiedziane <font color="red">głotem</span> user'a!!
To znaczy: że nawet jakby moja siostra (np) siedząc obok usłyszała jakie <font color="red">chasło mówie</span> mojemu komputerkowi i potem je powtórzyła to komp by tego nie zaakceptował ponieważ moja siostra ma inaczej brzmiący głos niż ja...

żeby się włamac do kompa mogłaby spróbować nagrać mnie (jak mówię to <font color="red">hasło</span>) i odtworzyć kompowi, jak nagranie miałoby wystarczającą jakość to może komp by je zaakceptował >> ale tego nie da się uniknąć.

a propoS hashowania:
<font color="red">żeczywiście</span> to ciekawy pomysł>> możnaby zrobic funkcję generującą w jakiś sposób hasło (w postaci literkowej) z dzwięku. Dzięki temu <font color="red">możnaby niezapisywać</span> nigdzie pliku (*.wav ani żadnego innego) z dzwiękiem.

[zdecyduj się: hasło albo chasło]

0

na komorkach jest nagrywanie i pozniej glosowe wybieranie <- wiec jak to zrobic?

1 użytkowników online, w tym zalogowanych: 0, gości: 1