rozpoznawanie mowy

Odpowiedz Nowy wątek
2005-05-30 23:53
0

hej,

chcialbym napisac/skopiowac program ktory na podstawie nagranego wav'a (z mowa) rozpozna poszczegolne fonemy, czyli wyrzuci mi plik zawierajacy wiersze z czasem i okreslonym fonemem, czy to jest trudne ? czy ma ktos jakies zrodla?

thx

Pozostało 580 znaków

2005-05-31 00:38
Talib (niezalogowany
0

Chyba za dużo się sceince fiction naoglądałeś ;)
nie bierz tego do siebie, ale już fakt, że nie potrafisz tego napisać i nie potrafisz się do tego zabrać (ja też :P ) jest dostatecznym powodem aby to dać do nietuzinkowych tematów ;)
To bardzo ciekawy temat, ciekwe co inni napiszą...
ale to może być nawet trudniejsze od syntezy mowy...
Pamiętaj: żeby człowiek zrozumiał potrzeba mniej niż żeby komputer zrozumiał ;)
powodzenia ;)

Pozostało 580 znaków

2005-05-31 01:13
0

Ja tylko powiem że chyba nie obejdzie się bez sieci neuronowych. Domyślam się że nie znasz tej tematyki i nie chcąc Cie zniechęcać powiem tylko że chyba sobie nie poradzisz w takiej sytuacji...

P.S. Też swego czasu chciałem coś takiego zrobić - rozpoznawanie zaledwie kilku słów, ale poprzestałem, może kiedyś :)

Pozostało 580 znaków

2005-05-31 09:04
kts
0

temat spoko ;),

do rozpoznawania mowy potrzebne sa tzw. Ukryte Modele Markova (Hidden Markov Models HMM), ktore za pomoca kosztow obliczaja prwdopodobienstwo wystapienia danej gloski, ukryte dlatego, bo nie widac ich stanow,
do tego potrzebujesz tez troche wiedzy z przetwarzania sygnalow, a konkretnie sygnalu mowy, LPC (linear prediction coefficients - wspolczynniki predykcji liniowej), CC (cepstral coefficients), Spektrogram + Formanty, FFT...
jezeli chodzi o neuronowki, to tez cos slyszalem, ale niestety, nic konretnego na ten temat nie znam,
generalnie google powinno ci pomoc:

hmm + speech recognition + ...???

dodac moge tyle, ze to nie jest kod, ktore sie pisze przez weekend,
albo po wieczornej kapieli, nawet, jezeli jestes dobrym programista,
raczej temat na prace mgr.

pozdrawiam

Pozostało 580 znaków

2005-05-31 18:22
2007-01-14 19:02
kh4der4ch
0

Czy komus cos sie udało napisac? Mnie korci w Javie...

HMM. i skorzystać z IBM ViaVoice for Linux...

PS
Temat ciekawy

Pozostało 580 znaków

2007-01-14 19:57
db2k7
0

Hi kh4der4ch

W Javie - na poczatek koders.. np.
package edu.cmu.sphinx.model.acoustic;

Pozostało 580 znaków

Odpowiedz
Liczba odpowiedzi na stronę

1 użytkowników online, w tym zalogowanych: 0, gości: 1, botów: 0