Sterowanie za pomocą głosu

0

Właśnie jak zrobić sterowanie za pomocą głosu. Np. wykrywanie podobnych dźwięków i wykonywanie odpowiednich akcji. Czy jest to mozliwe już czy to dopiero epoka matrixa?

Pozdrawiam

0

To zdecydowanie epoka matrixa :-)
Poszukaj na forum, gdzies to bylo.

0

poczytaj o perlbox-voice np. (sphinx i festival)

0

Microsoft Office XP/2003 w wersji angielskiej, japońskiej i chińskiej instalują alternatywne sposoby wprowadzania danych: speech recognition oraz handwriting. Działa podobno zaskakująco dobrze nawet przy dużych szumach i zniekształceniach.

http://office.microsoft.com/en-ca/assistance/HP030850221033.aspx
http://support.microsoft.com/?kbid=823586
http://www.glencoe.com/ps/computered/pas/article.php4?articleId=451

0

jeśli chcesz po angielsku to jest coś takiego jak Speech SDK można w tym programować interfejs głosowy są fajne przykłady.

0

Radziłbym zainteresować się sieciami neuronowymi (rozpoznawanie pisma i mowy), fajna sprawa. W najprostrzym opisie polega to na tym, iż program (a właściwie sieć neuronowa) "uczy" się charakterystycznych cech mowy danej osoby (dlatego wymagane jest wstepne przeczytanie tekstu, zanim zaczniemy programem cokolwiek sterować). Swoją drogą w Linux'ie był (moze i dalej jest) projekt sterowania komputera za pomocą głosu. W czasie kiedy sie o tym dowiedziałem, było to w fazie zabawy i experymentów. Nie ulega jednak wątpliwości, że sterowanie głosem bedzie nowym interfejsem miedzy nami ludkami a tymi czarnymi skrzynkami zwanymi maszynami liczącymi :>

Opera ma silnik do sterowania mową. Wykorzystywany jesat standard VoiceXML o ile się nie myle.
Maiłem zrobić stronke internetową sterowaną głosem. Co i jak masz tutaj:
http://aipsa.ita.pwr.wroc.pl/lab/simplewiki/sql/wiki.php?q=Witryny%20wielomodalne

Większość programików do rozpoznawania mowy pisanych jest dla języka angielskiego, np: "Realize Voice", "IBM ViaVoice Pro", "Natural Voice English"

0

A ja mam taki mały pomysł:
Jak bawiłem sie kiedyś nokią 3310 to dogłębniej przyjrzałem sie wybieraniu głosowemu, zauważyłem że telefon jak by zwraca uwage na jakieś konkretne sygnały na przykład szumy. Miało to działać tak że jak nagram se np.: "[mówie: dzwoń][dmucham w mikrofon]" to potem moge użyć takiej formułki: "[dmucham w mikrofon][śpiewam piosenke]" to i tak wykryje do kogo chce dzwonić [!!!] Wniosek z tego taki że można ustalić jakiś próg czasowy (np.: 50ms) i z 500ms nagrania wcześniej zarejestrowanego porównuje sie fragment od 1ms do 50ms z nagraniem wejściowym (najpierw od 1ms do 50ms potem od 2ms do 51ms itd) a potem z nagrania wcześniej zarejestrowanego porównuje sie fragmenty od 2ms do 51ms i tak w kółko. A żeby porównywanie było łatwiejsze to nasze nagrania (nagranie wcześniej zarejestrowane i nagranie wejściowe) troche "updbnić": weźmy na przykład zmniejszmy jakość nagrania. Mamy próbkowanie co powiedzmy 1ms to weźmy 2 pierwsze wywalmy, zostawmy trzecią, następne dwie wywalmy trzecią zostawmy, w ten oto sposób będzie większe prawdopodobięstwo zwrócenia true przez function porównaj(wav1, wav2)
Troche to zagmatwane ale rano spróbuje to troche jaśniej wyjaśnić.
Teraz tylko wytłumacze że moja propozycja polega na zarejestrowaniu komendy i porównaniu jej z wcześniej zarejestrowaną.

0

Jeśli temat nadal aktualny, to jest biblioteka .DLL FREEWARE oraz plik nagłówkowy do niego .h który "robi" "rozpoznawanie" mowy jak w Nokia 3310... Zainteresowanym podaję WWW gdzie to lezy:

http://www.cin.pojan.net/programy.html

Mam też działające DEMO...

Nie jestem autorem tej biblioteki. :)

1 użytkowników online, w tym zalogowanych: 0, gości: 1