Sterowanie za pomocą głosu

Odpowiedz Nowy wątek
2006-06-02 19:04
0

Właśnie jak zrobić sterowanie za pomocą głosu. Np. wykrywanie podobnych dźwięków i wykonywanie odpowiednich akcji. Czy jest to mozliwe już czy to dopiero epoka matrixa?

Pozdrawiam

Pozostało 580 znaków

2006-06-02 19:24
0

To zdecydowanie epoka matrixa :-)
Poszukaj na forum, gdzies to bylo.

Pozostało 580 znaków

2006-06-02 20:36
0

poczytaj o perlbox-voice np. (sphinx i festival)


Pozdrawiam. Karol

Pozostało 580 znaków

2006-06-03 00:01
0

Microsoft Office XP/2003 w wersji angielskiej, japońskiej i chińskiej instalują alternatywne sposoby wprowadzania danych: speech recognition oraz handwriting. Działa podobno zaskakująco dobrze nawet przy dużych szumach i zniekształceniach.

http://office.microsoft.com/e[...]ssistance/HP030850221033.aspx
http://support.microsoft.com/?kbid=823586
http://www.glencoe.com/ps/com[...]as/article.php4?articleId=451


<font color="red">Konto porzucone</span>

Dzięki wszystkim forumowiczom za lata wspólnych dyskusji; miłej zabawy w programowanie!
Sławomir 'Szczawik' Włodkowski

Pozostało 580 znaków

2006-07-05 20:37
0

jeśli chcesz po angielsku to jest coś takiego jak Speech SDK można w tym programować interfejs głosowy są fajne przykłady.

Pozostało 580 znaków

2006-07-16 20:43
0

Radziłbym zainteresować się sieciami neuronowymi (rozpoznawanie pisma i mowy), fajna sprawa. W najprostrzym opisie polega to na tym, iż program (a właściwie sieć neuronowa) "uczy" się charakterystycznych cech mowy danej osoby (dlatego wymagane jest wstepne przeczytanie tekstu, zanim zaczniemy programem cokolwiek sterować). Swoją drogą w Linux'ie był (moze i dalej jest) projekt sterowania komputera za pomocą głosu. W czasie kiedy sie o tym dowiedziałem, było to w fazie zabawy i experymentów. Nie ulega jednak wątpliwości, że sterowanie głosem bedzie nowym interfejsem miedzy nami ludkami a tymi czarnymi skrzynkami zwanymi maszynami liczącymi :>

Opera ma silnik do sterowania mową. Wykorzystywany jesat standard VoiceXML o ile się nie myle.
Maiłem zrobić stronke internetową sterowaną głosem. Co i jak masz tutaj:
http://aipsa.ita.pwr.wroc.pl/[...].php?q=Witryny%20wielomodalne

Większość programików do rozpoznawania mowy pisanych jest dla języka angielskiego, np: "Realize Voice", "IBM ViaVoice Pro", "Natural Voice English"


Wszyscy wiedzą, że coś nie da się zrobić.
I wtedy pojawia się ten jeden, który nie wie, że się nie da,
i on właśnie to coś robi.

Pozostało 580 znaków

2006-07-17 00:50
0

A ja mam taki mały pomysł:
Jak bawiłem sie kiedyś nokią 3310 to dogłębniej przyjrzałem sie wybieraniu głosowemu, zauważyłem że telefon jak by zwraca uwage na jakieś konkretne sygnały na przykład szumy. Miało to działać tak że jak nagram se np.: "[mówie: dzwoń][dmucham w mikrofon]" to potem moge użyć takiej formułki: "[dmucham w mikrofon][śpiewam piosenke]" to i tak wykryje do kogo chce dzwonić [!!!] Wniosek z tego taki że można ustalić jakiś próg czasowy (np.: 50ms) i z 500ms nagrania wcześniej zarejestrowanego porównuje sie fragment od 1ms do 50ms z nagraniem wejściowym (najpierw od 1ms do 50ms potem od 2ms do 51ms itd) a potem z nagrania wcześniej zarejestrowanego porównuje sie fragmenty od 2ms do 51ms i tak w kółko. A żeby porównywanie było łatwiejsze to nasze nagrania (nagranie wcześniej zarejestrowane i nagranie wejściowe) troche "updbnić": weźmy na przykład zmniejszmy jakość nagrania. Mamy próbkowanie co powiedzmy 1ms to weźmy 2 pierwsze wywalmy, zostawmy trzecią, następne dwie wywalmy trzecią zostawmy, w ten oto sposób będzie większe prawdopodobięstwo zwrócenia true przez function porównaj(wav1, wav2)
Troche to zagmatwane ale rano spróbuje to troche jaśniej wyjaśnić.
Teraz tylko wytłumacze że moja propozycja polega na zarejestrowaniu komendy i porównaniu jej z wcześniej zarejestrowaną.

Pozostało 580 znaków

2008-11-12 09:28
0

Jeśli temat nadal aktualny, to jest biblioteka .DLL FREEWARE oraz plik nagłówkowy do niego .h który "robi" "rozpoznawanie" mowy jak w Nokia 3310... Zainteresowanym podaję WWW gdzie to lezy:

http://www.cin.pojan.net/programy.html

Mam też działające DEMO...

Nie jestem autorem tej biblioteki. :)


...bo chcieć to móc.

Pozostało 580 znaków

Odpowiedz
Liczba odpowiedzi na stronę

1 użytkowników online, w tym zalogowanych: 0, gości: 1, botów: 0