Sterowanie aplikacją za pomocą mowy

0

Mam aplikację i chciałbym aby użytkownik mógł wydawać polecenia głosowe na które będzie ona reagowała. Czy ktoś z was miał styczność z czymś takim ? Interesuje mnie wszelka literatura, która pomoże sie do tego zabrać. Jeżeli chodzi o speech to text to skorzystam z gotowego API. Mnie interesuje jak ugryźć algorytm, który miałby otrzymane zdanie zamienić na komendę.

0

Kiedyś coś próbowałem pod androidem, korzystając z ich usługi rozpoznawania mowy. Działało tak sobie, a API google w tej materii jest beznadziejne (daje tylko czysty tekst w postaci paru możliwości, zamiast pozwalać na przetwarzanie zapisu fonetycznego by łatwiej wyłapywać podobieństwa komend).
Pod Winodws Phone jest lepiej, można zdefiniować gramatykę komend (linka pod ręką nie mam). Niestety nie miałem okazji tego testować.
Teoretycznie pod Windows powinno być podobnie.
Wygooglanie czegoś sensownego nie jest trudne.

0

Algorytmów związanych z przetwarzaniem języka naturalnego jest dużo, ale to jest bardzo skomplikowane zagadnienie. Szczególnie jeśli chcesz używać języka polskiego.
Tysiące naukowców zajmują się tym problemem np. w IBM Watson Research Center, w Google, Microsofcie.
Proponuje póki co poprzestać na jakimś prostym sposobie -> sprawdzasz czy wydane polecenie zgadza się z jakąś z góry znaną listą komend ;] Ewentualnie rozszerzasz to o szukanie znanych komend podobnych do tej powiedzianej (np. odległością edycyjną) żeby wykluczyć "literówki"

0
Shalom napisał(a):

Algorytmów związanych z przetwarzaniem języka naturalnego jest dużo, ale to jest bardzo skomplikowane zagadnienie. Szczególnie jeśli chcesz używać języka polskiego.
Tysiące naukowców zajmują się tym problemem np. w IBM Watson Research Center, w Google, Microsofcie.
Proponuje póki co poprzestać na jakimś prostym sposobie -> sprawdzasz czy wydane polecenie zgadza się z jakąś z góry znaną listą komend ;] Ewentualnie rozszerzasz to o szukanie znanych komend podobnych do tej powiedzianej (np. odległością edycyjną) żeby wykluczyć "literówki"

Gramatykę zdań mam już opracowaną. Problem polega na tym, że komendy wydawane przez użytkownika będą zawierały elementy dynamiczne czyli nie będzie to polecenie typu "zaakceptuj", ale coś w rodzaju "Wyślij maila do ojca cześć ojciec co tam słychać". Wiem, że to skomplikowane, ale tak to ma domyślnie wyglądać. Będzie to prawdopodobnie oparte o przeszukiwanie "słowników". Oczywiście nie będę tutaj nawet próbował robić algorytmu, który nauczy się gramatyki języka. Na początek zacznę od prostego przyrównywania zdania wypowiedzianego przez użytkownika do zdefiniowanych wzorów, tylko właśnie gdzie zacząć ? Są jakieś dziedziny informatyki zajmujące się tym tematem, abym mógł poczytać porządną literaturę ? Google też zbytnio nie pomaga.

0

Są jakieś dziedziny informatyki zajmujące się tym tematem, abym mógł poczytać porządną literaturę

Natural Language Processing.

1 użytkowników online, w tym zalogowanych: 0, gości: 1