Siemka! Jak mogę wykryć dźwięk, a potem przetworzyć go na tekst (chociaż tutaj posłużyłbym się raczej google voice). Tak czy inaczej muszę wiedzieć kiedy zacząć nagrywać, więc jak? Jakie biblioteki czy coś innego polecacie? :)
przykład:
Mam odpalony programik w tle (tray). Kiedy wypowiem "KSIEZNICZKO ZACZYNAMY" (gdzie księżniczko to tylko przykład ;3 ) to program odpala się normalnie i zaczyna przetwarzać kolejne polecenia np. "KSIEZNICZKO JAKA JEST POGODA" (tutaj jak już wspomniałem przetwarzałbym - chyba - tekst, tak aby na podstawie słow kluczowych wykonywać działania).
A więc jak wykrywać dźwięk na wejściu, przy określonej sekwencji słów?