Systemy Inteligentnej Konwersacji

0

Chciałbym rozpocząć temat z działu SI, do którego proponuje wyciągnąć duze armaty programistyczne.

Mianowicie interesuje mnie na ile mozna oszukac czlowieka przez komputer?
A gdyby tak ...

Mozna by stworzyc bota Text to Text np w Delphi, do którego trafiają jako tekst pytanka z mikrofonu, oczywiście uprzednio rozpoznane przez System Rozpoznawania Mowy a na sam koniuszek otrzymany text przetworzymy za pomocą syntezatora mowy, dodajmu jakies grymasy w OpenGL i juz nasz bohater bedzie jak ZYW !!!

0

Człowieka nie oszukasz - To nie jest pytanie o Delphi :] i nie powisi tu długo :d

0

Ok ale mysle zaprzągnąć Delphi do tego , a poza tym da sie oszukac :) i to jeszcze jek ... heh

Chcialbym rozwazyc kwestie bota w Delphi, czyli przetwazanie języka naturalnego za pomocą badania składni i na jej podstawie budowania bazy wiedzy z której pozniej wnioskując roBOT bedzie nam inteligentnie odpowiadal.

0

Mysle ze moze sie sprzydac: http://www.piotr.tomnice.pl/Ontologia%20znaczenia.pdf

Material zaczerpniety z serwisu e-informatyka.pl

0

Fajne ok dzieki, dobry material jest o Denise 5, system przetwarzania mowy ale to jeden z <ort>modółow </ort>mojego systemu:

SpeechToText [Java] -> //komenda z mikrofonu
Text(Pytanie)ToText(Odpowiedz) [Delphi,Prolog] -> // przetworzenie na int.odpowiedz
TextToSpeech [C++ lib cos ... prppozycje ] // syntezator :>

Bardzo przydaly bysie artykuly na temat rozpoznawania mowy polskiej i syntezowania jej, robilem cos takiego ale dla ang w JSpeech i spoko dzialalo 92 % rozpoznanych komend, nio ale silnik byl niezle wypasiony ;)

Czy ktos wie moze Delphi udostępnia pomocne narządka do teko typu ceregieli ;) ??!!??

// edytuj swoje posty!!! - Ł

0

Od jakiegoś czasu piszę prostego chatbota (ale jest na razie tak głupi - a właścieiw głupia, ze wolę nie pokazywać światu), ale swego czasu sie zastanawiałem nad dodaniem Speech To Text i odwrotnie...

Text to Speech nie było trudne do dodania (eksperymentalna wersja miała tą możliwość, najnowsza nie ma na razie), na 4p jest artykuł o wykorzystaniu Syntalka, a gdyby użyc na przykład Realspeak (część próbek ma mój chatbot zapisanych na stałe, zrzuceone z dema Realspeak - to brzmi przynajmniej w miarę normalnie), to jakość była by przyjemna, i można by było nawet pomylić z człowiekiem.

Ale. Jest oczywiście jedno wielkie ale. Takie, że nie ma syntezatora, który byłby w stanie naśladować emocje. A głos bez emocji jest łatwy do wykrycia, że to nie człowiek. Człowiek bardzo rzadko mówi bez emocji. Często się śmiejemy, wstrzymujemy głos, stosujemy intonację. To jest na razie nie do zrobienia.

Co do rozpoznawania mowy to ja jestem załamany obecnym zaawansowaniem tej technologii.

Ale nie tracę nadziei na dialog w przyszłości:
<< Kitty, jakieś nowe mejle?

Nie, Ktos, znowu nic nie przyszło. Chcesz poczytać nowe RSS za to?
<< Nie. A co na 4programmers?
154 nieprzeczytane posty. Uruchomić Firefoksa?
:D

[added]
A jeżeli chcesz oszukiwać człowieka rozmową tekstową, to przy niektórych "jellonkach" spokojnie może Ci się to udać :)

0

Spoko mi nie chodzi o cuda od razu tylko o systemik , ktory Cie przywita powie pare rzeczy i wykona co mu powiesz przechadzając sie po pokoju z mic na bluetootha.

A jak poczytasz o Denise 5 to moze sie wiele nauczyc z biegiem czasu a to ze dzwiek jest nie 100 % realny to ok, nie szkodzi ..

Co do Real Speaka to pestka bo on moze za pomoca Spikera SpeakFromClipboard(''); i to jest cool ...

0
SilverHunter140 napisał(a)

Spoko mi nie chodzi o cuda od razu tylko o systemik , ktory Cie przywita powie pare rzeczy i wykona co mu powiesz przechadzając sie po pokoju z mic na bluetootha.

Podoba mi się to :) Właśnie takie coś zacząłem robić dawno dawno temu, ale niestety ugrzęzłem na Speech To Text.

Jeżeli masz już mowę zamienioną na tekst, do dalej jest z górki. Wystarczy podzielić na wyrazy (plus ewentualne usuwanie polskich znaków i znaków przestankowych), poszukać w bazie danych czemu odpowiadają takie słowa kluczowe i dalej wykonywać operacje dla tych słów kluczowych. Wśród tego mogą być najróżniejsze bzdury, jak uruchamianie aplikacji itp.

0

OKa oka ;) Ktos czy mozesz sie podzielic adresikiem emil, bo widze ze trafilem na oka kola.A speech to text to robilem w Java z uzyciem biblioteki JSpeech i juz DZIALA :) ale ... ;( po angielsku. Dokladnie to zrobilem edytor graficzny sterowany głosem .. fajne cudo rysuj przesun i takie ta ... i cholera robile ok wiec moze buy po Polsku zechcioalo co?

0

Jak za jakiś czas jak mi się zechce poprawię klasę TBot to ją udostępnię i ona właśnie odpowiada za szukanie w bazie danych, podział na wyrazy i takie tam. Do zbudowania porstego chatbota się nada :)

A adres e-mail dostaniesz po kliknięciu na taką kopertkę obok mojego wpisu, podpisaną "Napisz do autora postu". I uwaga na drugą kopertkę dotyczącą systemu wiadomości prywatnych :)

0

dobra to ja tez dorzuce swoje 3 grosze :). Co do Speech To Text to mozna wykorzystac Microsoft Speech Application Server. Niestety umozliwia on jedynie tworzenie Web Applications i rozpoznaje chyba tylko angielska gramatyke ale w przyszlosci moze ukaza sie lokalizacje do MSAS. Zapraszam zainteresowanych na stronke http://www.codeguru.pl/Default.aspx?Page=Articles/Details&pubid=303

Pozdrawiam
Gothmog

0

Jest już firma która zrobiła oprogramowanie speech to text czyli Automatyczne Rozpoznawanie i Dekodowanie Mowy po polsku na razie pracuje na zlecenie dużych korporacyjnych klientów ale odgrażają się że niebawem wprowadzą wersję do ogólnego użytku http://www.przepisywanie.pl mówią że mają wyniki w polskim statystycznie znacznie lepsze niż microsoft w angielskim :d

0
SilverHunter140 napisał(a)

Mianowicie interesuje mnie na ile mozna oszukac czlowieka przez komputer?
A gdyby tak ...

Mozna by stworzyc bota Text to Text np w Delphi, do którego trafiają jako tekst pytanka z mikrofonu, oczywiście uprzednio rozpoznane przez System Rozpoznawania Mowy a na sam koniuszek otrzymany text przetworzymy za pomocą syntezatora mowy, dodajmu jakies grymasy w OpenGL i juz nasz bohater bedzie jak ZYW !!!

Z obecną technologią? Nie. Słyszałeś o czymś takim jak test Turinga? Jeszcze żaden program go nie przeszedł.

Już lepiej posadzić usera przed odpalonym Emacsem z M-x doctor :)

0

Ciekawe czy dożyjemy czasów, gdy mikrofon zastąpi klawiaturę ...

0

Osobiście bym wolał czytacz myśli :)

0

Tam zaraz rozpoznawać myśli. Raczej poszedłbym w stronę strerowania impulsami nerwowymi. Znaczy to taka pieśń przyszłości, ale kto wie, wpina się człowiek w kompa i impulsy nerwowe z dłoni na przykład idą do kompa. Nie trzeba mówić, wystarczy myśleć i mieć system, który jest w stanie wystarczająco szybko reagować na myśli.
Swoją drogą, ciekawe, czy jest to możliwe...

0

Jest możliwe. Widziałem ostatni program naukowy w TV. Gość wszczepił sobie w rękę "port" :) podpięty do nerwów na spodzie nadgarstka (tam gdzie tętno się sprawdza) odpowiedzialnych za mięśnie palców. Sterowanie odbywało się przez zginanie palców.

Do nerwów podpiąć się da. Tylko problem jest do których ? Tak aby człowiek potrafił myślami wysyłać do tych nerwów impulsy. Naukowiec skorzystał z nerwów wyuczonych latami dorastania, które pełnią już jakąś funkcję. Jeśli by się chcieć podpiąć do takich nerwów, które nie pełnią funkcji, albo ich funkcja jest jakąś błahostką, to wytrenowanie ich z pewnością zajęłoby dużo czasu, jeżeli w ogóle dało by się je wytrenować.

0

Tak samo ostatnio udalo sie naukowcom wpiac w kikut szympansa bodajze, ktory to szympans byl w stanie po niedlugim treningu sterowac mechaniczna reka, tak jak swoja.

Natomiast, zeby sledzic mysli, to trzeba by sie raczej do mozgu wpiac, bo impulsy 'myslowe' raczej nie wystepuja w rece :P

0

adf - też to widziałem. Jednak nie do końca o to mi chodziło, chociaż w miarę blisko ;) bo mi własnie chodzi to to, żeby nie musiec konkretnie palcem ruszać. Nie wiem, urządzenie wyłapuje impulsy, które oznaczają zgięcie palca i czytają to za click, ale sam palec się nie zgina. Po co machać łapą na darmo ;)

Co do wpinania się do mózgu to już bardziej. ale kto pozwoli se wstrzelić w mózg port usb? ;)

Tu ciągle potrzeba czegoś innego. Mało inwazyjnego (wszczepienie sobie czegoś w rękę uważam za mniej inwazyjne niż wbicie tego w czaszkę ;) ), o szerokim spektrum możliwości. Może coś z detekcją ruchu gałek ocznych? Z tym już chyba nawet się bawili. Może skanowanie fal czy co tamz mózgu sie wydostaje, ale nieinwazyjnie? A może jeszcze coś innego? Kurczę, wygodnie byłoby nie klepać w klawiaturę, tylko myślec a samo się pisze. I mniej literówek i szybciej. Dobre by było.

Sterowanie głosem zaś do mnie nie przemawia. Sprawdza się w niektórych zastosowaniach, jak na przykład dyktowanie dłuższych listów czy czegoś takiego, pauzowanie przewijanie itp. winampa czy innego odtwarzacza audio/video. Ale już sterowanie calym systemem, przeglądarką, oprogramowaniem za pomocą głosu się nie sprawdzi. Za dużo hałasu, na dłuższą metę męczące dla gardła, do tego nie koniecznie człowiek chce ciagle gadać. Jak puszczę foobara, to chcę muzy słuchać, a nie własnego głosu: nowa, www.4programmers.net, czytaj ostatnie posty, zamknij, następna, zamknij, następna, do góry, w dół, w dół, w bok.... no zwariować by można ;)

0
pako1337 napisał(a)

Sterowanie głosem zaś do mnie nie przemawia. Sprawdza się w niektórych zastosowaniach, jak na przykład dyktowanie dłuższych listów czy czegoś takiego, pauzowanie przewijanie itp. winampa czy innego odtwarzacza audio/video. Ale już sterowanie calym systemem, przeglądarką, oprogramowaniem za pomocą głosu się nie sprawdzi. Za dużo hałasu, na dłuższą metę męczące dla gardła, do tego nie koniecznie człowiek chce ciagle gadać. Jak puszczę foobara, to chcę muzy słuchać, a nie własnego głosu: nowa, www.4programmers.net, czytaj ostatnie posty, zamknij, następna, zamknij, następna, do góry, w dół, w dół, w bok.... no zwariować by można ;)
Ja nie mówiłem o myszce, a o klawiaturze :). Połączenie głos + urządzenie wskazujące może dać całkiem niezłe efekty.

0

Wydziwiacie z inwazyjnym podpinaniem się. Zawsze można choćby śledzić EEG mózgu. Kiedyś słyszałem, że pewien gość, z którym nie było w ogóle kontaktu napisał w ten sposób w miarę długi list. Fakt, zajęło mu to trochę czasu (samo nauczenie się owego pisania także), ale jednak.

Trochę odbiegamy od tematu, ale cóż ;)

0

Może i odbiegamy, ale z offtopów wyłaniają się ciekawe tematy, które można później wydzielić ;)

Dyktowanie głosem brzmi całkiem realnie, w niedługiej przyszłości kto wie.
A z tym EEG itp to wlaśnie problemem jest czas nauki, opanowanie myszki i klawiatury to kwestia minut (nie do płynnego posługiwania się, ale do na tyle dobrego, że da się pracować). Nauka na nowo myślenia, żęby komp wyłapał, czy sterowania nerwami, jak wcześniej pisałem, ma to do siebie, że czas nauki posługiwania się tym w sposób zapewniający płynną, chociaż powolną pracę, jest długi. A potrzeba czegoś dającego możliwość opanowania dla przeciętnego (od 3klasy podstawówki powiedzmy wzwyż) człowieka w godzinę lub dwie.

Mnie ciągle kusi analiza wzroku ;) To wydaje mi się całkiem rozsądne i realne. Do tego wykrywanie tekstu mówionego i byłoby już całkiem wygodne.

0

Analiza wzroku juz jest od dosc dawna. Kamera sledzi ruch oczu, ktore wskazuja znaki na klawiaturze ekranowej. Proste. Wiele osob z porazeniem miesni z tego korzysta, chyba nawet Stephen Hawking napisal w ten sposob swoje ksiazki.

0

Z tego co widzę, niektórzy są strasznie leniwi...
Dobrze czasem chociaż palcem pomachać przed komputerem, żeby całkiem atrofii nie dostać ;)

0

Hmm, o analizie wzroku spodziewałem się, że coś już będzie w tej dziedzinie, ale nie wiedziałem, że do tego stopnia. Może więc za jakiś czas będziemy klikać powiekami? :)

// w tych systemach klika się właśnie powiekami - Q

@somekind - informatyka jest nauką ludzi leniwych :P

0

Witam.
Ostatnimi czasy bez przerwy chodzi mi myśl po głowi, na temat możliwość stworzenie system operacyjnego w pełni sterowanego głosem, razem z jakimś chatbotem zapewniającym obustronną komunikację.
Nie chciałem tworzyć nowego tematu ponieważ ten, jak najbardziej pasuje tematyką, z góry przepraszam też za odkop.
Moja wizja opierała by się, na zastosowanie owego chatbota jak trzon systemu i za pomocą prostych komend typu : wyszukaj, uruchom itd, itp. uruchamianie przypisanych programów.
Wiem, że interpretacja mowy polskiej nie należy do najłatwiejszych zadań, jednak jest to wykonalne, między innymi http://www.przepisywanie.pl/.
Myślałem też nad wykorzystanie Chrome OS do tego celu jednak wymagało by to napisania systemu praktycznie od nowa, chyba że się mylę. Chciałbym przeprowadzić teoretyczną dyskusję na ten temat.

0
Trueseeker napisał(a)

Nie chciałem tworzyć nowego tematu ponieważ ten, jak najbardziej pasuje tematyką, z góry przepraszam też za odkop.

Duży duży błąd! W ten sposób nieświadomie zmuszasz ludzi do czytania kontekstu, który ma prawie 5 lat!
Efekt jest taki, że spora część nie zauważy "nekromancji" i po prostu nie będzie tego czytać.
Inna sprawa, że Chat-bot a sterowanie głosem to dwie różne sprawy, a rozpoznawanie mowy, było w tym temacie jedynie dygresją.

1 użytkowników online, w tym zalogowanych: 0, gości: 1