Automaty rozwiązujące CAPTCHA

Odpowiedz Nowy wątek
2011-08-18 13:13
0

Aloha

Znacie jakieś programy do rozwiązywania CAPTCHA? Najsłyniejszy to PWNtcha, ale od 7 lat nie rozwijany.

Potrzebuję przeanalizować moje łobrazki pod kątem wytrzymałości na obecne systemy rozpoznawania tekstu nastawione na łamanie captchy aby zarazem nie były nieczytelne dla ludzi. PWNtcha użyłem, nie złamał ani jednego, ale to dość stare narzędzie i dumam, czy są nowsze. Pogrzebałem nieco na sieci i znalazłem opis dwóch, ale autor udostępnił tylko wyniki - bez kodu ani programu (z wiadomych powodów).


"In the brave new world of the year 2000, a kiss can still break your heart." - Program from Cirque du Soleil's Alegría
Nad tymi gwiazdami jest wszechświat szybujących potworów! Wiedziałaś?
2GB za free :)

Pozostało 580 znaków

2011-08-18 13:44
1

JDownloader chyba miał swego czasu wtyczki do łamania kapci, ale teraz wszyscy przerzucili się na reCaptcha, której nie opłaca się łamać (przynajmniej w przypadku JDownloadera). Jeżeli ktoś ma problemy z tekstową reCaptchą (ja zwykle nie mam) to można sobie odpalić dźwiękową kapcię, jest bardzo prosta.

Poza tym jest jeszcze inna sprawa: twoja kapcia może wydawać się silna, bo aktualnie np żaden program jej nie łamie. Ale nie łamie tylko dlatego, że nikomu nie chciało się jej łamać. Jeżeli dana kapcia jest popularna to ktoś tam może w końcu dostać motywacji, aby próbować ją łamać.


"Programs must be written for people to read, and only incidentally for machines to execute." - Abelson & Sussman, SICP, preface to the first edition
"Ci, co najbardziej pragną planować życie społeczne, gdyby im na to pozwolić, staliby się w najwyższym stopniu niebezpieczni i nietolerancyjni wobec planów życiowych innych ludzi. Często, tchnącego dobrocią i oddanego jakiejś sprawie idealistę, dzieli od fanatyka tylko mały krok."
Demokracja jest fajna, dopóki wygrywa twoja ulubiona partia.
edytowany 2x, ostatnio: Wibowit, 2011-08-18 14:00

Pozostało 580 znaków

2011-08-18 14:41
0

Dzięki za wpis.
Rzeczywiście, zapomniałem o jDownloader. Ma on 75 (86 w trunku) różnych algorytmów pisanych pod dane strony. Właśnie lecę w pętli i testuję każdy z algorytmów na naszych obrazkach. Zapewne wynik marny (bo algorytmy specyficzne a nie ogólne) ale przynajmniej sprawdzę kolejny dostępny program.

Co do drugiego punktu to oczywiście masz rację, ale to inna sprawa.

Co do reCaptcha, to niestety nie jest tak różowo. Co jakiś czas dostaje się znaki spoza alfabetu łacińskiego. Sam dostałem deltę z matematycznego wzoru. Znajomy dostał jakiś chiński znak. Poza tym, tylko jeden wyraz jest tam sprawdzany, drugi to "fałszywka", zeskanowana i oni sami nie znają odpowiedzi.


"In the brave new world of the year 2000, a kiss can still break your heart." - Program from Cirque du Soleil's Alegría
Nad tymi gwiazdami jest wszechświat szybujących potworów! Wiedziałaś?
2GB za free :)
edytowany 1x, ostatnio: Marooned, 2011-08-18 15:41
A ja gdzieś czytałem ze ten drugi wyraz to tak nie do końca. Tzn faktycznie jest zeskanowany i sami nie wiedzą co na nim jest, ale w zwiazku z tym jest wysyłany wielokrotnie i na podstawie statystyk określają co tam faktycznie jest napisane. - Shalom 2011-08-18 14:46
Tak, ale zbieranie danych statystycznych, a sprawdzanie, czy zgadzają się ze wpisem usera, to 2 różne pary kaloszy. - Marooned 2011-08-18 14:58
Szczęściarz z Ciebie. Ja kiedyś w recaptchy miałem kwadrat. - somekind 2011-08-18 17:20

Pozostało 580 znaków

2011-08-18 15:29
0

Jak dostaniesz deltę czy chiński znak to masz dwie opcje:

  • użyć dźwiękowej kapci,
  • przeładować kapcię odpowiednim przyciskiem,

reCaptcha jest bardzo dobra z tego względu, że posiada nieskończoną ilość różnych "deformacji". Nie da się napisać algorytmu odwracającego wszelkie deformacje spowodowane skanem ze starego papirusu.

Myślę, że statystyka to nie wszystko w przypadku tego niewiadomego słowa. Zapewne porównują to z wynikami różnych OCRów oraz próbują dopasować to odgadnięte słowo w jakiś sposób do skanu (np jeśli niewiadomym słowem było "mebel", a najczęściej padała odpowiedź "krzesło" to raczej tego nie zaakceptują, nawet automatycznie).

Szanse na to, że jakiś już upubliczniony łamacz złamie twoją kapcię jest mała, jeżeli twoja kapcia jest w pewien sposób oryginalna. Z drugiej strony spamerzy raczej się nie kwapią, aby swoje łamacze za darmo rozdawać. Najwygodniejszym rozwiązaniem będzie pewnie jak wdrożysz tą własną kapcię i będziesz zmieniać za każdym atakiem spamu (a tych powinno być proporcjonalnie do popularności twojego projektu).


"Programs must be written for people to read, and only incidentally for machines to execute." - Abelson & Sussman, SICP, preface to the first edition
"Ci, co najbardziej pragną planować życie społeczne, gdyby im na to pozwolić, staliby się w najwyższym stopniu niebezpieczni i nietolerancyjni wobec planów życiowych innych ludzi. Często, tchnącego dobrocią i oddanego jakiejś sprawie idealistę, dzieli od fanatyka tylko mały krok."
Demokracja jest fajna, dopóki wygrywa twoja ulubiona partia.
A to czasem nie jest tak, że recaptcha powstała dla słów, z którymi OCRy nie dają sobie rady? - somekind 2011-08-18 17:21
Nie dały sobie rady czyli zwróciły różne wyniki. Tak czy siak jeśli OCR zwróci np "lxsezlo" dla słowa "krzesło" to i tak można to jakoś wykorzystać. Np ta pierwsza fraza nijak nie jest podobna do "slkfjslgh". - Wibowit 2011-08-18 18:32

Pozostało 580 znaków

Odpowiedz
Liczba odpowiedzi na stronę

1 użytkowników online, w tym zalogowanych: 0, gości: 1, botów: 0