Automaty rozwiązujące CAPTCHA

0

Aloha

Znacie jakieś programy do rozwiązywania CAPTCHA? Najsłyniejszy to PWNtcha, ale od 7 lat nie rozwijany.

Potrzebuję przeanalizować moje łobrazki pod kątem wytrzymałości na obecne systemy rozpoznawania tekstu nastawione na łamanie captchy aby zarazem nie były nieczytelne dla ludzi. PWNtcha użyłem, nie złamał ani jednego, ale to dość stare narzędzie i dumam, czy są nowsze. Pogrzebałem nieco na sieci i znalazłem opis dwóch, ale autor udostępnił tylko wyniki - bez kodu ani programu (z wiadomych powodów).

1

JDownloader chyba miał swego czasu wtyczki do łamania kapci, ale teraz wszyscy przerzucili się na reCaptcha, której nie opłaca się łamać (przynajmniej w przypadku JDownloadera). Jeżeli ktoś ma problemy z tekstową reCaptchą (ja zwykle nie mam) to można sobie odpalić dźwiękową kapcię, jest bardzo prosta.

Poza tym jest jeszcze inna sprawa: twoja kapcia może wydawać się silna, bo aktualnie np żaden program jej nie łamie. Ale nie łamie tylko dlatego, że nikomu nie chciało się jej łamać. Jeżeli dana kapcia jest popularna to ktoś tam może w końcu dostać motywacji, aby próbować ją łamać.

0

Dzięki za wpis.
Rzeczywiście, zapomniałem o jDownloader. Ma on 75 (86 w trunku) różnych algorytmów pisanych pod dane strony. Właśnie lecę w pętli i testuję każdy z algorytmów na naszych obrazkach. Zapewne wynik marny (bo algorytmy specyficzne a nie ogólne) ale przynajmniej sprawdzę kolejny dostępny program.

Co do drugiego punktu to oczywiście masz rację, ale to inna sprawa.

Co do reCaptcha, to niestety nie jest tak różowo. Co jakiś czas dostaje się znaki spoza alfabetu łacińskiego. Sam dostałem deltę z matematycznego wzoru. Znajomy dostał jakiś chiński znak. Poza tym, tylko jeden wyraz jest tam sprawdzany, drugi to "fałszywka", zeskanowana i oni sami nie znają odpowiedzi.

0

Jak dostaniesz deltę czy chiński znak to masz dwie opcje:

  • użyć dźwiękowej kapci,
  • przeładować kapcię odpowiednim przyciskiem,

reCaptcha jest bardzo dobra z tego względu, że posiada nieskończoną ilość różnych "deformacji". Nie da się napisać algorytmu odwracającego wszelkie deformacje spowodowane skanem ze starego papirusu.

Myślę, że statystyka to nie wszystko w przypadku tego niewiadomego słowa. Zapewne porównują to z wynikami różnych OCRów oraz próbują dopasować to odgadnięte słowo w jakiś sposób do skanu (np jeśli niewiadomym słowem było "mebel", a najczęściej padała odpowiedź "krzesło" to raczej tego nie zaakceptują, nawet automatycznie).

Szanse na to, że jakiś już upubliczniony łamacz złamie twoją kapcię jest mała, jeżeli twoja kapcia jest w pewien sposób oryginalna. Z drugiej strony spamerzy raczej się nie kwapią, aby swoje łamacze za darmo rozdawać. Najwygodniejszym rozwiązaniem będzie pewnie jak wdrożysz tą własną kapcię i będziesz zmieniać za każdym atakiem spamu (a tych powinno być proporcjonalnie do popularności twojego projektu).

1 użytkowników online, w tym zalogowanych: 0, gości: 1