Wyciąganie kodu z obrazka

0

Witam potrzebuje się dowiedzie czy da się jakoś pobrac obrazek generowany na stronie przez php, z tego obrazka odczytac kod i przypisac go do jakiejs zmiennej w delphi. Obrazek wygląda mniej więcej tak:

user image

jak wydobyc ten ciąg znakow: GJ1BUUD

0

No właśnie po to są takie obrazki, aby było to bardzo trudne do zrobienie przez program lub niemożliwe :D Można to pewnie sieciami neuronowymi

0

Tak na marginesie, to ostatnio slyszalem, ze jakis spamer napisal program odczytujacy cos takiego. Calkiem mozliwe, ze to plotka, ale robi wrazenie.

0

No to wiadomo.. a dlaczego by nie miał robić... wystarczy pogłówkować jak to wykonać.
Np:
ABBYY FineReader 9.0 -> odczytuje tekst z jpg'a, to prawie to samo co z captcha.

0

Raczej nie plotka - już od dłuższego czasu istnieją programy, które potrafią odczytać taki tekst. Oprócz ww. jest jeszcze jakiś(<ort>niepamiętam </ort>nazwy jakby ktoś chciał to moge się dokładniej dowiedzieć), do którego wrzucasz kilka(naście) linków do plików na rapidzie, on odczytuje tekst z takiego obrazka na rapidzie ściąga plik, resetuje połączenie neostrady, odczytuje tekst z następnego obrazka, ściąga itd.

0

trzeba by po kolei piksele analizować. I w zależności no od tła ignorować odpowiednie. Wtedy otrzymamy same litery. Potem analizować każdą po kolei ;D Ale to takie proste tlyko w słowach wygląda.

0

ten programik o ktorym pisał cyriel to USDownloader on potrafi odczytać obrazki z rapidshare ale z tego co mi sie wydaje to on chyba uzywa do tego ABBYY FineReader tylko <ort>niewiem </ort>jak

0

Zastanawia mnie tylko jedno. Skoro obrazki zaczynaja byc coraz bardziej czytelne dla maszyn, niz dla ludzi. To jakie teraz bedzie sie stosowac zabezpieczenia, zeby sprawdzic, czy strone oglada czlowiek?

0

to akurat Można zrobić w paru prostych krokach , bo litery nie zachodzą na siebie i są jednolitą czcionką , ba nawet szum jest jednokolorowy -więc bez ocr'ów

  1. Usuwasz szum (czyli kolor szary zastępujesz białym)
  2. Zamieniasz Na Rysunek Czarno Biały (albo i nie ) w zalezności czy wolisz porównywać czy pixel jest biały czy czarny czy samo " różny od białego"
  3. Tniesz rysunek w Paski (zawierające poszczególne litery )(porównując kolorki) tak aby
    Litera zaczynała się od razu od Lewej Od razu od góry i tak samo kończyła sie ( bez miejsca wolnego)

porównujesz poszczególne litery z ich odpowiednikami (wykonanymi wcześniej)i jeśli sie zgadzają w 90% pixele to jest to ta litera 10 to margines "szumu"

wada musisz wprowadzić cały alfabet wzorców i jeśli wzorce sie zmienią musisz je wykonać
jeśli litery sie nakładają pomysł jest do d.. bo sie ich nie potnie
zaleta w miarę szybko sie to pisze :) trochę gorzej z wyłapaniem całego alfabetu wzorców ....
ale ocr szybko sie tez nie napisze

0
WIktorDelphi napisał(a)

Zastanawia mnie tylko jedno. Skoro obrazki zaczynaja byc coraz bardziej czytelne dla maszyn, niz dla ludzi. To jakie teraz bedzie sie stosowac zabezpieczenia, zeby sprawdzic, czy strone oglada czlowiek?

Nadal istnieją skuteczne captcha czytelne dla ludzi i nieczytelne dla komputerów. Są to przede wszystkim takie gdzie jest losowo wybierane tło i czcionka z dużego słownika, litery są pochylone pod różnymi kątami lub przecinają się z nieregularnymi liniami. Dobre są również takie z efektem tafli wody, pofalowane.

Inną, nowszą metodą jest asirra, gdzie z kliku zdjęć wskazuje się zdjęcia kota lub psa: http://research.microsoft.com/asirra/

1 użytkowników online, w tym zalogowanych: 0, gości: 1