Poczytaj sobie o OCR - a konkretnie pierwsza faza algorytmu - czyli wyszukiwanie orientacji tekstu na podstawie histogramów poziomych, a potem wyróżnianie wyrazów na podstawie histogramu pionowego z linii tekstu.
Patrząc na charakterystykę fotki jaką podałeś, możesz spróbować zrobić to tak. Liczysz "histogramy" dla każdej lini pionowej i poziomej obrazka. (zliczaj tylko białe piksele, jak to nie jest b&w tylko wiecej poziomu - dorób jakąs funkcje progową). tam gdzie supki są wysokie i w pionie i poziomie tam masz duże obszary białego. - żeby wyeliminować inne duże połacie - możesz sprytniej zrzucać do B&W - napisz sobie taką funkcję progową, która zamienia na czarny każdy kolor, z wyjątkiem koloru ( i jego otoczenia *) jakim są pisane litery i cyfry na ty autobusie.
-
- trzeba sie pobawić jak dużo można dać tolerancji, żeby nie wprowadzić zbyt dużych płatów "bieli" tam gdzie to jest nieporządane.
Jak już będziesz miał, to algorytmem grzebieniowym z OCR'a możesz sobie wyprostować obrazek (jesli bedą takie dwulinijkowe teksty to sie powinno udac). I na tym zapuścić już sieć neuronową, np. Hopfielda, nauczoną tych 19 numerków.