Na takiej etykiecie może być dużo teksu, poza tym, że odczytasz z niej tekst to i tak nie będziesz pewny, którego użyć.
Możesz też zrobić hashmapę z kluczowymi nazwami, które determinują czym jest dany przedmiot i sprawdzić wyrazy z OCRa, czy występują w bazie jak tak to będziesz wiedział, który jest kluczowy wyraz, znaczący.
Inna heurystyka to mógłbyś wybrać tekst z największą czcionką.
Ewentualnie żeby sieć neuronowa zadecydowała czy dany wyraz jest wyrazem produktu czy może czymś innym i wtedy byś wiedział, które wyrazy z danego obrazka są kluczowe.
Ja jako człowiek jakbym spojrzał na tą etykietę to też bym nie wiedział jak podpisać plik, czy chcesz jaki to produkt mleko, mięso, czy może jaka to firma od mleka, łaciate, łowickie czy jakie tam są te mleka.
A program musi być dość precyzyjnie określony co do tego co ma zrobić i jak wygląda to na podstawie czego ma decydować o tym.