Witam!
Muszę napisać program, który będzie odczytywał dane z pliku worda wraz z formatowaniem. Udało mi się zrobić rozpoznawanie czcionki (kolor, nazwa, wielkość). Mam jednak wielki problem z listami numerowanymi i nienumerowanymi. Nie wiem jak je odróżnić od zwykłego tekstu. Jest to bardzo pilne proszę o pomoc.

Jak do tej pory sprawdzam tekst po jednej literce (każda literka ma sprawdzane formatowanie), a to bardzo długo trwa, czy wie ktoś w jaki sposób można od razu pobrać fragment tekstu o wspólnym formatowaniu.
Słyszałem coś o Text Object Model ale nie wiele na ten temat znalazłem i nie za bardzo wiem jak to ugryźć.

Z góry dziękuję za pomoc