Wyrażenie regularne - nie mam pomysłu

0

Cześć.
Pisze w C# i .NET.
Oto tekst, z którego chcę wyskrobać tytuł, kategorię, która się zmienia oraz wyraz po kategorii (w tym przypadku "jakis_tekst-345345"):

<quote>

Próbowałem już:

MatchCollection matchCol = Regex.Matches(tekst, "^<a href=\"http://strona.com/([a-z]*)/(.*)\" title=\"(.*)\" rel$");

No, nie działa...

Proszę o pomoc. Dzięki za wszelką pomoc.

0

Hmm kiedyś się tak bawiłem, to spisywałem dokument do tablicy, po czym obcinałem nieco string'a

Może są jakieś gotowe funkcje pod HTML'a

0

Zamiast stosować wyrażenia regularne użyj parsera pod html[0]. Odwołujesz się pod href atrybut i ucinasz kawałek stringa od linku stosując funkcje rodzaju last_index_of i substring.

[0] - http://stackoverflow.com/ques[...]e-best-way-to-parse-html-in-c

By the way - Jeśli tworzony program jest czymś w rodzaju lekkiego bota to na twoim miejscu rozważyłbym możliwość użycia języków skryptowych. Mniej sił w to wkładasz i do tego czerpiesz więcej radości z osiąganych rezultatów. Mówię tu szczególnie o przypadku przetwarzania tekstów.

0

Użyłem leniwą wersję kwantyfikatora, nieco poprawiłem wyrażenie i działa :). Bez leniwca nie działa.

1 użytkowników online, w tym zalogowanych: 0, gości: 1, botów: 0