Mam pewien łańcuch zaczynający sie znakiem < i kończący się znakiem > (wewnątrz brak innych znaków < i >).
Chodzi o to aby sprawdzić czy owy łańcuch jest poprawnym otwierającym tagiem XML (z pewnymi dodatkowymi założeniami uwidocznionymi we wzorcu), a jeśli tak, to odczytać jego nazwę i atrybuty. O ile sprawdzić przypasowanie do wzorca jest łatwo, to nie wiem jak wyciągnąć żądane informacje.
Mój wzorzec:
< \w+ (\s+ \w+ \s*=\s* (('[']</span>') | ("[^"]</span>")))* \s* >$
kolorami oznaczyłem nazwę tagu, nazwę atrybutu, wartość atrybutu.