regular expression (python)

0

Chce stworzyc takie re, ktore pasowalo by do tekstu wtedy, kiedy wystepuja w nim znaki inne niz litery, cyrfy, /, .

wyszlo mi cos takiego - re.compile('(^[a-zA-Z0-9][\:\./])*')

ale oczywiscie nie dziala ^^ (tzn, podaje znaki ktore moge wystepowac, czyli [a-zA-Z0-9] lub [\: \. /], poprzedzajac to znakiem odwrotnosci i zaznaczajac ze moze wystapic dowolna ilosc razy).

Konkretnie chodzi o to, aby znalezc stringi ktore sa adresami www, a ktore nimi nie sa.

Najlepiej aby mialo to forme "http" lub "https" + "://" + "tutaj dowolnie moga wystepowac literki, kropki, slashe przechylone w prawo " + "." + "2 lub 3 literki"
gdyby ktos potrafil ^^
jesli nie, to prostsza wersja - czyli (odwrotnosc)"literki, cyferki, blackslashe w prawo, kropki wystepujace dowolnie" (ta, ktora podalem wyzej.

0

a nie przez przypadek:

[^a-zA-Z0-9\\:\\./]*

Bo ten zapis oznacza dowolną ilość razy znak początku wyrażenia, a potem znak a-Z0-9 następnie znak :./

0

inny problem - chce usunac wszystkie znaki, ktore znajduja sie po samotnym backslashu (lacznie z backslashem)

czyli np z "http://4programmers.net/Forum/posting.php?mode=reply&t=139062"

po obrobce zostanie

"http://4programmers.net/Forum"

1 użytkowników online, w tym zalogowanych: 0, gości: 1