Jezeli ktos chcialby wspomoc rozwoj 4programmers.net to mam male zadanko :) Chodzi o wyciagniecie z tekstu adresow WWW z przedrostkiem "www" (bez http).
Mamy takie o to wyrazenie:
preg_match_all('~(?<![\p{L}\p{N}_])(?<!://|">)www(?:\.\S+)+\.[a-z]{2,6}(?:\S+)?(?:/|(?![\p{L}\p{N}_]))~iue', $x, $m);
var_dump($m);
Dziala prawidlowo, lecz wyjatkiem jest taki adres http://foo.com?host=www.bar.comost=www.bar.com">http://foo.com?host=www.bar.com</a>`
Regpex takiego adresu nie powinien pobierac.
Efektem jest nieprawidlowe parsowanie adresow URL: http://4programmers.net/Forum/Coyote/Test/174696-parsowanie_urli?p=718460#id718460
Taki regexp jest wykorzystywany tutaj: http://redmine.boduch.net/projects/coyote/repository/entry/trunk/helper/text.helper.php#L384