Witam,
załóżmy, że mam htmla w takiej postaci:
<html>
<head>
.
.
.
</head>
<body>
<div>Treść 1</div>
<div>Treść 2
<p>Treść 3</p>
<a href="#">Link 1</a>
</div>
<span>Testowy span</span>
</body>
</html>
Chciałbym, DomDocumentem albo jakoś inaczej sparsować ten kkod html aby:
- uzyskać czysty tekst body
- bez linków
Przykładowo dla zastosowanego przykładu skrypt zwracałby:
Treść 1
Treść 2
Treśc 3
Testowy span
czyli link z anchorem poleciał natomiast pozostały plaintext został. Nie wiem do końca jak parsować każdy jeden z elementów dokumentu.
Dzięki