Cześć!
Mam mały problem i nie wiem, jak sobie z nim poradzić. Mam kilkaset linii kodu w XML z różnymi znacznikami, a chciałbym wyciągnąć tylko tekst, który znajduje się między znacznikami <base> </base>. Poniżej jest kod. Będę wdzięczny za pomoc.
?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE chunkList SYSTEM "ccl.dtd">
<chunkList>
<chunk id="ch1" type="p">
<sentence id="s1">
<tok>
<orth>Woda</orth>
<lex disamb="1"><base>woda</base><ctag>subst:sg:nom:f</ctag></lex>
</tok>
<tok>
<orth>jest</orth>
<lex disamb="1"><base>być</base><ctag>fin:sg:ter:imperf</ctag></lex>
</tok>
<tok>
<orth>jedną</orth>
<lex disamb="1"><base>jeden</base><ctag>adj:sg:acc:f:pos</ctag></lex>
</tok>
<tok>
<orth>z</orth>
<lex disamb="1"><base>z</base><ctag>prep:gen:nwok</ctag></lex>
</tok>
<tok>
<orth>najpospolitszych</orth>
<lex disamb="1"><base>pospolity</base><ctag>adj:pl:gen:m1:sup</ctag></lex>
</tok>
<tok>
<orth>substancji</orth>
<lex disamb="1"><base>substancja</base><ctag>subst:sg:gen:f</ctag></lex>
</tok>
<tok>
<orth>we</orth>
<lex disamb="1"><base>w</base><ctag>prep:acc:wok</ctag></lex>
</tok>