Ok, dzięki.
A może będziecie w stanie mi jeszcze pomóc z takim fantem.
Mam tekst:
Tottenham Hotspur
1</td></tr>
15-03-2008</td></tr>
i z tego tekstu chciałbym wyciągnąć:
Tottenham Hotspur
1
15-03-2008
czyli te informacje, które są zawarte między > a tym <
za pomocą regex, stworzyłem taki wzór wyrażenia:
".+>[<.+>]"
i daje on mi taki efekt:
Tottenham Hotspur
<
1<
15-03-2008<
da radę to jakoś udoskonalić, żeby było bez tych znaków > i <, oraz bez znaków białych?
mój kod:
#include <boost/algorithm/string.hpp>
#include <boost/algorithm/string/regex.hpp>
#include <iostream>
#include <boost/foreach.hpp>
#include <fstream>
using namespace std;
using namespace boost;
int main()
{
string kod;
ifstream plik;
plik.open("dane.txt", ios::out);
if(plik.is_open())
{
while(!plik.eof())
{
kod.push_back(plik.get());
}
}
else cout << "dupa\n";
plik.close();
const static regex email_regex(
"[.+>]([^>[:space:]<].*?)[<.+>]"
);
string tab[1000];
int a=0;
const sregex_token_iterator end;
for (sregex_token_iterator i(kod.begin(),
kod.end(), email_regex);
i != end;
++i)
{
std::cout << *i << std::endl;
tab[a]=*i;
a++;
}
system("pause");
}