Witam, mam następujący problem:
Próbowałem napisać program (python), który wyciągałby kod HTML strony w internecie. Zrobiłem to przy pomocy requests.get("url")
.
Niestety strona, którą próbuję w ten sposób załadować ma nietypową strukturę. Mianowicie między znacznikami <body>
znajduję się JavaScript, który o ile się nie mylę wczytuje całą stronę.
Wygląda to tak:
<body>
<div id="fb-root"></div>
<script>
(function(d, s, id) {
var js, fjs = d.getElementsByTagName(s)[0];
if (d.getElementById(id)) return;
js = d.createElement(s); js.id = id;
js.src = "//connect.facebook.net/pl_PL/sdk.js#version=v2.7&xfbml=1&apId=66326061";
fjs.parentNode.insertBefore(js, fjs);
}(document, 'script', 'facebook-jssdk'));
</script>
<div id="frontend-root"></div>
</body>
Rzeczywisty kod, który odpowiada za wyświetlanie strony mogę zobaczyć dopiero po jej załadowaniu i zbadaniu przy pomocy "Inspektora" kodu wbudowanego w przeglądarkę. Python oczwiście widzi tylko tę wersję ze skryptem.
Czy jest możliwość na pobranie kodu strony, w formie w jakiej wygląda po załadowaniu?