R - jak ogarnąć pętlę i przekazanie zmiennej

0

Chcę ściągnąć dane ze strony IMDB.
Link wyglada tak:
https://www.imdb.com/search/title/?title_type=feature&release_date=,2018-12-31&count=250&start=1
count - ile filmów pojawi się na stronie (wartości to 50, 100, 250)
start - od którego numeru ma się wyświetlić

Czyli podstawowy link podany wyżej wyświetla listę od 1. do 250.

Jak napisać pętlę, która będzie aktualizowała wartość start o 250 (251, 501, 751, itd)

Napisałem coś takiego:

#instalacja i ladowanie rverst
install.packages("rvest")
install.packages("RSelenium")
library(rvest)
library(RSelenium)

#otwarcie przegladarki (w moim przypadku Firefox)
rD <- rsDriver(browser=c("firefox"))
remDr <- rD[["client"]]

counter=250
for (j in 1){
  j<-j+counter
  #otworzenie strony w przegladarce
  newURL<-"https://www.imdb.com/search/title/?title_type=feature&release_date=,2018-12-31&count=250&start="
  startNumberURL<-paste0(newURL,j)
  
remDr$navigate(startNumberURL)

#odczytanie kodu strony
strona_int<-read_html(startNumberURL)

#odczytanie sekcji z rankingiem
rank_data<-html_nodes(strona_int,'.text-primary')
#konwersja rankingu na text
rank_data<-html_text(rank_data)
#konwersja na numeric
rank_data<-as.numeric(rank_data)
}

#zamkniecie przegladarki
remDr$close()
#zatrzymanie serwera
rD[["server"]]$stop()

Nie mam pojęcia jak to napisać. Będę bardzo wdzięczny za pomoc.

0

Nie pamiętam dokładnie R, ale chyba było seq(from = 1, to = n, by = 250)

0

Dzięki.
Zrobiłem coś takiego:


ile<-seq(from=1,to=501, by=250)
for (j in ile){
  #otworzenie strony w przegladarce
  newURL<-"https://www.imdb.com/search/title/?title_type=feature&release_date=,2018-12-31&count=250&start="
  startNumberURL<-paste0(newURL,j)

#utworzenie ramki
filmy_df_temp<-data.frame(Rank=rank_data)
filmy_df<-rbind(filmy_df_temp)
}

Wygląda na to, że działa.
Tylko docelowa ramka zawiera dane od 501 do 750. Tak jakby nie robiło dorzucenia do ramki.

1 użytkowników online, w tym zalogowanych: 0, gości: 1