Mam takie przykładowe dane
A B C D E F
2017-01-13; 58 ; 157; 90; 74.8; 200
2017-01-14 ; 88 ; 340; 83 74.1; 0
2017-01-15; 100 ; 317; 81 ; 75.1; 300
Mam takie przykładowe dane z powiedzmy 50 dni.
Teraz chciałbym przewidzieć jakie dane będą w następnych dniach znając wszystkie dane poza kolumną E.
Jako człowiek wiem, że wpływ na kolumnę E mają dane z wszystkich kolumn z dni poprzednich włącznie z kolumną E. Jednak kolumna E ma mały wpływ na wynik następnych dni w porównaniu do kolumn B C D F.
O ile potrafię nauczyć i sprawdzić dokładność to nie potrafię wpisać sobie do tego algorytmu następnych dni bez uzupełnionej kolumny E i poznać wynik jaki będzie dla tych przyszłych dni. Moje pytanie związku z tym - jak napisać to żebym mógł przewidywać sobie następne dnie na podstawie tego treningu.
O to mój kod (usunąłem niektóre fragmenty ale sam algorytm uczenia działa.):
forecast_out = int(math.ceil(0.01*len(df)))
df['label'] = df[forecast_col].shift(-forecast_out)
x = np.array(df.drop(['label'], 1))
x = preprocessing.scale(x)
y = np.array(df['label'])
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2)
clf = LinearRegression()
clf.fit(x_train, y_train)
accuracy = clf.score(x_test, y_test)
.