Korygowanie wykresu

Odpowiedz Nowy wątek
2018-10-28 16:21
0

Witam. Mam tu kod programu, który wyświetla mi wykres (x - data, y - cena). W załączniku jest zdjęcie tego, co otrzymuje (oraz dane na wszelki wypadek).

Czy ktoś wie, jak można go pokorygować, by tej części, którą oznaczyłam czarnym prostokątem na zdjęciu, pozbyć się, tzn. zrobić wykres bardziej estetycznym w tej części? Z góry dziękuję! :)

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.patches as mpatches
import matplotlib.dates as dates

def pc_Ind(file, N):
    data_pd = pd.read_csv(file, parse_dates=[['Date','Time']])
    format = '%m/%d/%Y %H:%M'
    data_pd = data_pd.set_index(data_pd['Date_Time'])
    data_pd['Date_Time'] = pd.to_datetime(data_pd['Date_Time'], format=format)
    data_pd = data_pd.set_index(data_pd['Date_Time'])
    data_pd = data_pd.drop(columns='Date_Time')
    ub = np.zeros(data_pd.shape[0])
    lb = np.zeros(data_pd.shape[0])
    for i in range(N - 1, data_pd.shape[0]):
        ub[i] = np.max(data_pd['Close'][i-N+1:i+1])
        lb[i] = np.min(data_pd['Close'][i-N+1:i+1])
    fig = plt.figure(figsize=(10, 5))
    fig.add_axes()
    ax = fig.add_subplot(111)
    ax.xaxis.grid(True, which='minor')
    appl = mpatches.Patch(color='blue', label='Apple data')
    upb = mpatches.Patch(color='yellow', label='PC indicator (upper)')
    lwb = mpatches.Patch(color='red', label='PC indicator (lower)')
    plt.legend(handles=[appl, upb, lwb])
    plt.plot(data_pd.index, data_pd['Close'],'b')
    plt.plot(data_pd.index, ub + 5, 'y') 
    plt.plot(data_pd.index, lb - 5, 'r')
    plt.plot(data_pd.index, np.zeros(data_pd.shape[0]),'g')
    ax.set(title='Apple', ylabel='Close price', xlabel='Datetime')
    date_formatter = dates.DateFormatter('%m/%d/%Y')
    ax.xaxis.set_major_formatter(date_formatter)
    ax.xaxis.set_major_locator(dates.DayLocator(interval=40))
    plt.setp(ax.xaxis.get_majorticklabels(), rotation=90, fontsize=7)
    fig.autofmt_xdate()
    ax.autoscale_view()
    plt.grid()
    plt.show()
    return data_pd

pc_Ind('appl.csv', 14)

#Upper Band = Highest price in the last n periods
#Lower Band = Lowest price in the last n periods
edytowany 2x, ostatnio: Beata Griškevič, 2018-10-28 16:23

Pozostało 580 znaków

2018-10-28 20:07
1
    ub = np.empty(data_pd.shape[0])
    lb = np.empty(data_pd.shape[0])
    for i in range(N - 1, data_pd.shape[0]):
        ub[i] = np.max(data_pd['Close'][i-N+1:i+1])
        lb[i] = np.min(data_pd['Close'][i-N+1:i+1])

Dla danych z zakresu i = 0...N-2 nie wstawiasz nic więc masz tam zera którymi zainicjalizowałaś ndarray'sy ;)

Wystarczy zainicjalizować ndarray wartościami np.nan które na wykresie zostaną pominięte:

    ub = np.full(data_pd.shape[0], np.nan)
    lb = np.full(data_pd.shape[0], np.nan)
    for i in range(N - 1, data_pd.shape[0]):
        ub[i] = np.max(data_pd['Close'][i-N+1:i+1])
        lb[i] = np.min(data_pd['Close'][i-N+1:i+1])

Efekt:

screenshot-20181028200632.png


Prosząc o pomoc w wiadomości prywatnej odbierasz sobie szansę na otrzymanie pomocy od kogoś bardziej kompetentnego :)

Pozostało 580 znaków

2018-10-30 19:19
0

Jak można pokazać ten sam wykres, ale od roku 2018?

Zrób prosty debug, jakiego typu jest zmienna która posiada u ciebie datę. Jeśli to na przykład obiekt datetime, wystarczy usunąć je z rozpatrywanego zbioru który przekazujesz do wykresu wraz z powiązanymi rozwiązaniami, prostym if'em lub czymś tego rodzaju :) - Guaz 2018-10-30 19:27
Żadnych ifów, po to jest indeksowanie, loc/iloc i cała reszta :) - superdurszlak 2018-10-30 19:56
@superdurszlak Oczywiście, indeksowanie od elementu (bądź jak kto woli pracowanie na fragmentach) to najlepsza metoda pod względem optymalizacji kodu przy dużych zbiorach. Nie wiem jak to się odbywa w loc/iloc, ale podejrzewam że siedzi tam binary search lub podobny algorytm który też jest dobrym pomysłem, a na pewno lepszym od if'a. To taka najprostsza linia oporu, chociaż może faktycznie powinienem pisać też o bardziej zaawansowanych możliwościach dla ambitnych :). - Guaz 2018-10-30 20:06
Ale to jest prostsze od ifozo-pętlozy ;) - superdurszlak 2018-10-30 20:25
Wszystko jest proste, czasem tylko pracochłonne ^^. Pod warunkiem że to umiesz :D. Na szczęście koła na nowo nie trzeba wynajdywać, bo są gotowe elementy :). - Guaz 2018-10-30 20:40

Pozostało 580 znaków

2018-10-30 19:51
Beata Griškevič napisał(a):

Jak można pokazać ten sam wykres, ale od roku 2018?

Nie pamiętam dokładnie jak to wyglądało składniowo, ale możesz użyć czegoś w tym rodzaju na samym początku aby odfiltrować tylko te rekordy które mają wartość 'date' po zadanej dacie

df = df[df['date'] > jakas_data]

Ew. analogiczna operacja z wykorzystaniem pd.DataFrame.loc


Prosząc o pomoc w wiadomości prywatnej odbierasz sobie szansę na otrzymanie pomocy od kogoś bardziej kompetentnego :)
edytowany 1x, ostatnio: superdurszlak, 2018-10-30 19:54

Pozostało 580 znaków

Odpowiedz
Liczba odpowiedzi na stronę

1 użytkowników online, w tym zalogowanych: 0, gości: 1, botów: 0