O co chodzi z wagami liczb w losowaniu liczb?

from sklearn.datasets import make_classification
from sklearn.datasets import fetch_openml

# Prosty zbiór danych dostarczający losowe dane obiektów dwóch klas,
# Aby przerobić na obiekty 3 klas, należy dodać kolejny element listy
# weights, odpowiednio dopasować wagi, tak aby suma wynosiła 1.

"""
    Przykład tworzenia prostego zbioru danych
"""
def load_simple_classifier_dataset(weights=[0.5, 0.5]):
    """
        Metoda generująca prosty zbiór danych

        Argumenty:
            weights - lista z udziałami obiektów każdej klasy w próbce,
                      ich suma musi wynosić 1

        Zwraca:
            X - dane wejściowe dla modelu
            y - true labels dla tych danych wejściowych
    """

    X, y = make_classification(
        n_samples=1000,
        n_classes=len(weights),
        n_informative=len(weights),
        weights=weights,
        flip_y=0,
        random_state=1
    )

    return X, y

O co chodzi z tą wagą w funkcji ? weights=[0.5, 0.5] , oraz o co chodzi z tymi zmiennymi poniżej (do czego służy każda z tych zmiennych) ?

n_classes=len(weights),
n_informative=len(weights),
weights=weights,
n_samples=1000,
flip_y=0,
random_state=1

Sekunda szukania w google:
https://scikit-learn.org/stable/modules/generated/sklearn.datasets.make_classification.html

Widziałem tą stronę ,ale na niej jest to tak napisane że ja nic z tego nie rozumiem.

Np. n_informative = leń(weight) - czyli (0,5 , 0,5)

Tu definicja z tej strony:

Liczba funkcji informacyjnych. Każda klasa składa się z wielu klastrów gaussowskich, z których każdy znajduje się wokół wierzchołków hipersześcianu w podprzestrzeni wymiaru n_informative. Dla każdego klastra cechy informacyjne są rysowane niezależnie od N(0, 1), a następnie losowo łączone liniowo w każdym skupieniu w celu dodania kowariancji. Klastry są następnie umieszczane na wierzchołkach hipersześcianu.

Jak w funkcji to 0,5 zmienię np na 100 to jaka będzie różnica?

Albo n_classes = len(weight) = (0,5 ,0,5)

Liczba klas (lub etykiet) problemu klasyfikacji.

A to też nie wiem o co chodzi?

https://pl.wikipedia.org/wiki/Klasyfikacja_statystyczna
Razem ze wszystkimi odnośnikami (zagłębienie 2 strony)

Liczba odpowiedzi na stronę

O co chodzi z wagami liczb w losowaniu liczb?

1 użytkowników online, w tym zalogowanych: 0, gości: 1

Praca dla programistów

Forum dyskusyjne

Sprawy administracyjne

O nas

Skontaktuj się z nami