Poszukiwany algorytm do analizy danych testowych

0

Cześć

Poszukuję algorytmu, który byłby w stanie na podstawie danych z bazy danych np. dowolnych ciągów znaków, dobierać sobie te wartości, które będą najbardziej odpowiednie w danej chwili.

W bazie mam na przykład kolumnę TestPatterns i chciałbym z tej kolumny wylosować (dopasować) kilka wartości najbardziej odpowiednich.

Albo algorytmy selekcji ogólnie mówiąc.

Myślałem o SVM (Support Vector Machine) ale może są jeszcze jakiś inne, które można zaimplementować w C#?

Z góry dzięki za pomoc.

0

Według mnie nie zdefiniowałeś problemu, więc jak można szukać jego rozwiązania?
Używasz dwóch pojęć "dopasować wartości" (do czego i w jaki sposób) i "najbardziej odpowiednie w danej chwili" (co to znaczy "odpowiednie" i co to znaczy "w danej chwili") ?

0

Mam na myśli algorytm, który zdecyduje, które wartości zostaną wybrane z zestawu danych np. jeśli moja metoda API przyjmuje numeryczny parametr typu int taki jak np index to chciałbym, żeby wybrał mi tylko numeryczne wartości a nie tekstowe.

0

Masz na myśli silniki typu Text Search, np przeszukujące bazy dokumentowe?

0

Nie, przeszukującą tabelę w mojej bazie danych.

0
Odyn napisał(a):

Nie, przeszukującą tabelę w mojej bazie danych.

http://www.sqlpedia.pl/kurs-sql/

0

Wiem, że to można zrobić za pomocą SQL ale chciałbym zaimplementować sobie algorytm, który sam będzie mi o tym decydował.

Klasyfikował dane, które będą najbardziej odpowiednie do przeprowadzenia testu,

Mówiąc więcej:

Mam na przykład metodę API do której odnoszę się poprzez URL www.mojeapi/api/products/id

Następnie odpytuje to API za pomocą danych z bazy danych SQL w której znajdują się poszczególne wartości ID (typu int, numeryczne)

Jednakże znajdują się tam równiez dane tekstowe, ze znakami spejalnymi itd.

Chciałbym aby ten algorytm potrawił wybrać sobie np tylko dane numeryczne. Oprócz tego fajnie jakby potrafił wybrać tylko te ID, które np istnieją.

Wiem, że to brzmi dziwnie i może nie do końca jest to dla Was jasne. Ale będę wdzięczny za pomoc :)

0

@Odyn w skrócie: nie da się. Nawet jakbyś pokazał te dane człowiekowi to nie będzie wiedział jak je chcesz dopasować, wg jakich kryteriów itd. A komputery są jeszcze mniej "domyślne" od ludzi.

1

Dilbert

0

No ale moge założyć na przykład, że jeżeli dana metoda API przyjmuje tylko wartości numeryczne to wybierze tylko te wartości z bazy danych, które są numeeryczne i całkowite? :)

0

mozesz, ale to masz jeden przypadek. A co jezeli dodam tam liczby z przecinkami? to jak ma sie zachowac? a co jezeli liczby beda zapisane w innym jezyku? a co jezeli to bedzie data?

0

@Odyn: a co jeśli te liczby akurat będą parzyste? To ma wybrać tylko parzyste? A jeśli są podzielne przez 69? Rozumiesz chyba że jest nieskończenie wiele parametrów wg których można dokonać takiej selekcji? W jaki sposób program ma się "domyślić" o jaki ci chodzi?

W bazie mamy liczby: 4, 5, 6, 7, 8, 9, 10, 11

Podaje jako query liczby: 3, 5

Co powinno być wynikiem?
Nieparzyste 5, 7, 9, 11
Pierwsze 5, 7, 11
Pomiędzy zadanymi 4
Podzielne przez 3 lub 5 6, 5, 9, 10

Każda z tych opcji jest równie "poprawna".

0

Postaram się to jakoś uwzględnić, ale szukam algorytmu, który mi w tym pomoże :)

0
Odyn napisał(a):

Postaram się to jakoś uwzględnić, ale szukam algorytmu, który mi w tym pomoże :)

Hmm, nadal nie rozumiesz, że problem jest źle zdefiniowany? Prosty przykład: "Szukam algorytmu, który na podstawie daty da mi najlepiej dopasowane liczby", kontekstem problemu jest losowanie dużego lotka w sobotę, 14.04, pożądane liczby - 6 pasujących do tych wylosowanych ;-)

0

@Odyn ale pomoże w czym? Zrozum że "najlepiej pasujące" jest pojęciem zbyt rozmytym nawet dla człowieka, a co dopiero dla komputera. Krótkie wyjaśnienie co się DA zrobić za pomocą komputera:

Możesz podać twój "wzorzec" a następnie powiedzieć programowi które rekordy chciałeś dostać jako odpowiedź i na tej podstawie komputer może wygenerować tzw reguły asocjacyjne albo stworzyć drzewo decyzyjne, które dałoby taką właśnie odpowiedź. To jest jedna z technik uczenia maszynowego. Tak nauczony "model" możesz potem wykorzystać do klasyfikowania nowych zestawów danych, wg tych samych kryteriów.

0

Możnaby pomysleć że OP pracuje w amerykańskim urzędzie patentowym...

1 użytkowników online, w tym zalogowanych: 0, gości: 1