Jaki algorytm uczenia maszynowego wybrać w celu jaknajlepszego stabilizowania wahadła na jeżdżacym wózku?

Chodzi o inverted pendulum problem. Coś takiego:

Nie jest to gif z mojego programu.

Do stabilizacji wahadła używam jak na razie algorytmu LQR, natomiast chciałbym wspomóc stabilizację predykcjami z sieci neuronowej (lub innego algorytmu).
Jakie mam dane?

wejście - przyłożona siła "F" do wózka
wyjście - prędkość kątowa wahadła, kąt, prędkość wózka, położenie wózka

Posiadam już dane z symulacji. Czyli uruchamiam kod dla odpowiedniego kąta wejściowego i program stara się go ustabilizować. Czyli mam zestaw danych z przyłożoną siłą i rezultatem dla kazdego kroku czasowego.

No i mój pomysł jest taki, aby np sieć neuronowa nauczyła się w taki sposób dobierać siłę, aby wahadło było stabilizowane jak najszybciej. Tylko pytanie najpierw jaki model tu stworzyć? Jaki algorytm najlepiej dobrać? Niektórzy wykorzystywali w podobnych problemach uczenie ze wzmacnianiem i sieci głębokie, ale ma być to prosty projekt na studia, więc nie wiem czy to nie przesada i nie da się tego czymś prostym zrobić. Jakieś pomysły co by tu można użyć? Z góry dzięki za pomoc

A dobrać regulator PID próbowałeś? Zamiast tego algorytmu LQR?

Niektórzy wykorzystywali w podobnych problemach uczenie ze wzmacnianiem i sieci głębokie, ale ma być to prosty projekt na studia

Robiłem coś takiego na studiach m.in. uczeniem ze wzmocnieniem i nie ma w tym nic specjalnie trudnego.

edit: ja juz tego nie mam nigdzie, ale mój kompan ze studiów jeszcze ma na githubie którąś wersje: https://github.com/pawel-k/pendulum (ale to ma 10 lat, nie wiem czy uda ci się odpalić :P)

Zastanów się najpierw jaki problem chcesz rozwiązać. Jak rozumiem to mając przyłożoną siłę do wózka chcesz dobrać tak parametry tego wózka, żeby wahadło było stabilne, tak? Czyli ten wózek ma jakiś dodatkowy silniczek, żeby kontrować siłę przyłożoną do wózka? Bo jeżeli nie to przykładając siłę do wózka to wahadło w pewnym momencie opadnie.

Czy może chcesz tylko i wyłącznie obliczyć jakieś parametry wahadła w czasie? Bo jeżeli tak to żadne uczenie maszynowe do tego nie jest Ci potrzebne.

Liczba odpowiedzi na stronę

Jaki algorytm uczenia maszynowego wybrać w celu jaknajlepszego stabilizowania wahadła na jeżdżacym wózku?

1 użytkowników online, w tym zalogowanych: 0, gości: 1

Praca dla programistów

Forum dyskusyjne

Sprawy administracyjne

O nas

Skontaktuj się z nami