Chodzi o inverted pendulum problem. Coś takiego:
Nie jest to gif z mojego programu.
Do stabilizacji wahadła używam jak na razie algorytmu LQR, natomiast chciałbym wspomóc stabilizację predykcjami z sieci neuronowej (lub innego algorytmu).
Jakie mam dane?
wejście - przyłożona siła "F" do wózka
wyjście - prędkość kątowa wahadła, kąt, prędkość wózka, położenie wózka
Posiadam już dane z symulacji. Czyli uruchamiam kod dla odpowiedniego kąta wejściowego i program stara się go ustabilizować. Czyli mam zestaw danych z przyłożoną siłą i rezultatem dla kazdego kroku czasowego.
No i mój pomysł jest taki, aby np sieć neuronowa nauczyła się w taki sposób dobierać siłę, aby wahadło było stabilizowane jak najszybciej. Tylko pytanie najpierw jaki model tu stworzyć? Jaki algorytm najlepiej dobrać? Niektórzy wykorzystywali w podobnych problemach uczenie ze wzmacnianiem i sieci głębokie, ale ma być to prosty projekt na studia, więc nie wiem czy to nie przesada i nie da się tego czymś prostym zrobić. Jakieś pomysły co by tu można użyć? Z góry dzięki za pomoc