Ludzie preferują streszczenie streszczenia, chyba dlatego jest tak popularne mieć nauczyciela, bo ktoś kto ciężką pracą się nauczył lub też od kogoś teraz może w prosty sposób przekazać to czego się nauczył i umie.
Ale najlepsze jest to, że są papiery naukowe, w których badali dane uczące do large language modeli i idzie skrócić i polepszyć wyniki nauki tylko poprzez poprawienie jakości danych uczących.
Dla przykładu dając je wcześniej do chatGPT, żeby ten nam poprawił, opisał lepiej, dane które potem damy do uczenia.
Same scrapowanie danych nie jest najlepsze bo mogą być lekko zanieczyszczone lub niedopowiedzenia, tak można by kazać człowiekowi żeby spróbował poprawić dane uczące poprzez dodanie komentarzy lub poprawienie nazw funkcji, uproszczenie kodu itp. Tak w sumie uczą chatGPT ludzie ręcznie tworzą wysokiej jakości dane uczące, bo śmieciami by tylko popsuli rezultaty modelu.
Ludzie trochę podobnie robią, czasem w tutorialu jest zbyt dużo informacji czasem redundantnych i wolą jak ktoś im jeszcze przetworzy to do jeszcze prostszej formy, takiej co już nawet dziecko zrozumie.
Trochę też potrzeba cierpliwości bo każdy by chciał w 1h się nauczyć, a tu często potrzeba więcej czasu i jakieś funkcje odkrywa się dopiero jak są potrzebne, bo i tak zostaną usunięte z pamięci jeśli nie będą miały praktycznego zastosowania, przez co i tak się zapomni.