Skrypt do grupowania, usuwania tekstu

0

Witam,
Mam taki zdaje się prosty problem.

Jednak jest to problem.
Potrzebuję zrobić dwie rzeczy:

Wyciąć tekst między:

---------- NAZWA ---------

A znacznikiem końca.
W środku jest dużo śmieci.

<yep> : 1
<uklon> : 1
<img src="images/loading.gif"> : 1
;pop : 1
;pp* : 1

Potrzebuję usunąć każdą linię, która nie jest zatwierdzona w słowniku. Słownik w JSON , w TXT dołączam ja. W dowolnej formie ale najlepiej pojedynczych wierszy:

Słownik:

A
B
B
;AA

I wszystko co nie jest słownikiem jest usuwane.
I druga sprawa:

Trzeba z grupować słowa ze słownika w ich dowolnej wariancji:

W pliku będę miał:

A
a
b
B
;aA
;Aa

On ma mi to z grupować! Niezależnie czy piszę: SloWo, SLOwo. A w słowniku jest slowo
no chyba rozumiecie o co chodzi?

Przez z grupowanie rozumiem, że poda mi wynik w postaci: slowo: 555.
Bo w pliku który wytniecie ZAWSZE po dwukropku jest wartość liczbowa i chcę ich sumy.

No mam nadzieję, że w miarę zrozumiale...
W zasadzie dowolny język choć preferowałbym coś w stylu C++/C#. Może być webowo czy Python.

Wycena, szczegóły to może na priv?

0

To jest do jednokrotnego uruchomienia. — ortoraf 27 minut temu

Doświadczenie z wielokrotnych migracji danych wskazuje, ze nie ma czegoś takiego jak jednokrotne wykonanie.

Co więcej,. nie spodziewam się inaczej, niż WIELOKROTNE iteracje pomiędzy zlecającym/akceptującym dane a wykonawcą. Podniesione do potęgi jesli zamawiajacy używa słow "no rozumiecie"

ortoraf napisał(a):

W zasadzie dowolny język choć preferowałbym coś w stylu C++/C#.

Albowiem ponieważ ?
A co dalej będzie łykać te dane? Może się okazac prościej "tam" wepchnąć to do gardła, i m.,in. uzyskać natychmiastowa walidację.

Mam przeczucie, że to jakiś pokręcony XY problem, grzebanie nie w tych danych i nie w tym miejscu. Konflikt z wykonawcą / opiekunem zastanego oprogramowania, które to wypluwa ?

0

programiści to debile. spierdzielił program bo sie uparł , że zrobi to w scala, zrobił taki syf, że ja to pierwszy raz tydzień ręcznie analizowałem.... aby coś sensownego z tego wyciągnąć, pal licho z resztą bo trzeba byłoby wrócić do wymagań programu i napisać to od podstaw dla całości a nie tylko dla części danych.

1

programiści to debile. spierdzielił program bo sie uparł , że zrobi to w ... — ortoraf 29 minut temu

No to czekamy na równie serdeczną wypowiedź o zlecających.

Moje jakies tam doświadczenie życiowe wskazuje, że najgorsze co może być dla projektu, to gdy inwestor uważa że się zna na danej technologii.
Obojętnie przemysł spożywczy, transport, projekt wizualny strony internetowej, obliczenia ekonomiczne czy oprogramowanie z algorytmami

Jak nie wie nic (prawie nic) ale wie, że nie wie, zwykle jest bdb inwestorem / pionierem projektu, i projekty fajnie wychodzą (może 5-10% drożej niż poniżej)
Jak ma głęboką wiedzę / wieloletnie doświadczenie w dziedzinie, zawinie rękawy i wchodzi merytorycznie w skład zespołu, też zwykle dobrze.

Z tego, co @ortoraf sie składa o twojej historii, wynika że ani merytorycznie nie aktywowałeś sie we właściwy sposób (współudział, odbiór i przekazanie), ani biznesowo (zarządczo)

@ortoraf - Taniej od wynajęcia kogoś do grzebania w tekstowym gównie będzie wynająć kogoś, kto tę Scalę podejmie.

0

Po co tą scalę ruszać.

Scala dał plik: wynik.txt.
Opracujemy część wyniku aby była do zrobienia w 1h a nie tydzień i zostawmy to ....

Nie będę wydawał teraz kilka stów aby zrobić program od 0... zgodnie z założeniami, który w wyniku nie będzie mi generował śmietnika. Tylko czyste dane.

0

Już nie aktualne.

1 użytkowników online, w tym zalogowanych: 0, gości: 1