Utworzenie struktury wewnętrznej w celu odczytu pliku (docx) i zapisu w (XML) oraz załadowaniu do TESTLINKA

0

Cześć.

Mam pewien problem i nie wiem jak do niego podejść, a konkretnie:

Potrzebuję utworzyć pliki łatwe do załadowania do testlinka na podstawie plików word(docx).

Pliki word są różne, chodzi o to by przyjąc jakiś elastyczny schemat - Zapisać sobie odczytane informacje z pliku docx do jakiś struktur pośrednich, które pozwolą odczytać zawartość
całego pliku do tych struktur, a później wynikowo zapisać do formatu XML i załadować do Testlinka.

Chodzi o podejście do tej struktury wewnętrznej - jak ją zaprojektować? Tak jak wspomniałem pliki docx są różne. W jednym pliku po nagłówku jest dwukropek, w innym nie ma. W jednym pliku scenariusz jest podany w krokach, inny jest opisany w tabelce. W jednym pliku tabelka jest zupełnie inna niż w drugim. Zastanawiam się jak do tego podejść.

Jak byście podeszli do takiego tematu?

1

Zmień rozszerzenie pliku docx na zip i rozpakuj taki plik. Zawiera on pliki XML opisujące strukturę i zawartość pliku. Może coś Cię naprowadzi na rozwiązanie

0

Od 30min właśnie już przeglądam sobie pliki XML. Nie wiem jednak jak podejść do problemu zaczytania różnych danych. Przykładowo raz kroki scenariusza testowego są wypisane w punktach, a w innym dokumencie w tabeli. I tu właśnie chodzi o te strukturę pośrednią, która będzie w stanie przewidzieć wszystkie takie odstępstwa.

0

Po przeanalizowaniu różnych dokumentów docx widzę różnice w nazwach nagłówków itp ( nie są one ujednolicone) ,a dokumenty docx nie mają ściśle określonych choćby nawet kilkunastu templatek, które można okodować. Tak naprawdę może być nieskończona ilość jakiś małych różnic w nazewnictwie i zastanawiam się czy to jest wgl wykonalne...

1

Przykładowo raz kroki scenariusza testowego są wypisane w punktach, a w innym dokumencie w tabeli. I tu właśnie chodzi o te strukturę pośrednią, która będzie w stanie przewidzieć wszystkie takie odstępstwa.

Czyli chcesz mieć AI które domyśli się o co autorowi dokumentu chodziło.
Łatwiej chyba będzie narzucić konkretny szablon dokumentu.

0

Dokładnie, po zastanowieniu też uważam, że łatwiej będzie narzucić szablon dokumentu.

0

Może daj użytkownikowi jakiś edytor formatu YAML, to narzuci strukturę dokumentu, którą potem bezproblemowo zinterpretujesz.

1 użytkowników online, w tym zalogowanych: 0, gości: 1