Prosty edytor plików HTML - prośba o nakierowanie

0

Witajcie
Zamierzam napisać prosty edytor plików html i przy okazji nauczyć się c# (w oparciu o najnowsze visual studio express). Nie mam problemów z html i css, w jscripcie zazwyczaj potrafię się odnaleźć. W c# stawiam pierwsze kroki z książką "Beginning Visual c# 2012 programming", kiedyś programowałem w delphi i liczyłem że zaadoptuje się szybko do tego języka (się jeszcze okaże).

Sprawa wygląda tak: we firmie pracujemy na dwóch aplikacjach ("program" i "system"). "Program" generuje raporty html które następnie ręcznie przepuszczamy przez "system". "Program" niestety nie pozwala zawrzeć w raporcie tyle informacji ile byśmy chcieli (nie można zmusić "programu" by wypluł więcej zmiennych), jednak można mu zedytować szablon tego html (dodać style, zmienić strukturę).

Planuję dodać do szablonu raportu kilka kluczowych divów na których mógłby pracować edytor. Edytor, który chcę napisać (w windows form), powinien zaczytać wartości tych divów (oczywiście puste na początku), pozwolić na ich podmianę (wpisanie lub wybór z listy) i zapisać je do tych divów w pliku raportu.

Chciałbym was prosić o jakieś wskazówki, jak to ugryźć akurat w c#, jakie zmienne, dialogi.
Z góry dziękuję.

0

DOMDocument + XML + XPath

0

Udało mi się opanować (w potrzebnym dla mnie zakresie) kontrolkę

webBrowser

i getElementById

. Odczyt zawartości określonego <code class="html"><div>

(innerText

) to textboxa i z powrotem. Podobnie odczyt <div> i przypisanie pasującej wartości do właściwego itemu w comboboxie.
W drugą stronę również to działa - zmieniony textbox, zmieniony combobox, a nawet zaznaczony textbox podstawiają swoją zawartość do otwartego pliku html (podgląd widoczny od razu w kontrolce 
```csharp
webBrowser

).

Jednak z zapisem po edycji jest problem: wywołanie dialogu

ShowSaveAs

nie zapisuje zmian, a funkcja File.WriteAllText

 wraz z <code class="csharp">webBrowser.Document.Body.Parent.OuterHtml

modyfikuje kod w sposób dla mnie niedopuszczalny - usuwa praktycznie wszystkie cudzysłowy (z id="xxx"

 robi <code class="html">id=xxx

), czasem usuwa znaki końca wiersza (scala kilka linijek kodu), pomija doctype

 na początku pliku, nie działają przez to niektóre style. 
O ile plik prezentuje się niemalże identycznie w przeglądarce (i nie ma problemów z wydrukiem - zdziwiłem się bo wszystko dotąd okazało się to całkiem prościutkie) to nie mogę go już wykorzystać w swoim celu - mam taki crawler (robot danych) który ze zbioru plików html w strukturze katalogów odczytuje pewne informacje, jako że kod się zmienia (a ja nie mogę zmienić nic w tym crawlerze) dane nie zostają zaczytane.

Potrzebuję sposobu by zapisać html ze zmianami (tylko zmieniam innertext wewnątrz określonych id divów) bez naruszania reszty kodu. Jedyne co mi przychodzi do głowy to zabawa z podziałem łańcucha znaków i sklejeniem kodu przed zapisem, i jeszcze nie wiem jak się za to zabrać.
0

Mam w swojej aplikacji podobną potrzebę i mam zamiar zrobić to tak:

  • plik .html mam zapisany na dysku i odczytuję go za pomocą File.ReadLine ,
  • następnie szukam w stringu to co mnie interesuje i jeśli znajdę, to zmieniam
  • wysyłam dane do zapisu.
  • gdy w linijce nie ma tego czego szukam też wysyłam do zapisu ale bez zmian

taka moja koncepcja :)

0

Nie miałem czasu się za to zabrać, ale skoro już mam html wczytanego w kontrolce webBrowser - i potrafię znaleźć innertext właściwych divów to mogę ich użyć jako warunków przeszukiwania i dzielenia stringu zawierającego cały kod pliku html. Jeśli div jest pusty to innertext też będzie pusty ale będę miał ciąg

<div id="labelidfirma"></div>

też powinno się udać.
Co prawda jeśli mam obecnie ok 15 divów których zawartość mnie interesuje (modyfikowalna zawartość) to będę miał sporo pisania warunków :) liczyłem na coś prostszego. No i muszę przerobić rozdział operacji na stringach.

1 użytkowników online, w tym zalogowanych: 0, gości: 1