XML w pythonie - wbudowany? LXML? czy coś innego?

0

Chciałbym się nauczyć wykorzystywać w Pythonie pliki XML (na użytek aplikacji desktopowych i webowych). Czy lepiej postawić na biblioteki standardowe pythona, czy jakieś zewnętrzne, jak np. LXML lub inne? Co polecacie? Co warto poznać?

0

Ten podstawowy bardzo ogranicza ale na początek starczy. Co do tego LXML to go nie używałem ale zakładam, że działa podobnie, ponadto lepiej za bardzo nie polegaj na XML, ponieważ jest WOLNY.

0

Możesz użyć BeautifulSoup. Przydaje się do parsowania tego typu rzeczy, to dojrzała biblioteka.

0

Do parsowania xml, html wystarczy regex

0

W pracy najczęściej spotkasz się z lxml, ponieważ jest najwydajniejszy, a przy mieleniu dużej ilości dokumentów tylko to się liczy. Minusem lxml są jego zależności, ponieważ nie był pisany w czystym pythonie. Natomiast BeautifulSoup z natury wolny, ale jeśli masz zainstalowany lxml to jest w stanie to wykryć i wykorzystać na Twoją korzyść.

Przy okazji polecam zerknąć na prezentację *PyCon PL 2013 "Python w służbie jej królewskiej mości"[*0], która opisuje wady i zalety najpopularniejszych parserów html.

[0] -

0
merlinnot napisał(a):

Możesz użyć BeautifulSoup. Przydaje się do parsowania tego typu rzeczy, to dojrzała biblioteka.

Ale to raczej służy głównie czy tylko do HTML, a nie XML?

0
Wybitny Samiec napisał(a):

Ale to raczej służy głównie czy tylko do HTML, a nie XML?

"Beautiful Soup is a Python library for pulling data out of HTML and XML files."

http://www.crummy.com/software/BeautifulSoup/bs4/doc/

0

Beautiful Soup is a Python library for pulling data out of HTML and XML files.

0

Czy jest w Pythonie jakiś validator, sprawdzający poprawność kodu XML??

1 użytkowników online, w tym zalogowanych: 0, gości: 1