Parsowanie JSON

0

Hej.

Mam taki plik json:

{
     "valid": {
          "documents/00099732": {
               " Prezes Komunikacji Elektronicznej": {
                    "tokens": [
                         "Prezes",
                         "Komunikacji",
                         "Elektronicznej",
                    ],
                    "lemmas": [
                         "prezes",
                         .......,

i potrzebuje dostać się do "tokens" bo muszę zliczyć ich ilość.

Jakieś pomysły?

1
import json

string = """
{
     "valid": {
          "documents/00099732": {
               " Prezes Komunikacji Elektronicznej": {
                    "tokens": [
                         "Prezes",
                         "Komunikacji",
                         "Elektronicznej",
                    ],
                    "lemmas": [
                         "prezes",
                         .......,
"""

parsed = json.loads(string)

tokens = parsed['valid']['documents/00099732'][" Prezes Komunikacji Elektronicznej"]['tokens']
0

Tak to wiem:)

Mam wiele takich ‚tokens’ :)

3
Paweł Tometczak napisał(a):

Tak to wiem:)

Mam wiele takich ‚tokens’ :)

No to musisz sprecyzować dokładnie które z tych wielu 'tokens' chcesz.

Jeśli tylko ze wszystkich dat, to tak:

tokens = [t[" Prezes Komunikacji Elektronicznej"]['tokens'] for t in parsed['valid'].values()]
1
import jmespath

jmespath.search("valid.*.*.tokens | [][]", data)

1 użytkowników online, w tym zalogowanych: 0, gości: 1