Проверьте, существует ли ключ, и повторите массив JSON с помощью Python

130

У меня есть куча данных JSON из сообщений Facebook, подобных приведенному ниже:

{"from": {"id": "8", "name": "Mary Pinter"}, "message": "How ARE you?", "comments": {"count": 0}, "updated_time": "2012-05-01", "created_time": "2012-05-01", "to": {"data": [{"id": "1543", "name": "Honey Pinter"}]}, "type": "status", "id": "id_7"}

Данные JSON частично структурированы, и все это не одно и то же. Ниже мой код:

import json 

str = '{"from": {"id": "8", "name": "Mary Pinter"}, "message": "How ARE you?", "comments": {"count": 0}, "updated_time": "2012-05-01", "created_time": "2012-05-01", "to": {"data": [{"id": "1543", "name": "Honey Pinter"}]}, "type": "status", "id": "id_7"}'
data = json.loads(str)

post_id = data['id']
post_type = data['type']
print(post_id)
print(post_type)

created_time = data['created_time']
updated_time = data['updated_time']
print(created_time)
print(updated_time)

if data.get('application'):
    app_id = data['application'].get('id', 0)
    print(app_id)
else:
    print('null')

#if data.get('to'):
#... This is the part I am not sure how to do
# Since it is in the form "to": {"data":[{"id":...}]}

Я хочу, чтобы код печатал to_id как 1543, иначе печатал 'null'

Я не знаю, как это сделать.

прави
источник

Ответы:

162
import json

jsonData = """{"from": {"id": "8", "name": "Mary Pinter"}, "message": "How ARE you?", "comments": {"count": 0}, "updated_time": "2012-05-01", "created_time": "2012-05-01", "to": {"data": [{"id": "1543", "name": "Honey Pinter"}]}, "type": "status", "id": "id_7"}"""

def getTargetIds(jsonData):
    data = json.loads(jsonData)
    if 'to' not in data:
        raise ValueError("No target in given data")
    if 'data' not in data['to']:
        raise ValueError("No data for target")

    for dest in data['to']['data']:
        if 'id' not in dest:
            continue
        targetId = dest['id']
        print("to_id:", targetId)

Вывод:

In [9]: getTargetIds(s)
to_id: 1543
inspectorG4dget
источник
6
Зачем нужны эти явные inпроверки и отсутствуют raiseли они? Просто войдите в него без проверки, и вы получите точно такое же поведение (за исключением того, что KeyErrorвместо a ValueError).
abarnert
101

Если все, что вам нужно, это проверить, существует ли ключ или нет

h = {'a': 1}
'b' in h # returns False

Если вы хотите проверить, есть ли значение для ключа

h.get('b') # returns None

Вернуть значение по умолчанию, если фактическое значение отсутствует

h.get('b', 'Default value')
athap
источник
вернет 'null', а не 'Значение по умолчанию', как ожидалось для b в случае {'a': 1, 'b': null}
MikeL
16

Рекомендуется создавать вспомогательные служебные методы для подобных вещей, чтобы всякий раз, когда вам нужно изменить логику проверки атрибутов, они были в одном месте, а код был более читабельным для последователей.

Например, создайте вспомогательный метод (или класс JsonUtilsсо статическими методами) в json_utils.py:

def get_attribute(data, attribute, default_value):
    return data.get(attribute) or default_value

а затем используйте его в своем проекте:

from json_utils import get_attribute

def my_cool_iteration_func(data):

    data_to = get_attribute(data, 'to', None)
    if not data_to:
        return

    data_to_data = get_attribute(data_to, 'data', [])
    for item in data_to_data:
        print('The id is: %s' % get_attribute(item, 'id', 'null'))

ВАЖНАЯ ЗАМЕТКА:

Есть причина, по которой я использую data.get(attribute) or default_valueвместо простого data.get(attribute, default_value):

{'my_key': None}.get('my_key', 'nothing') # returns None
{'my_key': None}.get('my_key') or 'nothing' # returns 'nothing'

В моих приложениях получение атрибута со значением 'null' равносильно отсутствию атрибута вообще. Если ваше использование отличается, вам необходимо это изменить.

Микель
источник
4
jsonData = """{"from": {"id": "8", "name": "Mary Pinter"}, "message": "How ARE you?", "comments": {"count": 0}, "updated_time": "2012-05-01", "created_time": "2012-05-01", "to": {"data": [{"id": "1543", "name": "Honey Pinter"}, {"name": "Joe Schmoe"}]}, "type": "status", "id": "id_7"}"""

def getTargetIds(jsonData):
    data = json.loads(jsonData)
    for dest in data['to']['data']:
        print("to_id:", dest.get('id', 'null'))

Попытайся:

>>> getTargetIds(jsonData)
to_id: 1543
to_id: null

Или, если вы просто хотите пропустить значения с отсутствующими идентификаторами вместо печати 'null':

def getTargetIds(jsonData):
    data = json.loads(jsonData)
    for dest in data['to']['data']:
        if 'id' in to_id:
            print("to_id:", dest['id'])

Так:

>>> getTargetIds(jsonData)
to_id: 1543

Конечно, в реальной жизни вам, вероятно, не нужен printкаждый идентификатор, а нужно хранить их и что-то с ними делать, но это уже другая проблема.

abarnert
источник
4
if "my_data" in my_json_data:
         print json.dumps(my_json_data["my_data"])
Аджит Сурендран
источник
4

Я написал для этого крошечную функцию. Не стесняйтесь перепрофилировать,

def is_json_key_present(json, key):
    try:
        buf = json[key]
    except KeyError:
        return False

    return True
tabdiukov
источник