Как разобрать JSON в Scala с помощью стандартных классов Scala?

113

Я использую сборку в классе JSON в Scala 2.8 для анализа кода JSON. Я не хочу использовать тот или иной Liftweb из-за минимизации зависимостей.

То, как я это делаю, кажется слишком важным, есть ли лучший способ сделать это?

import scala.util.parsing.json._
...
val json:Option[Any] = JSON.parseFull(jsonString)
val map:Map[String,Any] = json.get.asInstanceOf[Map[String, Any]]
val languages:List[Any] = map.get("languages").get.asInstanceOf[List[Any]]
languages.foreach( langMap => {
val language:Map[String,Any] = langMap.asInstanceOf[Map[String,Any]]
val name:String = language.get("name").get.asInstanceOf[String]
val isActive:Boolean = language.get("is_active").get.asInstanceOf[Boolean]
val completeness:Double = language.get("completeness").get.asInstanceOf[Double]
}
Фил
источник

Ответы:

130

Это решение, основанное на экстракторах, которые будут выполнять приведение класса:

class CC[T] { def unapply(a:Any):Option[T] = Some(a.asInstanceOf[T]) }

object M extends CC[Map[String, Any]]
object L extends CC[List[Any]]
object S extends CC[String]
object D extends CC[Double]
object B extends CC[Boolean]

val jsonString =
    """
      {
        "languages": [{
            "name": "English",
            "is_active": true,
            "completeness": 2.5
        }, {
            "name": "Latin",
            "is_active": false,
            "completeness": 0.9
        }]
      }
    """.stripMargin

val result = for {
    Some(M(map)) <- List(JSON.parseFull(jsonString))
    L(languages) = map("languages")
    M(language) <- languages
    S(name) = language("name")
    B(active) = language("is_active")
    D(completeness) = language("completeness")
} yield {
    (name, active, completeness)
}

assert( result == List(("English",true,2.5), ("Latin",false,0.9)))

В начале цикла for я искусственно оборачиваю результат в список, чтобы в конце получился список. Затем в остальной части цикла for я использую тот факт, что генераторы (using <-) и определения значений (using =) будут использовать методы unapply.

(Старый ответ удален - проверьте историю изменений, если вам интересно)

Huynhjl
источник
Извините, что откопал старый пост, но что означает первый Some (M (map)) в цикле? Я понимаю, что M (карта) извлекает карту в переменную "map", но как насчет Some?
Федерико Бонелли
1
@FedericoBonelli, JSON.parseFullвозвращается Option[Any], поэтому он начинается с List(None)или List(Some(any)). Это Someдля сопоставления с образцом на Option.
huynhjl
21

Вот как я выполняю сопоставление с образцом:

val result = JSON.parseFull(jsonStr)
result match {
  // Matches if jsonStr is valid JSON and represents a Map of Strings to Any
  case Some(map: Map[String, Any]) => println(map)
  case None => println("Parsing failed")
  case other => println("Unknown data structure: " + other)
}
Маттиас Браун
источник
Можете ли вы привести пример вашего jsonStr, он не работает с приведенным выше примером jsonStr
priya khokher
Возможно, стоит задать вопрос по вашей проблеме. В настоящее время на моем компьютере не установлен Scala, поэтому у меня нет готовой строки JSON.
Маттиас Браун
12

Мне нравится ответ @ huynhjl, он привел меня по правильному пути. Однако он не очень хорошо справляется с ошибками. Если желаемый узел не существует, вы получите исключение приведения. Я немного адаптировал это, Optionчтобы лучше справиться с этим.

class CC[T] {
  def unapply(a:Option[Any]):Option[T] = if (a.isEmpty) {
    None
  } else {
    Some(a.get.asInstanceOf[T])
  }
}

object M extends CC[Map[String, Any]]
object L extends CC[List[Any]]
object S extends CC[String]
object D extends CC[Double]
object B extends CC[Boolean]

for {
  M(map) <- List(JSON.parseFull(jsonString))
  L(languages) = map.get("languages")
  language <- languages
  M(lang) = Some(language)
  S(name) = lang.get("name")
  B(active) = lang.get("is_active")
  D(completeness) = lang.get("completeness")
} yield {
  (name, active, completeness)
}

Конечно, это не столько обрабатывает ошибки, сколько позволяет избежать их. Это даст пустой список, если какой-либо из узлов json отсутствует. Вы можете использовать a, matchчтобы проверить наличие узла, прежде чем действовать ...

for {
  M(map) <- Some(JSON.parseFull(jsonString))
} yield {
  map.get("languages") match {
    case L(languages) => {
      for {
        language <- languages
        M(lang) = Some(language)
        S(name) = lang.get("name")
        B(active) = lang.get("is_active")
        D(completeness) = lang.get("completeness")
      } yield {
        (name, active, completeness)
      }        
    }
    case None => "bad json"
  }
}
murrayju
источник
3
Я думаю, что CC unapply можно значительно упростить def unapply(a: Option[Any]): Option[T] = a.map(_.asInstanceOf[T]).
Suma
Scala 2.12, похоже, нуждается в ';' перед строками с '=' для понимания.
akauppi
Для меня самый верхний код не «давал пустой список, если какой-либо из узлов json отсутствует», а MatchErrorвместо этого давал (Scala 2.12). Для этого необходимо заключить for в блок try / catch. Есть идеи получше?
akauppi
7

Я пробовал несколько вещей, отдавая предпочтение сопоставлению с образцом как способу избежать приведения типов, но столкнулся с проблемой стирания типов в типах коллекций.

Основная проблема, по-видимому, заключается в том, что полный тип результата синтаксического анализа отражает структуру данных JSON и является либо громоздким, либо невозможно полностью описать. Я думаю, поэтому Any используется для усечения определений типов. Использование Any приводит к необходимости кастинга.

Я взломал кое-что ниже, что является кратким, но чрезвычайно специфичным для данных JSON, подразумеваемых кодом в вопросе. Что-то более общее было бы более удовлетворительным, но я не уверен, что это было бы очень элегантно.

implicit def any2string(a: Any)  = a.toString
implicit def any2boolean(a: Any) = a.asInstanceOf[Boolean]
implicit def any2double(a: Any)  = a.asInstanceOf[Double]

case class Language(name: String, isActive: Boolean, completeness: Double)

val languages = JSON.parseFull(jstr) match {
  case Some(x) => {
    val m = x.asInstanceOf[Map[String, List[Map[String, Any]]]]

    m("languages") map {l => Language(l("name"), l("isActive"), l("completeness"))}
  }
  case None => Nil
}

languages foreach {println}
Дон Маккензи
источник
Мне нравится, когда пользователь неявного извлекает его.
Фил
4
val jsonString =
  """
    |{
    | "languages": [{
    |     "name": "English",
    |     "is_active": true,
    |     "completeness": 2.5
    | }, {
    |     "name": "Latin",
    |     "is_active": false,
    |     "completeness": 0.9
    | }]
    |}
  """.stripMargin

val result = JSON.parseFull(jsonString).map {
  case json: Map[String, List[Map[String, Any]]] =>
    json("languages").map(l => (l("name"), l("is_active"), l("completeness")))
}.get

println(result)

assert( result == List(("English", true, 2.5), ("Latin", false, 0.9)) )
Юрий Тумаха
источник
3
Это не рекомендуется в последней версии Scala, Unbundled. Есть идеи, как его использовать?
Sanket_patil
4

Вы можете это сделать! Код JSON очень легко разобрать: P

package org.sqkb.service.common.bean

import java.text.SimpleDateFormat

import org.json4s
import org.json4s.JValue
import org.json4s.jackson.JsonMethods._
//import org.sqkb.service.common.kit.{IsvCode}

import scala.util.Try

/**
  *
  */
case class Order(log: String) {

  implicit lazy val formats = org.json4s.DefaultFormats

  lazy val json: json4s.JValue = parse(log)

  lazy val create_time: String = (json \ "create_time").extractOrElse("1970-01-01 00:00:00")
  lazy val site_id: String = (json \ "site_id").extractOrElse("")
  lazy val alipay_total_price: Double = (json \ "alipay_total_price").extractOpt[String].filter(_.nonEmpty).getOrElse("0").toDouble
  lazy val gmv: Double = alipay_total_price
  lazy val pub_share_pre_fee: Double = (json \ "pub_share_pre_fee").extractOpt[String].filter(_.nonEmpty).getOrElse("0").toDouble
  lazy val profit: Double = pub_share_pre_fee

  lazy val trade_id: String = (json \ "trade_id").extractOrElse("")
  lazy val unid: Long = Try((json \ "unid").extractOpt[String].filter(_.nonEmpty).get.toLong).getOrElse(0L)
  lazy val cate_id1: Int = (json \ "cate_id").extractOrElse(0)
  lazy val cate_id2: Int = (json \ "subcate_id").extractOrElse(0)
  lazy val cate_id3: Int = (json \ "cate_id3").extractOrElse(0)
  lazy val cate_id4: Int = (json \ "cate_id4").extractOrElse(0)
  lazy val coupon_id: Long = (json \ "coupon_id").extractOrElse(0)

  lazy val platform: Option[String] = Order.siteMap.get(site_id)


  def time_fmt(fmt: String = "yyyy-MM-dd HH:mm:ss"): String = {
    val dateFormat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss")
    val date = dateFormat.parse(this.create_time)
    new SimpleDateFormat(fmt).format(date)
  }

}
Эхо Цзэн
источник
2

Вот как я делаю библиотеку Scala Parser Combinator:

import scala.util.parsing.combinator._
class ImprovedJsonParser extends JavaTokenParsers {

  def obj: Parser[Map[String, Any]] =
    "{" ~> repsep(member, ",") <~ "}" ^^ (Map() ++ _)

  def array: Parser[List[Any]] =
    "[" ~> repsep(value, ",") <~ "]"

  def member: Parser[(String, Any)] =
    stringLiteral ~ ":" ~ value ^^ { case name ~ ":" ~ value => (name, value) }

  def value: Parser[Any] = (
    obj
      | array
      | stringLiteral
      | floatingPointNumber ^^ (_.toDouble)
      |"true"
      |"false"
    )

}
object ImprovedJsonParserTest extends ImprovedJsonParser {
  def main(args: Array[String]) {
    val jsonString =
    """
      {
        "languages": [{
            "name": "English",
            "is_active": true,
            "completeness": 2.5
        }, {
            "name": "Latin",
            "is_active": false,
            "completeness": 0.9
        }]
      }
    """.stripMargin


    val result = parseAll(value, jsonString)
    println(result)

  }
}
хмехди
источник