“Pivot Spark Data Frame с использованием python” Ответ

Pivot Spark Data Frame с использованием python

from pyspark.sql.functions import avg

flights = (sqlContext
    .read
    .format("csv")
    .options(inferSchema="true", header="true")
    .load("flights.csv")
    .na.drop())

flights.registerTempTable("flights")
sqlContext.cacheTable("flights")

gexprs = ("origin", "dest", "carrier")
aggexpr = avg("arr_delay")

flights.count()
## 336776

%timeit -n10 flights.groupBy(*gexprs ).pivot("hour").agg(aggexpr).count()
## 10 loops, best of 3: 1.03 s per loop

Anuj Sharma

Ответы похожие на “Pivot Spark Data Frame с использованием python”

Привязки Python 2 для RPM необходимы для этого модуля. Если вам нужна поддержка Python 3, используйте вместо этого модуль `dnf` ansible .. Модуль Python 2 Yum необходим для этого модуля. Если вам нужна поддержка Python 3, используйте вместо этого модуль `dnf`.

Вопросы похожие на “Pivot Spark Data Frame с использованием python”

Больше похожих ответов на “Pivot Spark Data Frame с использованием python” по Python

Смотреть популярные ответы по языку

Смотреть другие языки программирования

Shell/Bash

C++

CSS

HTML

Java

JavaScript

Objective-C

PHP

Python

Sql

Swift

Ruby

TypeScript

Kotlin

Assembly

VBA

Scala

Rust

Dart

Elixir

Clojure

Haskell

Matlab

Erlang

Cobol

Fortran

Scheme

Perl

Groovy

Lua

Julia

Delphi

Abap

Lisp

Prolog

Pascal

ActionScript

Basic

Solidity

PowerShell

GDScript

Excel