Как я могу вернуть вывод сводной таблицы в MySQL?

312

Если у меня MySQL таблица выглядит примерно так:

название страницы действия компании
-------------------------------
Компания А ПРИНТ 3
Компания А ПРИНТ 2
Компания А ПРИНТ 3
Компания B EMAIL   
Компания Б ПРИНТ 2
Компания Б ПРИНТ 2
Компания Б ПРИНТ 1
Компания А ПРИНТ 3

Можно ли выполнить запрос MySQL, чтобы получить вывод, как это:

название компании EMAIL PRINT 1 страница PRINT 2 страницы PRINT 3 страницы
-------------------------------------------------- -----------
CompanyA 0 0 1 3
CompanyB 1 1 2 0

Идея заключается в том, что pagecountможет варьироваться, поэтому количество выходных столбцов должно отражать это: один столбец для каждой пары action/, pagecountа затем число попаданий на company_name. Я не уверен, что это называется сводной таблицей, но кто-то предложил это?

peku
источник
3
Это называется поворотом, и это преобразование выполняется намного быстрее SQL.
NB
1
Excel просматривает подобные вещи, в MySQL это действительно сложно, так как нет оператора "CROSSTAB" :(
Дэйв Рикс,
Да, в настоящее время это делается вручную в Excel, и мы пытаемся его автоматизировать.
peku
3
Здесь я нашел пошаговый пример: как автоматизировать сводные таблицы . и это
Devid G
1
@giannischristofakis - это действительно зависит от того, что вы и ваши коллеги считаете проще. С тех пор, как я оставил комментарий (4 года), технологии немного выросли, поэтому полностью зависит от того, что вы считаете лучше - будь то приложение или SQL. Например, в моей работе мы сталкиваемся с похожей проблемой, но мы комбинируем как SQL, так и встроенный подход. По сути, я не могу помочь вам, кроме как дать самоуверенный ответ, и это не то, что вам нужно :)
NB

Ответы:

236

В основном это сводная таблица.

Хороший учебник о том, как этого добиться, можно найти здесь: http://www.artfulsoftware.com/infotree/qrytip.php?id=78.

Я советую прочитать этот пост и адаптировать это решение к вашим потребностям.

Обновить

После того, как ссылка выше в настоящее время больше не доступна, я чувствую себя обязанным предоставить некоторую дополнительную информацию для всех вас, ищущих ответы на MySQL здесь. В нем действительно было огромное количество информации, и я не буду помещать все оттуда сюда (даже больше, так как я просто не хочу копировать их обширные знания), но я дам несколько советов о том, как справиться с Pivot Таблицы SQL путь, как правило, с примером из peku, который задал вопрос в первую очередь.

Возможно ссылка скоро вернется, я буду следить за этим.

Способ работы с электронными таблицами ...

Многие люди просто используют такой инструмент, как MSExcel, OpenOffice или другие инструменты для работы с электронными таблицами. Это правильное решение, просто скопируйте данные туда и используйте инструменты, которые предлагает GUI, чтобы решить эту проблему.

Но ... это был не вопрос, и это может даже привести к некоторым недостаткам, таким как, как поместить данные в электронную таблицу, проблематичное масштабирование и так далее.

SQL путь ...

Учитывая, что его таблица выглядит примерно так:

CREATE TABLE `test_pivot` (
  `pid` bigint(20) NOT NULL AUTO_INCREMENT,
  `company_name` varchar(32) DEFAULT NULL,
  `action` varchar(16) DEFAULT NULL,
  `pagecount` bigint(20) DEFAULT NULL,
  PRIMARY KEY (`pid`)
) ENGINE=MyISAM;

Теперь посмотрите на его / ее желаемую таблицу:

company_name    EMAIL   PRINT 1 pages   PRINT 2 pages   PRINT 3 pages
-------------------------------------------------------------
CompanyA        0       0               1               3
CompanyB        1       1               2               0

Строки ( EMAIL, PRINT x pages) напоминают условия. Основная группировка по company_name.

Для того, чтобы установить условия, достаточно кричать об использовании CASE-statement. Для того , чтобы сгруппировать по чему - то, ну, использование ... GROUP BY.

Базовый SQL, обеспечивающий эту опору, может выглядеть примерно так:

SELECT  P.`company_name`,
    COUNT(
        CASE 
            WHEN P.`action`='EMAIL' 
            THEN 1 
            ELSE NULL 
        END
    ) AS 'EMAIL',
    COUNT(
        CASE 
            WHEN P.`action`='PRINT' AND P.`pagecount` = '1' 
            THEN P.`pagecount` 
            ELSE NULL 
        END
    ) AS 'PRINT 1 pages',
    COUNT(
        CASE 
            WHEN P.`action`='PRINT' AND P.`pagecount` = '2' 
            THEN P.`pagecount` 
            ELSE NULL 
        END
    ) AS 'PRINT 2 pages',
    COUNT(
        CASE 
            WHEN P.`action`='PRINT' AND P.`pagecount` = '3' 
            THEN P.`pagecount` 
            ELSE NULL 
        END
    ) AS 'PRINT 3 pages'
FROM    test_pivot P
GROUP BY P.`company_name`;

Это должно обеспечить желаемый результат очень быстро. Основным недостатком этого подхода является то, что чем больше строк в сводной таблице требуется, тем больше условий необходимо определить в операторе SQL.

С этим тоже можно бороться, поэтому люди склонны использовать готовые операторы, процедуры, счетчики и тому подобное.

Некоторые дополнительные ссылки на эту тему:

Бьорн
источник
4
ссылка, кажется, работает на данный момент ... если она снова выйдет из строя , попробуйте следующее: кэш Google webcache.googleusercontent.com/… или Internet Wayback Machine ( web.archive.org/web/20070303120558 * / artfulsoftware.com/ infotree / questions.php )
Lykegenes
ссылка доступна по этому адресу artfulsoftware.com/infotree/qrytip.php?id=78
MrPandav
1
Есть еще один способ создания сводной таблицы без использования «if», «case» или «GROUP_CONCAT»: en.wikibooks.org/wiki/MySQL/Pivot_table
user2513149
Вы можете удалить ELSE NULL из своего CASE, поскольку шляпа является поведением по умолчанию (а условная агрегация достаточно многословна)
Caius Jard
86

Мое решение в T-SQL без каких-либо опорных точек:

SELECT
    CompanyName,  
    SUM(CASE WHEN (action='EMAIL') THEN 1 ELSE 0 END) AS Email,
    SUM(CASE WHEN (action='PRINT' AND pagecount=1) THEN 1 ELSE 0 END) AS Print1Pages,
    SUM(CASE WHEN (action='PRINT' AND pagecount=2) THEN 1 ELSE 0 END) AS Print2Pages,
    SUM(CASE WHEN (action='PRINT' AND pagecount=3) THEN 1 ELSE 0 END) AS Print3Pages
FROM 
    Company
GROUP BY 
    CompanyName
РРМ
источник
2
Это работает для меня даже на PostgreSQL. Я предпочитаю этот метод, чем использовать расширение кросс-
таблицы
2
«Мое решение в T-SQL без каких-либо опорных точек:« Не только SQL Server, он должен работать на большинстве поставщиков баз данных, который соответствует стандартам ANSI SQL. Обратите внимание, что вы SUM()можете работать только с числовыми данными, если вам нужно использовать сводные строки, которые вам придется использоватьMAX()
Raymond Nijland
1
Я думаю, что CASE является ненужным SUM(CASE WHEN (action='PRINT' AND pagecount=1) THEN 1 ELSE 0 END), вы можете просто сделать, SUM(action='PRINT' AND pagecount=1)так как условие будет преобразовано, 1когда истинно и 0когда ложно
kajacx
1
@kajacx да, хотя это необходимо для базы данных, в которой нет такого рода логических манипуляций. Учитывая выбор между «более длинным синтаксисом, который работает на всех дБ» и «более коротким синтаксисом, который работает только на ...», я бы выбрал первый
Caius Jard
66

Для MySQL вы можете напрямую поставить условия в SUM()функцию, и она будет оценена как логическая 0или,1 таким образом, вы можете рассчитывать количество на основе ваших критериев без использования IF/CASEоператоров.

SELECT
    company_name,  
    SUM(action = 'EMAIL')AS Email,
    SUM(action = 'PRINT' AND pagecount = 1)AS Print1Pages,
    SUM(action = 'PRINT' AND pagecount = 2)AS Print2Pages,
    SUM(action = 'PRINT' AND pagecount = 3)AS Print3Pages
FROM t
GROUP BY company_name

DEMO

М Халид Джунаид
источник
1
Это действительно аккуратно. Вы знаете, соответствует ли это стандартам для других платформ (например, Postgres)?
itols
3
@itsols Нет, это только для Mysql
M Khalid Junaid
@itsols: я добавил еще одну стандартную версию SQL . Postgres также имеет специальную crosstab()функцию.
Эрвин Брандштеттер
2
Работает также для SQLite
SBF
37

Для динамического поворота используйте GROUP_CONCATс CONCAT. Функция GROUP_CONCAT объединяет строки из группы в одну строку с различными параметрами.

SET @sql = NULL;
SELECT
    GROUP_CONCAT(DISTINCT
    CONCAT(
      'SUM(CASE WHEN action = "',
      action,'"  AND ', 
           (CASE WHEN pagecount IS NOT NULL 
           THEN CONCAT("pagecount = ",pagecount) 
           ELSE pagecount IS NULL END),
      ' THEN 1 ELSE 0 end) AS ',
      action, IFNULL(pagecount,'')

    )
  )
INTO @sql
FROM
  t;

SET @sql = CONCAT('SELECT company_name, ', @sql, ' 
                  FROM t 
                   GROUP BY company_name');

PREPARE stmt FROM @sql;
EXECUTE stmt;
DEALLOCATE PREPARE stmt;

ДЕМО ЗДЕСЬ

Абхишек Гупта
источник
2
Pacerier, настоящий мужчина, но для динамичного поворота это один из лучших подходов
Абхишек Гупта
2
Это хорошо работает, если в столбце «действия» много значений или вы ожидаете, что этот список со временем будет расти, поскольку написание оператора case для каждого значения может занимать много времени и его трудно поддерживать в актуальном состоянии.
Патрик Мерфи
23

Версия стандартного SQL с использованием логической логики :

SELECT company_name
     , COUNT(action = 'EMAIL' OR NULL) AS "Email"
     , COUNT(action = 'PRINT' AND pagecount = 1 OR NULL) AS "Print 1 pages"
     , COUNT(action = 'PRINT' AND pagecount = 2 OR NULL) AS "Print 2 pages"
     , COUNT(action = 'PRINT' AND pagecount = 3 OR NULL) AS "Print 3 pages"
FROM   tbl
GROUP  BY company_name;

SQL Fiddle.

Как?

TRUE OR NULL доходность TRUE.
FALSE OR NULLдоходность NULL.
NULL OR NULLдоходность NULL.
И COUNTтолько считает ненулевые значения. Вуаля.

Эрвин Брандштеттер
источник
@ Erwin, а как ты узнал, что там три колонки? Что делать, если есть 5? 10? 20?
Pacerier
@Pacerier: пример в вопросе, кажется, предполагает это. В любом случае, SQL требует знать тип возвращаемого значения. полностью динамический запрос не представляется возможным. Если количество выходных столбцов может варьироваться, вам нужно выполнить два шага: 1-й построить запрос, 2-й: выполнить его.
Эрвин Брандштеттер,
11

Правильный ответ:

select table_record_id,
group_concat(if(value_name='note', value_text, NULL)) as note
,group_concat(if(value_name='hire_date', value_text, NULL)) as hire_date
,group_concat(if(value_name='termination_date', value_text, NULL)) as termination_date
,group_concat(if(value_name='department', value_text, NULL)) as department
,group_concat(if(value_name='reporting_to', value_text, NULL)) as reporting_to
,group_concat(if(value_name='shift_start_time', value_text, NULL)) as shift_start_time
,group_concat(if(value_name='shift_end_time', value_text, NULL)) as shift_end_time
from other_value
where table_name = 'employee'
and is_active = 'y'
and is_deleted = 'n'
GROUP BY table_record_id
Talha
источник
1
Это просто пример, который вы имели под рукой? Какова структура other_valueтаблицы?
Патрик Мерфи
1
«Правильный ответ:« Скорее всего, нет, так как отсутствует SETзапрос на увеличение значения по умолчанию, которое ограничено 1024 для GROUP_CONCAT после 1024 GROUP_CONCAT просто обрезает строку без ошибки, означая, что могут произойти непредвиденные результаты ..
Raymond Nijland
извините, ребята, не могу вспомнить больше деталей. Я делаю вещи для развлечения, а затем забываю или разрушаю весь проект. Но когда я сталкиваюсь с проблемой, я рассказываю, как я ее исправил. Я знаю, что мой пример не очень подробный, но я думаю, что он может дать указания тем, кто знает, с чем они
Талха
9

Существует инструмент под названием MySQL Pivot Table Generator, который может помочь вам создать сводную таблицу на основе веб-интерфейса, которую вы сможете позже экспортировать в Excel (если хотите). это может работать, если ваши данные находятся в одной таблице или в нескольких таблицах.

Все, что вам нужно сделать, это указать источник данных для столбцов (он поддерживает динамические столбцы), строки, значения в теле таблицы и отношения таблицы (если они есть) Сводная таблица MySQL

Домашняя страница этого инструмента http://mysqlpivottable.net

Питер Грин
источник
3
select t3.name, sum(t3.prod_A) as Prod_A, sum(t3.prod_B) as Prod_B, sum(t3.prod_C) as    Prod_C, sum(t3.prod_D) as Prod_D, sum(t3.prod_E) as Prod_E  
from
(select t2.name as name, 
case when t2.prodid = 1 then t2.counts
else 0 end  prod_A, 

case when t2.prodid = 2 then t2.counts
else 0 end prod_B,

case when t2.prodid = 3 then t2.counts
else 0 end prod_C,

case when t2.prodid = 4 then t2.counts
else 0 end prod_D, 

case when t2.prodid = "5" then t2.counts
else 0 end prod_E

from 
(SELECT partners.name as name, sales.products_id as prodid, count(products.name) as counts
FROM test.sales left outer join test.partners on sales.partners_id = partners.id
left outer join test.products on sales.products_id = products.id 
where sales.partners_id = partners.id and sales.products_id = products.id group by partners.name, prodid) t2) t3

group by t3.name ;
IRBA
источник