MySQL Query GROUP BY день / месяц / год

649

Можно ли сделать простой запрос, чтобы подсчитать, сколько записей у меня есть в определенный период времени, например, год, месяц или день, имея TIMESTAMPполе, например:

SELECT COUNT(id)
FROM stats
WHERE record_date.YEAR = 2009
GROUP BY record_date.YEAR

Или даже:

SELECT COUNT(id)
FROM stats
GROUP BY record_date.YEAR, record_date.MONTH

Иметь ежемесячную статистику.

Спасибо!

Фернандо Баррокаль
источник
1
Я полагаю, это должно быть GROUP BY record_date.MONTHв вашем первом фрагменте кода?
Чиккодоро

Ответы:

1012
GROUP BY YEAR(record_date), MONTH(record_date)

Проверьте дату и время функции в MySQL.

codelogic
источник
27
Вы можете добавить дополнительный столбец для большей ясности в некоторых случаях, например, когда записи охватывают несколько лет. SELECT COUNT (event_id), DATE_FORMAT (event_start, '% Y /% m')
Ric
Простой полный пример: SELECT count(*), record_date FROM anytable WHERE anytable.anycolumn = 'anycondition' GROUP BY YEAR(record_date), month(record_date);примечание: record_date - это тип даты TIMESTAMP
renedet
Вероятно, стоит упомянуть, что это не работало на моем MySQL 5.7 с колонкой с псевдонимом COUNT (нет ошибки, я получил ноль результатов). Когда я изменил, чтобы выбрать эти поля с псевдонимом, я мог группировать по псевдониму. Это стандартный образ докера MySQL 5.7, работающий в локальной среде, поэтому я понятия не имею, почему он не выдал ошибку или не дал результатов.
MrMesees
3
О боже, если бы я знал это раньше ... так много строк PHP, чтобы сделать что-то, что mysql может сделать в одной строке.
ночи
231
GROUP BY DATE_FORMAT(record_date, '%Y%m')

Примечание (прежде всего, для потенциальных downvoters). В настоящее время это может быть не так эффективно, как другие предложения. Тем не менее, я оставляю это как альтернативу, и еще одну, которая может помочь увидеть, насколько быстрее другие решения. (Поскольку вы не можете по-настоящему отличить быстрое от медленного до тех пор, пока не увидите разницу.) Кроме того, со временем могут быть внесены изменения в движок MySQL в отношении оптимизации, чтобы сделать это решение в некоторых (возможно, не очень). отдаленная) точка в будущем, чтобы стать вполне сопоставимой по эффективности с большинством других.

Андрей М
источник
3
У меня есть ощущение, что это не будет работать хорошо, потому что функция форматирования не сможет использовать индекс в столбце даты.
Сонни
@Stv: Вы можете рассмотреть ответ @ фу-чи тогда. Насколько я могу судить, групповые выражения как в этом ответе, так и в моем, оценивают одно и то же, но EXTRACT()могут быть более эффективными, чем DATE_FORMAT(). (У меня нет MySQL для правильного тестирования.)
Андрей М
45

Попробуй это

SELECT COUNT(id)
FROM stats
GROUP BY EXTRACT(YEAR_MONTH FROM record_date)

Функция EXTRACT (единица измерения от даты) лучше, так как используется меньшее количество группировок и функция возвращает числовое значение.

Условие сравнения при группировке будет быстрее, чем функция DATE_FORMAT (которая возвращает строковое значение). Попробуйте использовать функцию | поле, которое возвращает нестроковое значение для условия сравнения SQL (WHERE, HAVING, ORDER BY, GROUP BY).

фу-й
источник
43

Я попытался использовать утверждение «ГДЕ» выше, я думал, что это правильно, так как никто не исправил его, но я был неправ; после некоторых поисков я обнаружил, что это правильная формула для оператора WHERE, поэтому код выглядит так:

SELECT COUNT(id)  
FROM stats  
WHERE YEAR(record_date) = 2009  
GROUP BY MONTH(record_date)
dimazaid
источник
30

Если ваш поиск длится несколько лет, и вы все еще хотите группировать ежемесячно, я предлагаю:

Версия № 1:

SELECT SQL_NO_CACHE YEAR(record_date), MONTH(record_date), COUNT(*)
FROM stats
GROUP BY DATE_FORMAT(record_date, '%Y%m')

Версия № 2 (более эффективная) :

SELECT SQL_NO_CACHE YEAR(record_date), MONTH(record_date), COUNT(*)
FROM stats
GROUP BY YEAR(record_date)*100 + MONTH(record_date)

Я сравнил эти версии на большой таблице с 1 357 918 строками (), и вторая версия, кажется, имеет лучшие результаты.

версия 1 (в среднем 10 выполнений) : 1,404 секунды
версия 2 (в среднем 10 выполнений) : 0,780 секунды

( SQL_NO_CACHEключ добавлен для предотвращения кэширования MySQL для запросов.)

mr.baby123
источник
1
Подумайте о включении предложения @ fu-chi в свои тесты, оно может оказаться еще более эффективным. Кроме того, вы проверили GROUP BY YEAR(record_date)*100 + MONTH(record_date), но почему бы не проверить GROUP BY YEAR(record_date), MONTH(record_date)?
Андрей М
2
Если вы используете COUNT (1) с гарантированным COUNT (*), это будет еще быстрее, и данные результатов будут такими же.
Pa0l0
2
Что это *100на версии № 2? Заранее спасибо.
Авион
1
*100доYEAR(record_date)*100 + MONTH(record_date) == DATE_FORMAT(record_date, '%Y%m')
Phu Duy
17

Если вы хотите сгруппировать по дате в MySQL, используйте код ниже:

 SELECT COUNT(id)
 FROM stats
 GROUP BY DAYOFMONTH(record_date)

Надеюсь, что это сэкономит время для тех, кто собирается найти эту ветку.

Haijerome
источник
6
Важно отметить, что вам также нужно сгруппировать по MONTH(record_date)нескольким месяцам.
Веб-сеть
14

Если вы хотите отфильтровать записи за определенный год (например, 2000), оптимизируйте это WHEREпредложение следующим образом:

SELECT MONTH(date_column), COUNT(*)
FROM date_table
WHERE date_column >= '2000-01-01' AND date_column < '2001-01-01'
GROUP BY MONTH(date_column)
-- average 0.016 sec.

Вместо:

WHERE YEAR(date_column) = 2000
-- average 0.132 sec.

Результаты были сгенерированы для таблицы, содержащей 300 тыс. Строк и индекс по столбцу даты.

Что касается GROUP BYпункта, я проверил три варианта с вышеупомянутой таблицей; Вот результаты:

SELECT YEAR(date_column), MONTH(date_column), COUNT(*)
FROM date_table
GROUP BY YEAR(date_column), MONTH(date_column)
-- codelogic
-- average 0.250 sec.

SELECT YEAR(date_column), MONTH(date_column), COUNT(*)
FROM date_table
GROUP BY DATE_FORMAT(date_column, '%Y%m')
-- Andriy M
-- average 0.468 sec.

SELECT YEAR(date_column), MONTH(date_column), COUNT(*)
FROM date_table
GROUP BY EXTRACT(YEAR_MONTH FROM date_column)
-- fu-chi
-- average 0.203 sec.

Последний является победителем.

Салман А
источник
10

Полное и простое решение с аналогичным исполнением, но более короткой и более гибкой альтернативой, действующей в настоящее время:

SELECT COUNT(*) FROM stats
-- GROUP BY YEAR(record_date), MONTH(record_date), DAYOFMONTH(record_date)
GROUP BY DATE_FORMAT(record_date, '%Y-%m-%d')
Сис Тиммерман
источник
7

Если вы хотите получать ежемесячную статистику с количеством строк в месяц каждого года, упорядоченного по последнему месяцу, попробуйте следующее:

SELECT count(id),
      YEAR(record_date),
      MONTH(record_date) 
FROM `table` 
GROUP BY YEAR(record_date),
        MONTH(record_date) 
ORDER BY YEAR(record_date) DESC,
        MONTH(record_date) DESC
user3019799
источник
7

Вы можете сделать это просто функцией Mysql DATE_FORMAT () в GROUP BY. Возможно, вы захотите добавить дополнительный столбец для большей ясности в некоторых случаях, например, когда записи охватывают несколько лет, а один и тот же месяц встречается в разные годы. Здесь так много вариантов, которые можно настроить. Пожалуйста, прочитайте это перед началом. Надеюсь, это будет очень полезно для вас. Вот пример запроса для вашего понимания

SELECT
    COUNT(id),
    DATE_FORMAT(record_date, '%Y-%m-%d') AS DAY,
    DATE_FORMAT(record_date, '%Y-%m') AS MONTH,
    DATE_FORMAT(record_date, '%Y') AS YEAR

FROM
    stats
WHERE
    YEAR = 2009
GROUP BY
    DATE_FORMAT(record_date, '%Y-%m-%d ');
Фейсал
источник
4

Следующий запрос работал для меня в Oracle Database 12c Release 12.1.0.1.0

SELECT COUNT(*)
FROM stats
GROUP BY 
extract(MONTH FROM TIMESTAMP),
extract(MONTH FROM TIMESTAMP),
extract(YEAR  FROM TIMESTAMP);
Minisha
источник
2

Я предпочитаю оптимизировать выбор группы на один год следующим образом:

SELECT COUNT(*)
  FROM stats
 WHERE record_date >= :year 
   AND record_date <  :year + INTERVAL 1 YEAR;

Таким образом, вы можете просто связать год один раз, например '2009', с помощью именованного параметра, и вам не нужно беспокоиться о добавлении '-01-01'или передаче по '2010'отдельности.

Кроме того , как предположительно мы только подсчет строк и idникогда NULL, я предпочитаю , COUNT(*)чтобы COUNT(id).

Arth
источник
0

.... group by to_char(date, 'YYYY') -> 1989

.... group by to_char(date,'MM') -> 05

.... group by to_char(date,'DD') ---> 23

.... group by to_char(date,'MON') ---> МАЙ

.... group by to_char(date,'YY') ---> 89

аромита сен
источник
Это было бы очень очень медленно.
Earl3s