Имитация функции MySQL group_concat в Microsoft SQL Server 2005?

347

Я пытаюсь перенести приложение на основе MySQL на Microsoft SQL Server 2005 (не по выбору, но это жизнь).

В исходном приложении мы почти полностью использовали операторы, совместимые с ANSI-SQL, за одним существенным исключением - мы group_concatдовольно часто использовали функции MySQL .

group_concatКстати, так: приведена таблица, скажем, имен сотрудников и проектов ...

SELECT empName, projID FROM project_members;

возвращает:

ANDY   |  A100
ANDY   |  B391
ANDY   |  X010
TOM    |  A100
TOM    |  A510

... и вот что вы получите с group_concat:

SELECT 
    empName, group_concat(projID SEPARATOR ' / ') 
FROM 
    project_members 
GROUP BY 
    empName;

возвращает:

ANDY   |  A100 / B391 / X010
TOM    |  A100 / A510

Итак, что я хотел бы знать: возможно ли написать, скажем, пользовательскую функцию в SQL Server, которая эмулирует функциональность group_concat?

У меня почти нет опыта использования UDF, хранимых процедур или чего-то в этом роде, просто простой SQL, поэтому, пожалуйста, ошибитесь в стороне от слишком большого количества объяснений :)

даН.м.
источник
Это старый вопрос, но мне нравится решение CLR, данное здесь .
Диего
Возможный дубликат Как создать разделенный запятыми список с помощью SQL-запроса? - этот пост более широкий, поэтому я бы выбрал его как канонический
TMS
возможный дубликат функции SQL group_concat в SQL Server
Trikaldarshi
Как вы узнаете, в каком порядке должен быть построен список, например, вы показываете A100 / B391 / X010, но, учитывая, что в реляционной базе данных нет неявного упорядочения, это может быть просто X010 / A100 / B391 или любая другая комбинация.
Стив Форд

Ответы:

174

Нет НАСТОЯЩЕГО простого способа сделать это. Хотя там много идей.

Лучший, который я нашел :

SELECT table_name, LEFT(column_names , LEN(column_names )-1) AS column_names
FROM information_schema.columns AS extern
CROSS APPLY
(
    SELECT column_name + ','
    FROM information_schema.columns AS intern
    WHERE extern.table_name = intern.table_name
    FOR XML PATH('')
) pre_trimmed (column_names)
GROUP BY table_name, column_names;

Или версия, которая работает правильно, если данные могут содержать такие символы, как <

WITH extern
     AS (SELECT DISTINCT table_name
         FROM   INFORMATION_SCHEMA.COLUMNS)
SELECT table_name,
       LEFT(y.column_names, LEN(y.column_names) - 1) AS column_names
FROM   extern
       CROSS APPLY (SELECT column_name + ','
                    FROM   INFORMATION_SCHEMA.COLUMNS AS intern
                    WHERE  extern.table_name = intern.table_name
                    FOR XML PATH(''), TYPE) x (column_names)
       CROSS APPLY (SELECT x.column_names.value('.', 'NVARCHAR(MAX)')) y(column_names) 
BradC
источник
1
Этот пример сработал для меня, но я попытался выполнить другую агрегацию, но она не сработала, но вызвала ошибку: «имя корреляции pre_trimmed указано несколько раз в предложении FROM».
PhilChuang
7
pre_trimmed это просто псевдоним для подзапроса. Псевдонимы необходимы для подзапросов и должны быть уникальными, поэтому для другого подзапроса измените его на нечто уникальное ...
Koen
2
Можете ли вы показать пример без table_name в качестве имени столбца, это сбивает с толку.
S.Mason
169

Возможно, я немного опоздал на вечеринку, но этот метод работает для меня и проще, чем метод COALESCE.

SELECT STUFF(
             (SELECT ',' + Column_Name 
              FROM Table_Name
              FOR XML PATH (''))
             , 1, 1, '')
Скотт
источник
1
Это только показывает, как объединять значения - group_concat объединяет их по группам, что является более сложной задачей (и того, что, по-видимому, требует OP). См. Принятый ответ на SO 15154644, чтобы узнать, как это сделать - предложение WHERE является критически важным дополнением
DJDave
@DJDave имел в виду этот ответ . Смотрите также принятый ответ на аналогичный вопрос .
Джон Каммингс
51

Возможно, слишком поздно, чтобы принести пользу сейчас, но разве это не самый простой способ сделать что-то?

SELECT     empName, projIDs = replace
                          ((SELECT Surname AS [data()]
                              FROM project_members
                              WHERE  empName = a.empName
                              ORDER BY empName FOR xml path('')), ' ', REQUIRED SEPERATOR)
FROM         project_members a
WHERE     empName IS NOT NULL
GROUP BY empName
Дж Хардиман
источник
Интересный. Я уже закончил проект под рукой, но я попробую этот метод. Спасибо!
ДанМ
7
Хороший трюк - единственная проблема для фамилий с пробелами, это заменит пробел с разделителем.
Марк Эллиот
Я сам столкнулся с такой проблемой, Марк. К сожалению, пока MSSQL не справится со временем и не представит GROUP_CONCAT, это наименьший из трудоемких методов, которые мне удалось придумать для того, что здесь необходимо.
J Hardiman
Спасибо за это! Вот SQL Fiddle, показывающий, как он работает: sqlfiddle.com/#!6/c5d56/3
сбежал
42

SQL Server 2017 действительно вводит новую функцию агрегирования

STRING_AGG ( expression, separator),

Объединяет значения строковых выражений и помещает значения разделителя между ними. Разделитель не добавляется в конце строки.

Связанные элементы можно заказать, добавив WITHIN GROUP (ORDER BY some_expression)

Для версий 2005-2016 я обычно использую метод XML в принятом ответе.

Это может потерпеть неудачу в некоторых обстоятельствах, однако. например, если данные для объединения содержат, CHAR(29)вы видите

FOR XML не удалось сериализовать данные ... потому что он содержит символ (0x001D), который не разрешен в XML.

Более надежный метод, который может работать со всеми символами, - использовать агрегат CLR. Однако применение упорядочения к объединенным элементам является более сложным при таком подходе.

Метод присвоения переменной не гарантируется и его следует избегать в производственном коде.

Мартин Смит
источник
Это также теперь доступно в Azure SQL: azure.microsoft.com/en-us/roadmap/…
Simon_Weaver
34

Взгляните на проект GROUP_CONCAT на Github, я думаю, что я делаю именно то, что вы ищете:

Этот проект содержит набор пользовательских агрегатных функций SQLCLR (UDA SQLCLR), которые в совокупности предоставляют функциональность, аналогичную функции MySQL GROUP_CONCAT. Есть несколько функций для обеспечения наилучшей производительности в зависимости от требуемой функциональности ...

MaxiWheat
источник
2
@MaxiWheat: многие парни не читают вопрос или ответ внимательно перед тем, как нажать кнопку вниз. Это влияет на сообщение владельца непосредственно из-за их ошибки.
Стив Лэм
Прекрасно работает. Единственная особенность , мне не хватает , является возможность сортировать на колонке , который MySQL GROUP_CONCAT () может понравиться:GROUP_CONCAT(klascode,'(',name,')' ORDER BY klascode ASC SEPARATOR ', ')
Jan
10

Чтобы объединить все имена руководителей проектов из проектов, в которых есть несколько менеджеров проектов, напишите:

SELECT a.project_id,a.project_name,Stuff((SELECT N'/ ' + first_name + ', '+last_name FROM projects_v 
where a.project_id=project_id
 FOR
 XML PATH(''),TYPE).value('text()[1]','nvarchar(max)'),1,2,N''
) mgr_names
from projects_v a
group by a.project_id,a.project_name
Cmaly
источник
9

С помощью приведенного ниже кода вы должны установить PermissionLevel = External в свойствах вашего проекта перед развертыванием и изменить базу данных на доверие к внешнему коду (обязательно прочитайте в другом месте о рисках безопасности и альтернативах [например, сертификатах]), запустив "ALTER DATABASE database_name SET НАДЕЖНО НА ".

using System;
using System.Collections.Generic;
using System.Data.SqlTypes;
using System.IO;
using System.Runtime.Serialization;
using System.Runtime.Serialization.Formatters.Binary;
using Microsoft.SqlServer.Server;

[Serializable]
[SqlUserDefinedAggregate(Format.UserDefined,
MaxByteSize=8000,
IsInvariantToDuplicates=true,
IsInvariantToNulls=true,
IsInvariantToOrder=true,
IsNullIfEmpty=true)]
    public struct CommaDelimit : IBinarySerialize
{


[Serializable]
 private class StringList : List<string>
 { }

 private StringList List;

 public void Init()
 {
  this.List = new StringList();
 }

 public void Accumulate(SqlString value)
 {
  if (!value.IsNull)
   this.Add(value.Value);
 }

 private void Add(string value)
 {
  if (!this.List.Contains(value))
   this.List.Add(value);
 }

 public void Merge(CommaDelimit group)
 {
  foreach (string s in group.List)
  {
   this.Add(s);
  }
 }

 void IBinarySerialize.Read(BinaryReader reader)
 {
    IFormatter formatter = new BinaryFormatter();
    this.List = (StringList)formatter.Deserialize(reader.BaseStream);
 }

 public SqlString Terminate()
 {
  if (this.List.Count == 0)
   return SqlString.Null;

  const string Separator = ", ";

  this.List.Sort();

  return new SqlString(String.Join(Separator, this.List.ToArray()));
 }

 void IBinarySerialize.Write(BinaryWriter writer)
 {
  IFormatter formatter = new BinaryFormatter();
  formatter.Serialize(writer.BaseStream, this.List);
 }
    }

Я проверил это с помощью запроса, который выглядит следующим образом:

SELECT 
 dbo.CommaDelimit(X.value) [delimited] 
FROM 
 (
  SELECT 'D' [value] 
  UNION ALL SELECT 'B' [value] 
  UNION ALL SELECT 'B' [value] -- intentional duplicate
  UNION ALL SELECT 'A' [value] 
  UNION ALL SELECT 'C' [value] 
 ) X 

И дает: A, B, C, D

GregTSmith
источник
9

Пробовал это, но для моих целей в MS SQL Server 2005 было наиболее полезным следующее, которое я нашел на xaprb

declare @result varchar(8000);

set @result = '';

select @result = @result + name + ' '

from master.dbo.systypes;

select rtrim(@result);

@ Отметьте, как вы упомянули, это был космический персонаж, который вызвал проблемы для меня.

isoughtajam
источник
Я думаю, что движок на самом деле не гарантирует какой-либо порядок с этим методом, потому что переменные вычисляются как потоки данных в зависимости от плана exec. Похоже, что до сих пор работает большую часть времени.
phil_w
6

Об ответе Хардимана, как насчет:

SELECT empName, projIDs=
  REPLACE(
    REPLACE(
      (SELECT REPLACE(projID, ' ', '-somebody-puts-microsoft-out-of-his-misery-please-') AS [data()] FROM project_members WHERE empName=a.empName FOR XML PATH('')), 
      ' ', 
      ' / '), 
    '-somebody-puts-microsoft-out-of-his-misery-please-',
    ' ') 
  FROM project_members a WHERE empName IS NOT NULL GROUP BY empName

Кстати, является ли использование «Фамилии» опечаткой или я не понимаю концепцию здесь?

В любом случае, спасибо большое, ребята, потому что это спасло меня довольно много времени :)

user422190
источник
1
Скорее, недружелюбный ответ, если вы спросите меня, и не поможет в качестве ответа.
Тим Меерс
1
только увидев это сейчас ... Я не имел в виду это в виду, в то время я был очень разочарован в SQL Server (до сих пор). ответы из этого поста действительно были полезны; РЕДАКТИРОВАТЬ: почему это не было полезно, кстати? это
помогло
1

Для моих коллег по Google вот очень простое решение «включай и работай», которое сработало для меня после того, как я некоторое время боролся с более сложными решениями:

SELECT
distinct empName,
NewColumnName=STUFF((SELECT ','+ CONVERT(VARCHAR(10), projID ) 
                     FROM returns 
                     WHERE empName=t.empName FOR XML PATH('')) , 1 , 1 , '' )
FROM 
returns t

Обратите внимание, что мне пришлось преобразовать идентификатор в VARCHAR, чтобы объединить его в виде строки. Если вам не нужно этого делать, вот еще более простая версия:

SELECT
distinct empName,
NewColumnName=STUFF((SELECT ','+ projID
                     FROM returns 
                     WHERE empName=t.empName FOR XML PATH('')) , 1 , 1 , '' )
FROM 
returns t

Вся заслуга в этом идет здесь: https://social.msdn.microsoft.com/Forums/sqlserver/en-US/9508abc2-46e7-4186-b57f-7f368374e084/replicating-groupconcat-function-of-mysql-in- SQL-сервер? форум = transactsql

Крок
источник