Создать сбалансированный BST из отсортированного списка целых чисел

15

Используя уникальный отсортированный список целых чисел, создайте сбалансированное дерево двоичного поиска, представленное в виде массива, без использования рекурсии.

Например:

func( [1,2,3,5,8,13,21] ) => [5,2,13,1,3,8,21]

Прежде чем мы начнем, подсказка: мы можем упростить эту проблему до тонны, так что нам на самом деле не нужно думать о входных целых числах (или любом подобном объекте в этом отношении!)

Если мы знаем, что входной список уже отсортирован, его содержимое не имеет значения. Мы можем просто думать об этом с точки зрения индексов в исходном массиве.

Внутреннее представление входного массива становится:

func( [0,1,2,3,4,5,6] ) => [3,1,5,0,2,4,6]

Это означает, что вместо того, чтобы писать что-то, имеющее дело с сопоставимыми объектами, нам действительно нужно написать только функцию, которая отображается из диапазона [0, n) в результирующий массив. Получив новый порядок, мы можем просто применить отображение обратно к значениям во входных данных, чтобы создать возвращаемый массив.

Действительные решения должны:

  • Примите массив с нулевым элементом и верните пустой массив.
  • Примите целочисленный массив длины n и верните целочисленный массив
    • Длина между n и следующей наибольшей степенью 2 минус 1. (например, для входного размера 13 верните где-нибудь между 13 и 15).
    • Массив, представляющий BST, где корневой узел находится в позиции 0, а высота равна log (n), где 0 представляет отсутствующий узел (или null-подобное значение, если позволяет ваш язык). Пустые узлы, если они есть, должны существовать только в конце дерева (например, [2,1,0])

Входной целочисленный массив имеет следующие гарантии:

  • Значения - это 32-разрядные целые числа со знаком, больше нуля.
  • Ценности уникальны.
  • Значения в порядке возрастания от нулевой позиции.
  • Значения могут быть разреженными (то есть не смежными друг с другом).

Побеждает самый лаконичный код по количеству символов ascii, но мне также интересно увидеть элегантные решения для любого конкретного языка.

Контрольные примеры

Выходы для простых массивов , содержащих , 1чтобы nдля различных n. Как описано выше, завершающие 0s являются необязательными.

[]
[1]
[2,1,0]
[2,1,3]
[3,2,4,1,0,0,0]
[4,2,5,1,3,0,0]
[4,2,6,1,3,5,0]
[4,2,6,1,3,5,7]
[5,3,7,2,4,6,8,1,0,0,0,0,0,0,0]
[6,4,8,2,5,7,9,1,3,0,0,0,0,0,0]
[7,4,9,2,6,8,10,1,3,5,0,0,0,0,0]
[8,4,10,2,6,9,11,1,3,5,7,0,0,0,0]
[8,4,11,2,6,10,12,1,3,5,7,9,0,0,0]
[8,4,12,2,6,10,13,1,3,5,7,9,11,0,0]
[8,4,12,2,6,10,14,1,3,5,7,9,11,13,0]
[8,4,12,2,6,10,14,1,3,5,7,9,11,13,15]
Джейк Уортон
источник
Все вопросы на этом сайте, будь то программная головоломка или игра в гольф, должны иметь объективный первичный критерий выигрыша, чтобы можно было безоговорочно решить, какая заявка должна выиграть.
Говард
@ Говард Спасибо. Обновлено с определенными критериями для победителя.
Джейк Уортон
1
Было бы очень полезно иметь несколько тестовых случаев, которые охватывают сложные случаи, а не (как в настоящее время) просто самый простой.
Питер Тейлор
Есть ли какая-то причина для исключения рекурсии? Не то чтобы я смотрел на рекурсивное решение, но это кажется искусственным и ненужным.
dmckee --- котенок экс-модератора
1
Может кто-нибудь объяснить, как список представляет BST?
Justinpc

Ответы:

4

Руби , 143

s=ARGV.size;r,q=[],[[0,s]];s.times{b,e=q.shift;k=Math::log2(e-b).to_i-1;m=(e-b+2)>(3<<k)?b+(2<<k)-1:e-(1<<k);r<<ARGV[m];q<<[b,m]<<[m+1,e]};p r

Это (слабо) сжатая версия следующего кода, которая в основном выполняет BFS для дерева.

def l(n)
    k = Math::log2(n).to_i-1
    if n+2 > (3<<k) then
        (2<<k)-1
    else
        n-(1<<k) 
    end
end

def bfs(tab)
  result = []
  queue = [[0,tab.size]]
  until queue.empty? do
    b,e = queue.shift
    m = b+l(e-b)
    result << tab[m]
    queue << [b,m] if b < m
    queue << [m+1,e] if m+1 < e
  end
  result
end

p bfs(ARGV)

Кроме того, поскольку это BFS, а не DFS, требование нерекурсивного решения не является значительным и ставит некоторые языки в невыгодное положение.

Изменить: Исправленное решение, спасибо @PeterTaylor за его комментарий!

dtldarek
источник
@PeterTaylor Намерением было поставить 3 слева от 4, но пробелов нет, так что это неправильно. Спасибо что подметил это!
dtldarek
@PeterTaylor Исправлено за обедом, теперь должно работать.
dtldarek
4

Ява , 252

Хорошо, вот моя попытка. Я играл с битовыми операциями и придумал прямой способ вычисления индекса элемента в BST по индексу в исходном массиве.

Сжатая версия

public int[]b(int[]a){int i,n=1,t;long x,I,s=a.length,p=s;int[]r=new int[(int)s];while((p>>=1)>0)n++;p=2*s-(1l<<n)+1;for(i=0;i<s;i++){x=(i<p)?(i+1):(p+2*(i-p)+1);t=1;while((x&1<<(t-1))==0)t++;I=(1<<(n-t));I|=((I-1)<<t&x)>>t;r[(int)I-1]=a[i];}return r;}

Длинная версия следует ниже.

public static int[] makeBst(int[] array) {
  long size = array.length;
  int[] bst = new int[array.length];

  int nbits = 0;
  for (int i=0; i<32; i++) 
    if ((size & 1<<i)!=0) nbits=i+1;

  long padding = 2*size - (1l<<nbits) + 1;

  for (int i=0; i<size; i++) {
    long index2n = (i<padding)?(i+1):(padding + 2*(i-padding) + 1);

    int tail=1;
    while ((index2n & 1<<(tail-1))==0) tail++;
    long bstIndex = (1<<(nbits-tail));
    bstIndex = bstIndex | ((bstIndex-1)<<tail & index2n)>>tail;

    bst[(int)(bstIndex-1)] = array[i];
  }
 return bst;
}
михайл шейх
источник
Вам нужно количество персонажей, а в настоящее время это не игра в гольф.
dmckee --- котенок экс-модератора
@dmckee Я редактировал пост включать сжатую версию и количество символов
Микаил шейх
Хорошее шоу. Держу пари, что некоторые из этих мест не нужны. В с, int[] b(int[] a)так же хорошо выражен, как int[]b(int[]a).
dmckee --- котенок экс-модератора
У вас a.lengthв массиве выделение. Измените это на s. Избавьтесь от пространства между for (несколькими разами. Каждый цикл for создает также int i=0и int t=0. Создайте с помощью n( int n=0,i,t;), а затем просто i=0в циклах и t=1внутри. Объявите внутреннее long xи long Iс sи просто инициализируйте в цикле ( long s=a.length,I,x;и x=../ I=..). Вы не должны пространства вокруг двойных и &.
Джейк Уортон
Также I=I|..можно написатьI|=..
Джейк Уортон
3
def fn(input):
    import math
    n = len(input)
    if n == 0:
        return []
    h = int(math.floor(math.log(n, 2)))
    out = []
    last = (2**h) - 2**(h+1) + n

    def num_children(level, sibling, lr):
        if level == 0:
            return 0
        half = 2**(level-1)
        ll_base = sibling * 2**level + lr * (half)
        ll_children = max(0, min(last, ll_base + half - 1) - ll_base + 1)
        return 2**(level-1) - 1 + ll_children

    for level in range(h, -1, -1):
        for sibling in range(0, 2**(h-level)):
            if level == 0 and sibling > last:
                break
            if sibling == 0:
                last_sibling_val = num_children(level, sibling, 0)
            else:
                last_sibling_val += 2 + num_children(level, sibling - 1, 1) \
                    + num_children(level, sibling, 0)
            out.append(input[last_sibling_val])
    return out
aarkay
источник
2

Не совсем уверен, что это точно соответствует вашему требованию, чтобы пустые узлы были в конце дерева, и он, конечно, не выиграет никаких призов за краткость, но я думаю, что это правильно и имеет тестовые примеры :)

public class BstArray {
    public static final int[] EMPTY = new int[] { };
    public static final int[] L1 = new int[] { 1 };
    public static final int[] L2 = new int[] { 1, 2 };
    public static final int[] L3 = new int[] { 1, 2, 3 };
    public static final int[] L4 = new int[] { 1, 2, 3, 5 };
    public static final int[] L5 = new int[] { 1, 2, 3, 5, 8 };
    public static final int[] L6 = new int[] { 1, 2, 3, 5, 8, 13 };
    public static final int[] L7 = new int[] { 1, 2, 3, 5, 8, 13, 21 };
    public static final int[] L8 = new int[] { 1, 2, 3, 5, 8, 13, 21, 35 };
    public static final int[] L9 = new int[] { 1, 2, 3, 5, 8, 13, 21, 35, 56 };
    public static final int[] L10 = new int[] { 1, 2, 3, 5, 8, 13, 21, 35, 56, 91 };

    public static void main(String[] args) {
        for (int[] list : Arrays.asList(EMPTY, L1, L2, L3, L4, L5, L6, L7, L8, L9, L10)) {
            System.out.println(Arrays.toString(list) + " => " + Arrays.toString(bstListFromList(list)));
        }
    }

    private static int[] bstListFromList(int[] orig) {
        int[] bst = new int[nextHighestPowerOfTwo(orig.length + 1) - 1];

        if (orig.length == 0) {
            return bst;
        }

        LinkedList<int[]> queue = new LinkedList<int[]>();
        queue.push(orig);

        int counter = 0;
        while (!queue.isEmpty()) {
            int[] list = queue.pop();
            int len = list.length;

            if (len == 1) {
                bst[counter] = list[0];
            } else if (len == 2) {
                bst[counter] = list[1];
                queue.add(getSubArray(list, 0, 1));
                queue.add(new int[] { 0 });
            } else if (len == 3) {
                bst[counter] = list[1];
                queue.add(getSubArray(list, 0, 1));
                queue.add(getSubArray(list, 2, 1));
            } else {
                int divide = len / 2;
                bst[counter] = list[divide];
                queue.add(getSubArray(list, 0, divide));
                queue.add(getSubArray(list, divide + 1, len - (divide + 1)));
            }
            counter++;
        }

        return bst;
    }

    private static int nextHighestPowerOfTwo(int n) {
        n--;
        n |= n >> 1;
        n |= n >> 2;
        n |= n >> 4;
        n |= n >> 8;
        n |= n >> 16;
        n++;

        return n;
    }

    private static int[] getSubArray(int[] orig, int origStart, int length) {
        int[] list = new int[length];
        System.arraycopy(orig, origStart, list, 0, length);
        return list;
    }
}
Эндрю Флинн
источник
2

Golfscript ( 99 89)

~]:b[]:^;{b}{{:|.,.2base,(2\?:&[-)&2/]{}$0=&(2/+:o[=]^\+:^;|o<.!{;}*|o)>.!{;}*}%:b}while^p

В основном прямой порт моего решения на Python, работает почти так же.

Вероятно, можно немного улучшить с помощью большего количества «гольфизмов», уже улучшенных на 10 символов с помощью @ petertaylor :)

Иоахим Исакссон
источник
Я думаю, что это должно быть возможно не более чем через 70, хотя я все еще не закончил свой ответ на GolfScript. Есть несколько простых улучшений для вашего. !{;}{}ifможет быть просто !{;}*потому, что !гарантирует возврат 0или 1. Вы можете использовать не алфавитные токены для переменных, поэтому, если вы используете ^вместо r, |вместо x, &вместо, yвы можете устранить все эти пробелы.
Питер Тейлор
@PeterTaylor Спасибо, я не знал о не буквенно-цифровых переменных, все еще очень плохо знакомых с Golfscript :)
Йоахим Исакссон
2

Ява 192

Сопоставляет индекс на входе с индексом на выходе

int[]b(int[]o){int s=o.length,p=0,u=s,i=0,y,r[]=new int[s],c[]=new int[s];while((u>>=1)>0)p++;for(int x:o){y=p;u=i;while(u%2>0){y--;u/=2;}r[(1<<y)-1+c[y]++]=x;i+=i>2*s-(1<<p+1)?2:1;}return r;}

Длинная версия:

static int[] bfs(int[] o) {
  int rowCount = 32 - Integer.numberOfLeadingZeros(o.length); // log2
  int slotCount = (1<<rowCount) - 1; // pow(2,rowCount) - 1

  // number of empty slots at the end
  int emptySlots = slotCount - o.length;
  // where we start to be affected by these empty slots
  int startSkippingAbove = slotCount - 2 * emptySlots; // = 2 * o.length - slotCount

  int[] result = new int[o.length];
  int[] rowCounters = new int[rowCount]; // for each row, how many slots in that row are taken
  int i = 0; // index of where we would be if this was a complete tree (no trailing empty slots)
  for (int x : o) {
    // the row (depth) a slot is in is determined by the number of trailing 1s
    int rowIndex = rowCount - Integer.numberOfTrailingZeros(~i) - 1;
    int colIndex = rowCounters[rowIndex]++; // count where we are
    int rowStartIndex = (1 << rowIndex) - 1; // where this row starts in the result array

    result[rowStartIndex + colIndex] = x;

    i++;
    // next one has to jump into a slot that came available by not having slotCount values
    if (i > startSkippingAbove) i++;
  }

  return result;
}
Wouter Coekaerts
источник
2

Wolfram Mathematica 11, 175 байт

g[l_]:=(x[a_]:=Floor@Min[i-#/2,#]&@(i=Length[a]+1;2^Ceiling@Log2[i]/2);Join@@Table[Cases[l//.{{}->{},b__List:>(n[Take[b,#-1],b[[#]],Drop[b,#]]&@x[b])},_Integer,{m}],{m,x[l]}])

Функция g[l]принимает в качестве входных данных a List(например l={1,2,3,4,...}) и возвращает a Listжелаемой формы. Это работает следующим образом:

  • x[a_]:=Floor@Min[i-#/2,#]&@(i=Length[a]+1;2^Ceiling@Log2[i]/2) берет список и находит корень связанного BST.
    • i=Length[a]+1 сокращение длины списка
    • 2^Ceiling@Log2[i]/2 верхняя граница значения корня
    • Min[i-#/2,#]&@(...)Минимум из двух аргументов, где #обозначает то, что находится внутри(...)
  • l//.{...} Примените повторно правила замены, которые следуют l
  • {}->{} Ничего не делать (это крайний случай, чтобы избежать бесконечного цикла)
  • b__List:>(n[Take[b,#-1],b[[#]],Drop[b,#]]&@x[b])Разделить Listна{{lesser}, root, {greater}}
  • Cases[...,_Integer,{m}] Возьмите все целые числа на уровне (глубине) m
  • Table[...,{m,1,x[l]}]Для всех mдо x[l](что более чем необходимо на самом деле).

Это можно проверить, запустив

Table[g[Range[a]], {a, 0, 15}]//MatrixForm

Эта реализация не включает конечные нули.

MannyC
источник
1

Питон ( 175 171)

Довольно сжатый, все еще довольно читаемый;

def f(a):
 b=[a]
 while b:
  c,t=((s,2**(len(bin(len(s)))-3))for s in b if s),[]
  for x,y in c:
   o=min(len(x)-y+1,y/2)+(y-1)/2
   yield x[o]
   t+=[x[:o],x[o+1:]]
  b=t

Он возвращает результат обратно, так что вы можете либо зациклить его, либо (для целей отображения) напечатать его в виде списка;

>>> for i in range(1,17): print i-1,list(f(range(1,i)))
 0 []
 1 [1]
 2 [2, 1]
 3 [2, 1, 3]
 4 [3, 2, 4, 1]
 5 [4, 2, 5, 1, 3]
 6 [4, 2, 6, 1, 3, 5]
 7 [4, 2, 6, 1, 3, 5, 7]
 8 [5, 3, 7, 2, 4, 6, 8, 1]
 9 [6, 4, 8, 2, 5, 7, 9, 1, 3]
10 [7, 4, 9, 2, 6, 8, 10, 1, 3, 5]
11 [8, 4, 10, 2, 6, 9, 11, 1, 3, 5, 7]
12 [8, 4, 11, 2, 6, 10, 12, 1, 3, 5, 7, 9]
13 [8, 4, 12, 2, 6, 10, 13, 1, 3, 5, 7, 9, 11]
14 [8, 4, 12, 2, 6, 10, 14, 1, 3, 5, 7, 9, 11, 13]
15 [8, 4, 12, 2, 6, 10, 14, 1, 3, 5, 7, 9, 11, 13, 15]
Иоахим Исакссон
источник
@dtldarek Его комментарий, кажется, удален, но теперь он, похоже, прошел тестовые случаи.
Иоахим Исакссон
Я удалил свой комментарий, чтобы люди не воздерживались от ответа upvoting @ dtldarek из-за комментария о том, что он содержит ошибки.
Питер Тейлор
@PeterTaylor Хорошо, спасибо за ваше внимание ;-)
dtldarek
1

Джава

Это прямое решение для расчета. Я думаю, что это работает, но у него есть один прагматически безобидный побочный эффект. Массив, который он создает, может быть поврежден, но никак не повлияет на поиск. Вместо создания 0 (нулевых) узлов, он будет создавать недоступные узлы, то есть узлы уже были найдены ранее в дереве во время поиска. Он работает путем сопоставления массива индексов массива двоичного дерева поиска 2-й степени с массивом двоичного дерева поиска неправильного размера. По крайней мере, я думаю, что это работает.

import java.util.Arrays;

public class SortedArrayToBalanceBinarySearchTreeArray
{
    public static void main(String... args)
    {
        System.out.println(Arrays.toString(binarySearchTree(19)));
    }

    public static int[] binarySearchTree(int m)
    {
        int n = powerOf2Ceiling(m + 1);
        int[] array = new int[n - 1];

        for (int k = 1, index = 1; k < n; k *= 2)
        {
            for (int i = 0; i < k; ++i)
            {
                array[index - 1] = (int) (.5 + ((float) (m)) / (n - 1)
                        * (n / (2 * k) * (1 + 2 * index) - n));
                ++index;
            }
        }

        return array;
    }

    public static int powerOf2Ceiling(int n)
    {
        n--;
        n |= n >> 1;
        n |= n >> 2;
        n |= n >> 4;
        n |= n >> 8;
        n |= n >> 16;
        n++;

        return n;
    }

}

Вот более сжатая версия (только функция и имена в паре). У него все еще есть белое пространство, но я не беспокоюсь о победе. Также эта версия на самом деле принимает массив. Другой просто взял int для самого высокого индекса в массиве.

public static int[] b(int m[])
{
    int n = m.length;
    n |= n >> 1;
    n |= n >> 2;
    n |= n >> 4;
    n |= n >> 8;
    n |= n >> 16;
    n++;

    int[] a = new int[n - 1];

    for (int k = 1, j = 1, i; k < n; k *= 2)
    {
        for (i = 0; i < k; ++i)
        {
            a[j - 1] = m[(int) (.5 + ((float) m.length) / (n - 1)
                    * (n / (2 * k) * (1 + 2 * j) - n)) - 1];
            ++j;
        }
    }

    return a;
}
metaphyze
источник
Так как это код-гольф , сократите ваши методы / имена / и т.д. до как можно более коротких; удалите все пробелы (и ненужные методы / материалы) и вставьте количество символов. В противном случае у тебя все отлично.
Джастин
@ Джейк Уортон. Я бы очень хотел увидеть ваше решение для прямого картирования. Я не уверен на 100%, что мой работает для очень больших массивов, потому что он основан на непрерывном математическом отображении, значения которого округляются. Это, кажется, работает, но я не уверен, как это доказать.
метафиз
1

GolfScript ( 79 77 70 символов)

Так как пример в вопросе использует функцию, я сделал это функцией. Удаление, {}:f;чтобы оставить выражение, которое принимает ввод в стек и оставляет BST в стеке, спасло бы 5 символов.

{[.;][{{.!!{[.,.)[1]*{(\(@++}@(*1=/()\@~]}*}%.{0=}%\{1>~}%.}do][]*}:f;

Демонстрация в Интернете (примечание: приложению может потребоваться некоторое время для разогрева: оно истекло у меня дважды перед запуском в 3 секунды).

С пробелами, чтобы показать структуру:

{
    # Input is an array: wrap it in an array for the working set
    [.;]
    [{
        # Stack: emitted-values working-set
        # where the working-set is essentially an array of subtrees
        # For each subtree in working-set...
        {
            # ...if it's not the empty array...
            .!!{
                # ...gather into an array...
                [
                    # Get the size of the subtree
                    .,
                    # OEIS A006165, offset by 1
                    .)[1]*{(\(@++}@(*1=
                    # Split into [left-subtree-plus-root right-subtree]
                    /
                    # Rearrange to root left-subtree right-subtree
                    # where left-subtree might be [] and right-subtree might not exist at all
                    ()\@~
                ]
            }*
        }%
        # Extract the leading element of each processed subtree: these will join the emitted-values
        .{0=}%
        # Create a new working-set of the 1, or 2 subtrees of each processed subtree
        \{1>~}%
        # Loop while the working-set is non-empty
        .
    }do]
    # Stack: [[emitted values at level 0][emitted values at level 1]...]
    # Flatten by joining with the empty array
    []*
}:f;
Питер Тейлор
источник
1

J , 52 байта

t=:/:(#/:@{.(+:,>:@+:@i.@>:@#)^:(<.@(2&^.)@>:@#`1:))

функция принимает отсортированный список и возвращает в двоичном порядке дерева

обратите внимание, что деревья имеют одинаковую форму, но нижний уровень укорочен

  • `1: начать с 1
  • <.@(2&^.)@>:@# итерация по этажу log2 (длина + 1)
  • +: , >:@+:@i.@>:@# цикл: добавляет дубль последнего вектора с нечетными числами 1,3 .. 2 * длина + 1
  • # /:@{. взять только необходимое количество предметов и получить их индексы сортировки
  • /: применить эти индексы сортировки к данному входу

TIO

jayprich
источник