Подражая множествам в JavaScript?

220

Я работаю в JavaScript. Я хотел бы сохранить список уникальных неупорядоченных строковых значений со следующими свойствами:

  1. быстрый способ спросить «А в списке»?
  2. быстрый способ сделать «удалить А из списка, если он существует в списке»
  3. быстрый способ сделать «добавить А в список, если его еще нет».

Что я действительно хочу, так это набор. Какие-нибудь предложения для лучшего способа подражать множеству в JavaScript?

В этом вопросе рекомендуется использовать объект с ключами, хранящими свойства, и для всех значений установлено значение true: это разумный способ?

Ричард
источник
2
возможный дубликат реализации JavaScript с заданной структурой данных и stackoverflow.com/questions/4343746
Мэтт Болл
1
У ES6 есть родные наборы
Сальвадор Дали

Ответы:

262

Если вы программируете в среде с поддержкой ES6 (например, node.js, конкретный браузер с необходимыми вам возможностями ES6 или перенос кода ES6 для своей среды), то вы можете использовать Setобъект, встроенный в ES6 . Он обладает очень хорошими возможностями и может использоваться как есть в вашей среде.


Для многих простых вещей в среде ES5 использование объекта работает очень хорошо. Если objваш объект и Aявляется переменной, значение которой вы хотите оперировать в наборе, то вы можете сделать это:

Код инициализации:

// create empty object
var obj = {};

// or create an object with some items already in it
var obj = {"1":true, "2":true, "3":true, "9":true};

Вопрос 1: есть Aв списке:

if (A in obj) {
    // put code here
}

Вопрос 2: Удалить «А» из списка, если он там есть:

delete obj[A];

Вопрос 3: Добавьте «А» в список, если его там еще не было

obj[A] = true;

Для полноты, проверка на наличие Aв списке немного безопаснее с этим:

if (Object.prototype.hasOwnProperty.call(obj, A))
    // put code here
}

из-за потенциального конфликта между встроенными методами и / или свойствами базового объекта, такого как constructorсвойство.


Боковая панель на ES6: Текущая рабочая версия ECMAScript 6 или что-то, называемое ES 2015, имеет встроенный объект Set . Это реализовано сейчас в некоторых браузерах. Поскольку доступность браузера со временем меняется, вы можете просмотреть строку Setв этой таблице совместимости ES6, чтобы увидеть текущий статус доступности браузера.

Одно из преимуществ встроенного объекта Set заключается в том, что он не приводит все ключи к строке, как это делает объект, поэтому вы можете использовать как 5, так и «5» в качестве отдельных ключей. И вы даже можете использовать объекты непосредственно в наборе без преобразования строки. Вот статья, которая описывает некоторые возможности и документацию MDN для объекта Set.

Теперь я написал polyfill для объекта set ES6, чтобы вы могли начать использовать его сейчас, и он автоматически перейдет к встроенному объекту set, если браузер его поддерживает. Преимущество этого в том, что вы пишете ES6-совместимый код, который будет работать вплоть до IE7. Но есть некоторые недостатки. Интерфейс набора ES6 использует преимущества итераторов ES6, так что вы можете делать что-то вроде этого, for (item of mySet)и он будет автоматически выполнять итерацию набора для вас. Но этот тип языковой функции не может быть реализован через polyfill. Вы по-прежнему можете выполнять итерацию набора ES6 без использования новых языковых функций ES6, но, честно говоря, без новых языковых функций это не так удобно, как другой интерфейс набора, который я включаю ниже.

Вы можете решить, какой из них лучше для вас, посмотрев на оба. ESF set polyfill находится здесь: https://github.com/jfriend00/ES6-Set .

К вашему сведению, в моем собственном тестировании я заметил, что реализация Firefox v29 Set не полностью соответствует текущей версии спецификации. Например, вы не можете .add()связывать вызовы методов так, как описывает спецификация и поддерживает мой polyfill. Вероятно, это вопрос спецификации в движении, так как она еще не завершена.


Объекты предварительно созданного набора: если вы хотите, чтобы уже созданный объект имел методы для работы с набором, который можно использовать в любом браузере, вы можете использовать ряд различных предварительно созданных объектов, которые реализуют различные типы наборов. Существует мини-набор, представляющий собой небольшой код, который реализует основы заданного объекта. Он также имеет более функциональный набор объектов и несколько дериваций, включая Словарь (давайте сохраним / получим значение для каждого ключа) и ObjectSet (позволим вам сохранить набор объектов - либо объекты JS, либо объекты DOM, для которых вы либо предоставляете функция, которая генерирует уникальный ключ для каждого или ObjectSet будет генерировать ключ для вас).

Вот копия кода для miniSet (самый актуальный код здесь на github ).

"use strict";
//-------------------------------------------
// Simple implementation of a Set in javascript
//
// Supports any element type that can uniquely be identified
//    with its string conversion (e.g. toString() operator).
// This includes strings, numbers, dates, etc...
// It does not include objects or arrays though
//    one could implement a toString() operator
//    on an object that would uniquely identify
//    the object.
// 
// Uses a javascript object to hold the Set
//
// This is a subset of the Set object designed to be smaller and faster, but
// not as extensible.  This implementation should not be mixed with the Set object
// as in don't pass a miniSet to a Set constructor or vice versa.  Both can exist and be
// used separately in the same project, though if you want the features of the other
// sets, then you should probably just include them and not include miniSet as it's
// really designed for someone who just wants the smallest amount of code to get
// a Set interface.
//
// s.add(key)                      // adds a key to the Set (if it doesn't already exist)
// s.add(key1, key2, key3)         // adds multiple keys
// s.add([key1, key2, key3])       // adds multiple keys
// s.add(otherSet)                 // adds another Set to this Set
// s.add(arrayLikeObject)          // adds anything that a subclass returns true on _isPseudoArray()
// s.remove(key)                   // removes a key from the Set
// s.remove(["a", "b"]);           // removes all keys in the passed in array
// s.remove("a", "b", ["first", "second"]);   // removes all keys specified
// s.has(key)                      // returns true/false if key exists in the Set
// s.isEmpty()                     // returns true/false for whether Set is empty
// s.keys()                        // returns an array of keys in the Set
// s.clear()                       // clears all data from the Set
// s.each(fn)                      // iterate over all items in the Set (return this for method chaining)
//
// All methods return the object for use in chaining except when the point
// of the method is to return a specific value (such as .keys() or .isEmpty())
//-------------------------------------------


// polyfill for Array.isArray
if(!Array.isArray) {
    Array.isArray = function (vArg) {
        return Object.prototype.toString.call(vArg) === "[object Array]";
    };
}

function MiniSet(initialData) {
    // Usage:
    // new MiniSet()
    // new MiniSet(1,2,3,4,5)
    // new MiniSet(["1", "2", "3", "4", "5"])
    // new MiniSet(otherSet)
    // new MiniSet(otherSet1, otherSet2, ...)
    this.data = {};
    this.add.apply(this, arguments);
}

MiniSet.prototype = {
    // usage:
    // add(key)
    // add([key1, key2, key3])
    // add(otherSet)
    // add(key1, [key2, key3, key4], otherSet)
    // add supports the EXACT same arguments as the constructor
    add: function() {
        var key;
        for (var i = 0; i < arguments.length; i++) {
            key = arguments[i];
            if (Array.isArray(key)) {
                for (var j = 0; j < key.length; j++) {
                    this.data[key[j]] = key[j];
                }
            } else if (key instanceof MiniSet) {
                var self = this;
                key.each(function(val, key) {
                    self.data[key] = val;
                });
            } else {
                // just a key, so add it
                this.data[key] = key;
            }
        }
        return this;
    },
    // private: to remove a single item
    // does not have all the argument flexibility that remove does
    _removeItem: function(key) {
        delete this.data[key];
    },
    // usage:
    // remove(key)
    // remove(key1, key2, key3)
    // remove([key1, key2, key3])
    remove: function(key) {
        // can be one or more args
        // each arg can be a string key or an array of string keys
        var item;
        for (var j = 0; j < arguments.length; j++) {
            item = arguments[j];
            if (Array.isArray(item)) {
                // must be an array of keys
                for (var i = 0; i < item.length; i++) {
                    this._removeItem(item[i]);
                }
            } else {
                this._removeItem(item);
            }
        }
        return this;
    },
    // returns true/false on whether the key exists
    has: function(key) {
        return Object.prototype.hasOwnProperty.call(this.data, key);
    },
    // tells you if the Set is empty or not
    isEmpty: function() {
        for (var key in this.data) {
            if (this.has(key)) {
                return false;
            }
        }
        return true;
    },
    // returns an array of all keys in the Set
    // returns the original key (not the string converted form)
    keys: function() {
        var results = [];
        this.each(function(data) {
            results.push(data);
        });
        return results;
    },
    // clears the Set
    clear: function() {
        this.data = {}; 
        return this;
    },
    // iterate over all elements in the Set until callback returns false
    // myCallback(key) is the callback form
    // If the callback returns false, then the iteration is stopped
    // returns the Set to allow method chaining
    each: function(fn) {
        this.eachReturn(fn);
        return this;
    },
    // iterate all elements until callback returns false
    // myCallback(key) is the callback form
    // returns false if iteration was stopped
    // returns true if iteration completed
    eachReturn: function(fn) {
        for (var key in this.data) {
            if (this.has(key)) {
                if (fn.call(this, this.data[key], key) === false) {
                    return false;
                }
            }
        }
        return true;
    }
};

MiniSet.prototype.constructor = MiniSet;
jfriend00
источник
16
Это решает вопрос, но, чтобы быть ясным, эта реализация не будет работать для наборов вещей, кроме целых чисел или строк.
Mkirk
3
@mkirk - да, элемент, который вы индексируете в наборе, должен иметь строковое представление, которое может быть ключом индекса (например, это либо строка, либо метод toString (), который уникально описывает элемент).
jfriend00
4
Чтобы получить элементы в списке, вы можете использовать Object.keys(obj).
Blixt
3
@Blixt - Object.keys()требуется IE9, FF4, Safari 5, Opera 12 или выше. Там в polyfill для старых браузеров здесь .
jfriend00
1
Не используйте obj.hasOwnProperty(prop)для проверки членства. Используйте Object.prototype.hasOwnProperty.call(obj, prop)вместо этого, который работает, даже если «набор» содержит значение "hasOwnProperty".
Дэвид Чэмберс
72

Вы можете создать объект без свойств, таких как

var set = Object.create(null)

который может действовать как набор и исключает необходимость использования hasOwnProperty.


var set = Object.create(null); // create an object with no properties

if (A in set) { // 1. is A in the list
  // some code
}
delete set[a]; // 2. delete A from the list if it exists in the list 
set[A] = true; // 3. add A to the list if it is not already present
Торбен Круазе
источник
Хорошо, но не уверен, почему вы говорите, что «устраняет необходимость использовать hasOwnProperty»
blueFast
13
Если вы просто использовать set = {}его наследует все свойства от объекта (например toString), так что вы должны проверить для полезной нагрузки множества (свойства , которые вы добавили) с hasOwnPropertyвif (A in set)
Thorben Croise
6
Я не знал, что можно создать совершенно пустой объект. Спасибо, ваше решение очень элегантно.
BlueFast
1
Интересно, но недостатком этого является то, что вы должны иметь set[A]=trueоператоры для каждого элемента, который вы хотите добавить вместо одного инициализатора?
vogomatix
1
Не уверен, что вы имеете в виду, но если вы имеете в виду инициализацию набора уже существующим набором, вы можете сделать что-то вродеs = Object.create(null);s["thorben"] = true;ss = Object.create(s)
Thorben Croisé
23

Начиная с ECMAScript 6, структура данных Set является встроенной функцией . Совместимость с версиями node.js можно найти здесь .

hymloth
источник
4
Здравствуйте, просто для ясности - сейчас 2014, это все еще экспериментально в Chrome? Если это не так, не могли бы вы отредактировать свой ответ? Спасибо
Карел Билек
1
Да, это все еще экспериментально для Chrome. Я считаю, что к концу 2014 года, когда ECMAScript должен быть «официально» выпущен, он будет поддерживаться. Затем я обновлю свой ответ соответственно.
Гимлот
ОК, спасибо за ответ! (Ответы JavaScript довольно быстро устаревают.)
Карел Билек
1
@Val inне работает, потому что Setобъекты не имеют своих элементов в качестве свойств, что было бы плохо, потому что наборы могут иметь элементы любого типа, но свойства являются строками. Вы можете использовать has:Set([1,2]).has(1)
Oriol
1
Ответ Сальвадора Дали является более полным и актуальным.
Дан Даскалеску
14

В версии ES6 Javascript вы встроили тип для набора ( проверьте совместимость с вашим браузером ).

var numbers = new Set([1, 2, 4]); // Set {1, 2, 4}

Чтобы добавить элемент в набор, который вы просто используете .add(), он запускается O(1)и либо добавляет элемент в набор (если он не существует), либо ничего не делает, если он уже существует. Вы можете добавить туда элемент любого типа (массивы, строки, числа)

numbers.add(4); // Set {1, 2, 4}
numbers.add(6); // Set {1, 2, 4, 6}

Чтобы проверить количество элементов в наборе, вы можете просто использовать .size. Также работает вO(1)

numbers.size; // 4

Для удаления элемента из набора используйте .delete(). Возвращает true, если значение было (и было удалено), и false, если значение не существовало. Также работает в O(1).

numbers.delete(2); // true
numbers.delete(2); // false

Чтобы проверить, существует ли элемент в наборе, используйте .has(), который возвращает истину, если элемент находится в наборе, и ложь в противном случае. Также работает в O(1).

numbers.has(3); // false
numbers.has(1); // true

В дополнение к методам, которые вы хотели, есть несколько дополнительных:

  • numbers.clear(); просто удалить все элементы из набора
  • numbers.forEach(callback); перебирая значения набора в порядке вставки
  • numbers.entries(); создать итератор всех значений
  • numbers.keys(); возвращает ключи набора, который совпадает с numbers.values()

Существует также Weakset, который позволяет добавлять только значения типа объекта.

Сальвадор Дали
источник
Не могли бы вы указать ссылку на .add()прогоны в O (1)? Я заинтригован этим,
Грин,
10

Я начал реализацию наборов, которая в настоящее время довольно хорошо работает с числами и строками. Основное внимание было уделено разностной операции, поэтому я старался сделать ее максимально эффективной. Форкс и обзоры кода приветствуются!

https://github.com/mcrisc/SetJS

mcrisc
источник
вау этот класс чокнутый! Я бы полностью использовал это, если бы не писал JavaScript в функциях CouchDB map / lower!
portforwardpodcast
9

Я только что заметил, что в библиотеке d3.js есть реализация наборов, карт и других структур данных. Я не могу спорить об их эффективности, но, судя по тому, что это популярная библиотека, она должна быть именно тем, что вам нужно.

Документация здесь

Для удобства копирую по ссылке (первые 3 функции представляют интерес)


  • d3.set ([массив])

Создает новый набор. Если указан массив, добавляет данный массив строковых значений в возвращаемый набор.

  • set.has (значение)

Возвращает true тогда и только тогда, когда в этом наборе есть запись для указанной строки значения.

  • Set.add (значение)

Добавляет указанную строку значения в этот набор.

  • set.remove (значение)

Если набор содержит указанную строку значений, удаляет ее и возвращает true. В противном случае этот метод ничего не делает и возвращает false.

  • set.values ​​()

Возвращает массив значений строки в этом наборе. Порядок возвращаемых значений произвольный. Может использоваться как удобный способ вычисления уникальных значений для набора строк. Например:

d3.set (["foo", "bar", "foo", "baz"]). values ​​(); // "foo", "bar", "baz"

  • set.forEach (функция)

Вызывает указанную функцию для каждого значения в этом наборе, передавая значение в качестве аргумента. Этот контекст функции является этим набором. Возвращает неопределенное. Порядок итерации произвольный.

  • set.empty ()

Возвращает true тогда и только тогда, когда этот набор имеет нулевые значения.

  • set.size ()

Возвращает количество значений в этом наборе.

кон псих
источник
4

Да, это разумный способ - это все, чем является объект (ну, в данном случае) - набор ключей / значений с прямым доступом.

Вам нужно проверить, чтобы увидеть, находится ли он уже там, прежде чем добавить его, или если вам просто нужно указать присутствие, «добавление» его снова фактически ничего не меняет, оно просто устанавливает его на объекте снова.

Дэйв Ньютон
источник