Вопросы с тегом «duplicates»

190
Как найти повторяющиеся записи в PostgreSQL

У меня есть таблица базы данных PostgreSQL под названием «user_links», которая в настоящее время допускает следующие повторяющиеся поля: year, user_id, sid, cid Уникальное ограничение в настоящее время является первым поле под названием «идентификатор», однако сейчас я ищу , чтобы добавить...

162
python pandas: удаляйте дубликаты по столбцам A, сохраняя строку с наибольшим значением в столбце B

У меня есть фрейм данных с повторяющимися значениями в столбце A. Я хочу удалить дубликаты, сохранив строку с самым высоким значением в столбце B. Итак, это: A B 1 10 1 20 2 30 2 40 3 10 Должен превратиться в это: A B 1 20 2 40 3 10 Уэс добавил несколько приятных функций для удаления дубликатов:...

162
В MySQL я могу скопировать одну строку, чтобы вставить в ту же таблицу?

insert into table select * from table where primarykey=1 Я просто хочу скопировать одну строку для вставки в ту же таблицу (т.е. я хочу дублировать существующую строку в таблице), но я хочу сделать это без необходимости перечислять все столбцы после «select», потому что эта таблица имеет слишком...

160
Удалить все повторяющиеся строки в Python Pandas

pandas drop_duplicatesФункция отлично подходит для «uniquifying» в dataframe. Тем не менее, одним из ключевых аргументов для передачи является take_last=Trueили take_last=False, хотя я хотел бы отбросить все строки, которые являются дубликатами, в подмножестве столбцов. Это возможно? A B C 0 foo 0...

159
Как объединить 2 List <T> и удалить из него дублирующиеся значения в C #

У меня есть два списка Список, который мне нужно объединить в третьем списке и удалить повторяющиеся значения из этих списков Немного сложно объяснить, поэтому позвольте мне показать пример того, как выглядит код и что я хочу получить в результате, в примере я использую тип int, а не класс...

152
Удалить дублирующиеся строки

Я прочитал CSV файл в R data.frame. Некоторые строки имеют одинаковый элемент в одном из столбцов. Я хотел бы удалить строки, которые являются дубликатами в этом столбце. Например: platform_external_dbus 202 16 google 1 platform_external_dbus 202 16 space-ghost.verbum 1 platform_external_dbus 202...

151
Удаление повторяющихся строк из таблицы в Oracle

Я тестирую что-то в Oracle и заполнил таблицу некоторыми примерами данных, но в процессе я случайно загрузил дублирующиеся записи, поэтому теперь я не могу создать первичный ключ, используя некоторые столбцы. Как я могу удалить все повторяющиеся строки и оставить только одну из...

137
Заменяет ли добавление повторяющегося значения в HashSet / HashMap предыдущее значение

Пожалуйста, рассмотрите следующий фрагмент кода: HashSet hs = new HashSet(); hs.add("hi"); -- (1) hs.add("hi"); -- (2) hs.size()даст 1, поскольку HashSetне допускает дублирования, поэтому будет сохранен только один элемент. Я хочу знать, если мы добавим дублирующий элемент, то он заменит предыдущий...

129
Как получить список всех повторяющихся элементов с помощью панд в Python?

У меня есть список товаров, у которых, вероятно, есть проблемы с экспортом. Я хотел бы получить список повторяющихся элементов, чтобы я мог их вручную сравнить. Когда я пытаюсь использовать дублированный метод pandas , он возвращает только первый дубликат. Есть ли способ получить все дубликаты, а...

124
Удаление повторяющихся строк в vi?

У меня есть текстовый файл, содержащий длинный список записей (по одной в каждой строке). Некоторые из них являются дубликатами, и я хотел бы знать, можно ли (и если да, то как) удалить любые дубликаты. Мне интересно сделать это из vi / vim, если это...

116
Команда или сценарий Linux, подсчитывающий повторяющиеся строки в текстовом файле?

Если у меня есть текстовый файл со следующим содержанием red apple green apple green apple orange orange orange Есть ли команда или сценарий Linux, которые я могу использовать для получения следующего результата? 1 red apple 2 green apple 3 orange...

116
Реализация карты с повторяющимися ключами

Я хочу иметь карту с повторяющимися ключами. Я знаю, что существует множество реализаций карт (Eclipse показывает мне около 50), поэтому держу пари, что должна быть такая, которая позволяет это. Я знаю, что легко написать собственную карту, которая сделает это, но я бы предпочел использовать...

114
Регулярное выражение для повторяющихся слов

Я новичок в регулярных выражениях и не могу понять, как написать одно регулярное выражение, которое "соответствовало бы" любым повторяющимся последовательным словам, например: Париж на в весенний период . Не то чтобы это связано. Над чем ты смеешься? Являются ли мои мои регулярные выражения плохо...

113
Удалить повторяющиеся записи в PostgreSQL

У меня есть таблица в базе данных PostgreSQL 8.3.8, которая не имеет ключей / ограничений и имеет несколько строк с точно такими же значениями. Я хочу удалить все дубликаты и оставить только по одной копии каждой строки. В частности, есть один столбец (с именем «ключ»), который может использоваться...

111
Поиск ВСЕХ повторяющихся строк, включая «элементы с меньшими индексами»

R duplicatedвозвращает вектор, показывающий, является ли каждый элемент вектора или кадра данных дубликатом элемента с меньшим нижним индексом. Поэтому, если строки 3, 4 и 5 5-строчного фрейма данных совпадают, duplicatedя получу вектор FALSE, FALSE, FALSE, TRUE, TRUE Но в этом случае я...

107
Как найти дубликаты в 2 столбцах, а не в 1

У меня есть таблица базы данных MySQL с двумя интересующими меня столбцами. По отдельности каждый из них может иметь дубликаты, но никогда не должно быть дубликата ОБЕИХ, имеющих одинаковое значение. stone_idмогут быть дубликаты при условии, что каждое upshargeназвание отличается, и наоборот. Но...

104
Java: обнаруживать дубликаты в ArrayList?

Как я могу определить (вернуть истину / ложь), содержит ли ArrayList более одного и того же элемента в Java? Большое спасибо, Терри Изменить Забыл упомянуть, что я не хочу сравнивать «блоки» друг с другом, а сравнивать их целые числа. У каждого «блока» есть int, и это их отличает. Я нахожу int...