Во многих языках есть встроенные способы избавления от дубликатов, «дедупликации» или «унификации» списка или строки. Менее распространенная задача - «удалить дубликаты» строки. То есть для каждого появившегося символа сохраняются первые два вхождения.
Вот пример, где символы, которые должны быть удалены, помечены ^
:
aaabcbccdbabdcd
^ ^ ^^^ ^^
aabcbcdd
Ваша задача - реализовать именно эту операцию.
правила
Ввод - единственная, возможно, пустая строка. Вы можете предположить, что он содержит только строчные буквы в диапазоне ASCII.
Выходные данные должны быть единственной строкой со всеми удаленными символами, которые уже встречались в строке, по крайней мере, дважды (таким образом, самые левые два вхождения сохраняются).
Вместо строк вы можете работать со списками символов (или одиночными строками), но формат должен быть согласованным между вводом и выводом.
Вы можете написать программу или функцию и использовать любой из наших стандартных методов получения ввода и предоставления вывода.
Вы можете использовать любой язык программирования , но учтите, что эти лазейки по умолчанию запрещены.
Это код-гольф , поэтому самый короткий действительный ответ - измеренный в байтах - выигрывает.
Тестовые случаи
Каждая пара строк представляет собой один контрольный пример, за которым следует ввод, а затем вывод.
xxxxx
xx
abcabc
abcabc
abcdabcaba
abcdabc
abacbadcba
abacbdc
aaabcbccdbabdcd
aabcbcdd
Leaderboard
Фрагмент стека в нижней части этого поста создает таблицу лидеров из ответов а) в виде списка кратчайшего решения для каждого языка и б) в качестве общей таблицы лидеров.
Чтобы убедиться, что ваш ответ обнаружен, начните его с заголовка, используя следующий шаблон уценки:
## Language Name, N bytes
где N
размер вашего представления. Если вы улучшите свой счет, вы можете сохранить старые результаты в заголовке, вычеркнув их. Например:
## Ruby, <s>104</s> <s>101</s> 96 bytes
Если вы хотите включить в заголовок несколько чисел (например, потому что ваш результат равен сумме двух файлов или вы хотите перечислить штрафы за флаг интерпретатора отдельно), убедитесь, что фактический результат является последним числом в заголовке:
## Perl, 43 + 3 (-p flag) = 45 bytes
Вы также можете сделать имя языка ссылкой, которая будет отображаться во фрагменте кода:
## [><>](http://esolangs.org/wiki/Fish), 121 bytes
<style>body { text-align: left !important} #answer-list { padding: 10px; width: 290px; float: left; } #language-list { padding: 10px; width: 290px; float: left; } table thead { font-weight: bold; } table td { padding: 5px; }</style><script src="https://ajax.googleapis.com/ajax/libs/jquery/2.1.1/jquery.min.js"></script> <link rel="stylesheet" type="text/css" href="//cdn.sstatic.net/codegolf/all.css?v=83c949450c8b"> <div id="language-list"> <h2>Shortest Solution by Language</h2> <table class="language-list"> <thead> <tr><td>Language</td><td>User</td><td>Score</td></tr> </thead> <tbody id="languages"> </tbody> </table> </div> <div id="answer-list"> <h2>Leaderboard</h2> <table class="answer-list"> <thead> <tr><td></td><td>Author</td><td>Language</td><td>Size</td></tr> </thead> <tbody id="answers"> </tbody> </table> </div> <table style="display: none"> <tbody id="answer-template"> <tr><td>{{PLACE}}</td><td>{{NAME}}</td><td>{{LANGUAGE}}</td><td>{{SIZE}}</td><td><a href="{{LINK}}">Link</a></td></tr> </tbody> </table> <table style="display: none"> <tbody id="language-template"> <tr><td>{{LANGUAGE}}</td><td>{{NAME}}</td><td>{{SIZE}}</td><td><a href="{{LINK}}">Link</a></td></tr> </tbody> </table><script>var QUESTION_ID = 86503; var ANSWER_FILTER = "!t)IWYnsLAZle2tQ3KqrVveCRJfxcRLe"; var COMMENT_FILTER = "!)Q2B_A2kjfAiU78X(md6BoYk"; var OVERRIDE_USER = 8478; var answers = [], answers_hash, answer_ids, answer_page = 1, more_answers = true, comment_page; function answersUrl(index) { return "https://api.stackexchange.com/2.2/questions/" + QUESTION_ID + "/answers?page=" + index + "&pagesize=100&order=desc&sort=creation&site=codegolf&filter=" + ANSWER_FILTER; } function commentUrl(index, answers) { return "https://api.stackexchange.com/2.2/answers/" + answers.join(';') + "/comments?page=" + index + "&pagesize=100&order=desc&sort=creation&site=codegolf&filter=" + COMMENT_FILTER; } function getAnswers() { jQuery.ajax({ url: answersUrl(answer_page++), method: "get", dataType: "jsonp", crossDomain: true, success: function (data) { answers.push.apply(answers, data.items); answers_hash = []; answer_ids = []; data.items.forEach(function(a) { a.comments = []; var id = +a.share_link.match(/\d+/); answer_ids.push(id); answers_hash[id] = a; }); if (!data.has_more) more_answers = false; comment_page = 1; getComments(); } }); } function getComments() { jQuery.ajax({ url: commentUrl(comment_page++, answer_ids), method: "get", dataType: "jsonp", crossDomain: true, success: function (data) { data.items.forEach(function(c) { if (c.owner.user_id === OVERRIDE_USER) answers_hash[c.post_id].comments.push(c); }); if (data.has_more) getComments(); else if (more_answers) getAnswers(); else process(); } }); } getAnswers(); var SCORE_REG = /<h\d>\s*([^\n,<]*(?:<(?:[^\n>]*>[^\n<]*<\/[^\n>]*>)[^\n,<]*)*),.*?(\d+)(?=[^\n\d<>]*(?:<(?:s>[^\n<>]*<\/s>|[^\n<>]+>)[^\n\d<>]*)*<\/h\d>)/; var OVERRIDE_REG = /^Override\s*header:\s*/i; function getAuthorName(a) { return a.owner.display_name; } function process() { var valid = []; answers.forEach(function(a) { var body = a.body; a.comments.forEach(function(c) { if(OVERRIDE_REG.test(c.body)) body = '<h1>' + c.body.replace(OVERRIDE_REG, '') + '</h1>'; }); var match = body.match(SCORE_REG); if (match) valid.push({ user: getAuthorName(a), size: +match[2], language: match[1], link: a.share_link, }); else console.log(body); }); valid.sort(function (a, b) { var aB = a.size, bB = b.size; return aB - bB }); var languages = {}; var place = 1; var lastSize = null; var lastPlace = 1; valid.forEach(function (a) { if (a.size != lastSize) lastPlace = place; lastSize = a.size; ++place; var answer = jQuery("#answer-template").html(); answer = answer.replace("{{PLACE}}", lastPlace + ".") .replace("{{NAME}}", a.user) .replace("{{LANGUAGE}}", a.language) .replace("{{SIZE}}", a.size) .replace("{{LINK}}", a.link); answer = jQuery(answer); jQuery("#answers").append(answer); var lang = a.language; lang = jQuery('<a>'+lang+'</a>').text(); languages[lang] = languages[lang] || {lang: a.language, lang_raw: lang.toLowerCase(), user: a.user, size: a.size, link: a.link}; }); var langs = []; for (var lang in languages) if (languages.hasOwnProperty(lang)) langs.push(languages[lang]); langs.sort(function (a, b) { if (a.lang_raw > b.lang_raw) return 1; if (a.lang_raw < b.lang_raw) return -1; return 0; }); for (var i = 0; i < langs.length; ++i) { var language = jQuery("#language-template").html(); var lang = langs[i]; language = language.replace("{{LANGUAGE}}", lang.lang) .replace("{{NAME}}", lang.user) .replace("{{SIZE}}", lang.size) .replace("{{LINK}}", lang.link); language = jQuery(language); jQuery("#languages").append(language); } }</script>
Ответы:
Желе , 6 байт
Попробуйте онлайн! или проверьте все контрольные примеры .
Как это работает
источник
JavaScript (ES6), 42
48Редактировать Колоссальные 6 байтов сохранены thx @Neil
Объяснение: Я использую свойства 'a' ... 'z' объекта
k
для хранения информации для каждого символа (в данном случае объект k является регулярным выражением просто для сохранения байтов). Эти свойства изначальноundefined
. В javascript добавление числа кundefined
даетNaN
(вполне разумно), но добавление строки «Х» дает"undefinedX"
- строка длиной 10 (глупо). Добавляя больше символов, вы получаете более длинные строки. Если полученная строка для данного символа длиннее 11, этот символ не копируется в выходные данные.Тест
источник
v=>v.filter(x=>!(v[x]+=x)[11])
, Слава о "неопределенном" взломать.Python 2, 48 байт
c[r.count(c)/2:]
является альтернативой такой же длиныc*(r.count(c)<2)
.49 байтов:
источник
Сетчатка , 17 байт
Попробуйте онлайн!
Простое регулярное выражение замены - сопоставьте символ, если он уже появился дважды, и удалите его.
источник
{2}
обоими по 18 байтов.:P
. Благодарность!Брахилог , 25 байт
Попробуйте онлайн! или проверьте все контрольные примеры .
объяснение
Это работает, потому
s - Subset
что сначала объединится с большими подмножествами, например, потому"aaa"
что попытается"aa"
раньше"a"
.Основной предикат:
Предикат 1: убедитесь, что все символы появляются не более двух раз. Вход =
[String:Char]
Предикат 2: Получить случайность персонажа. Вход =
[String:Char]
источник
> <> , 22 байта
Попробуйте онлайн! Использует кодовое поле для отслеживания количества пока.
источник
J,
2015 байтЭто определяет монадическую функцию, которая принимает и возвращает строку. Попробуй это здесь . Использование:
объяснение
Я переключился на тот же алгоритм, который используют некоторые другие решения, так как он оказался короче ...
источник
Haskell,
4039 байтПример использования:
foldl(\s c->s++[c|filter(==c)s<=[c]])"" "aaabcbccdbabdcd"
->"aabcbcdd"
.Сохраните следующий символ,
c
если строка всехc
s до сих пор лексикографически меньше или равна единственной строке[c]
.Редактировать: @xnor сохранил байт, перейдя от понимания списка к
filter
. Благодарность!источник
filter(==c)s<=[c]
чтобы сохранить байт.Perl, 22 байта
21 байт код + 1 для
-p
.использование
источник
C 57 байт
Вызов
f()
со строкой, чтобы detriplicate. Функция изменяет свой параметр. Требуется C99 из-заfor
объявления -loop.источник
s
в первом утвержденииfor
?JavaScript (ES6), 35 байт
Принимает массив символов в качестве входных данных и возвращает детрицированный массив.
источник
c=>(s[c]=-~s[c])<3
чтобы сохранить несколько байтов.map
. Гольф это выглядело по сути как ваше. Основным отличием было назначение, которое, если вы переключите его, сэкономит несколько байтов. Попробуйтеs.filter(c=>(s[c]=s[c]+1|0)<3)
33 байта. EDIT: Упс, пропустил комментарий выше меня, что даже лучше :)PowerShell v2 +, 31 байт
Использует то же регулярное выражение, что и в ответе Коби на Retina , только что заключенное в
-replace
оператор PowerShell . Работает, потому что оба используют регулярное выражение .NET-flavor в фоновом режиме.Альтернативно, без регулярных выражений, 56 байтов
Создает вспомогательный массив,
$b
предварительно заполненный0
s. Приводит входную строку$args[0]
какchar
-array, направляет ее через цикл|%{...}
. Каждая итерация выводит текущий символ$_
в виде строки,"$_"
умноженной на логическое значение, которое только$TRUE
(неявно приведено1
здесь), если соответствующая точка в массиве помощников меньше2
(т. Е. Мы еще не видели этот символ дважды). Результирующий набор строк инкапсулируется в скобках и редактируется-join
вместе, образуя единую выходную строку. Это осталось на конвейере и вывод неявный.источник
$b=@{};-join($args|% t*y|?{++$b.$_-lt3})
.Mathematica, 39 байт
Анонимная функция. Принимает список символов в качестве входных данных и возвращает список с удаленным дублированием в качестве выходных данных. Использует метод сворачивания по списку и отклонения трехкратных элементов, это не слишком сложно.
источник
05AB1E, 12 байтов
объяснение
Попробуйте онлайн
источник
MATL , 8 байт
Попробуйте онлайн!
объяснение
пример
Предполагая ввод
'aaababbc'
, стек содержит следующее после указанных операторов:t
t&=
t&=R
t&=Rs
t&=Rs3<
t&=Rs3<)
источник
Сетчатка , 14 байт
Проверьте все контрольные примеры. (
%
Включает режим для каждой линии)Использует новый этап «Дедупликация», чтобы сэкономить пару байтов при подходе Коби . Дедупликация собирает список всех совпадений с регулярным выражением и заменяет все, кроме первого, пустой строкой. Регулярное выражение соответствует символу, который уже появляется в строке один раз, что означает, что первые два будут сохранены.
источник
Пайк, 16 байт
Попробуй это здесь!
источник
К, 18 байт
K4 доступен для бесплатного скачивания ; К6 находится в разработке . Если вы скачали KDB, вы можете войти в K с обратной косой чертой .
Может быть легче увидеть это разбитым на части, но сначала немного синтаксиса:
g:x
устанавливаетg
вx
.{x+1}
это функция, которая принимает аргумент х . В K первый аргумент функцииx
(второй,y
а третийz
. Четвертый не нужен).В настоящее время:
=x
означает группу х , которая производит:2#'
означает два взятых (от) каждого, который производитКак видите, это смещения первых двух совпадений каждого символа. 2 может быть обобщен.
,/
означает присоединиться к каждому и часто называется никак . Это даст нам только значения нашего словаря. Таким образом,,/"abcd"!(0 1;3 5;4 6;8 12)
производит:который нам нужно отсортировать.
{x@<x}@
это идиома, которую часто видят программисты K (Q называет это asc ), где написано « х» в классе х . Разбивая его на части:вернул индексы отсортированного массива, который мы хотим взять из исходного массива.
x@y
означает x на y, так что это индексирует массив с индексами сортировки (если это имеет смысл).который мы просто сейчас индексируем в наш исходный массив. Мы могли бы сказать
x@
здесь, но K поддерживает действительно мощную концепцию, которой мы можем воспользоваться здесь: функция приложения индексирует. Это означает, что этоa[0]
может быть поиск нулевого слотаa
или применение0
функции к вызываемой функцииa
. Причина, по которой нам понадобилось@
ранее,{x@<x}
состоит в том, чтоx<y
означает xs меньше, чем ys : операторы в K имеют двоичную форму (с двумя аргументами) и монадическую форму (с одним аргументом), которая приходит из APL. У Q нет этой «амбивалентности».источник
g"aaabcbccdbabdcd"
g"..."
она добилась цели. К сожалению, ваш код возвращаетсяaabbcc
для вводаabc
.{x{?x@<x}@,/2#'=x}"abc"
определенно возвращается"abc"
. Он вернулся"aabbcc"
бы, если бы вы пропустили?
отличное.Python 2, 51 байт
Проверьте это на Ideone .
источник
Java 8 лямбда, 90 символов
Безголовая версия:
Создает массив для всех символов ascii. Если персонаж встречается, соответствующий счетчик будет увеличен. Если оно больше 2, символ не будет добавлен в строку результата. Очень легко, очень коротко;)
источник
Perl 6, 27 байт
Объяснение:
(Примечание: Perl 6 не так "ориентирован на гольф", как его сестра Perl 5 ... Так что да, это место перед
<
необходимостью. Это%.{}
анонимный хеш).источник
SmileBASIC,
77726968 байтРазъяснение:
источник
Common Lisp, 127
Довольно отпечатанных
источник
Q , 52 байта
источник
К , 27 байт
источник
Руби ,
796257 байтЭто довольно громоздко, но я не уверен, что могу играть в гольф намного лучше в данный момент. Любые предложения по игре в гольф приветствуются. Попробуйте онлайн!
Редактировать: -17 байт благодаря Value Ink, предлагая более удачный способ удаления повторяющихся символов. -5 байт от удаления
.uniq
метода.Ungolfed:
источник
->s{s.chars.uniq.map{|a|s[s.rindex a]=""while s.count(a)>2};s}
JavaScript, 30 байт
Используя метод, который @ edc65 предложил для подсчета, но с фильтром массива. При первом появлении символа значение объекта получает «неопределенный» плюс символ (то есть «неопределенный»). В следующий раз значение объекта станет «undefinedxx».
После этого v [x] [11] возвращает значение true, а в сочетании с оператором not значение false, означающее, что символы, которые уже появились дважды, будет отфильтровано.
источник
Javascript (с использованием внешней библиотеки) (80 байт)
Это был хороший! Не выиграл, но было весело
Ссылка на lib: https://github.com/mvegh1/Enumerable/
Объяснение кода: метод принимает строку, библиотека анализирует ее как массив символов, а предложение Where представляет собой сложный фильтрующий предикат, который проверяет хэш-карту 'a' на наличие текущего символа. Если существует, счетчик приращения, иначе установлен в 1. Если <2, предикат (и текущий символ) проходит, иначе ошибка
источник
return
но сделать ваши функции , разделенных запятыми список из выражений в скобках:n=>(a={},_From(n)....)
. Последнее выражение является возвращаемым значением. В вашейWhere
функции, вы можете устранить промежуточныйb
полностью путем сравнения с результатом задания или прироста:x=>(a[x]?a[x]++:a[x]=1)<2
.filter
сjoin
:[...n].filter(...).join("")
. Отразить истинную / ложную логику при переходеWhere
наfilter
.Clojure, 72 байта
Так много байтов ...
источник
Паскаль (FPC) , 103 байта
Попробуйте онлайн!
Объяснение:
источник