Кратчайшие уникальные подстроки

29

вход

Буквенно-цифровая строка s.

Выход

Самая короткая строка, которая встречается ровно один раз как (непрерывная) подстрока в s. Перекрывающиеся события считаются различными. Если есть несколько кандидатов одинаковой длины, вы должны вывести их всех в порядке появления. В этом вызове пустая строка встречается n + 1раз в строке длины n.

пример

Рассмотрим строку

"asdfasdfd"

Пустая строка встречается в ней 10 раз, поэтому она не подходит для уникального вхождения. Каждая из букв "a", "s", "d"и "f"происходит , по крайней мере в два раза, так что они не являются кандидатами либо. Подстроки "fa"и "fd"встречаются только один раз и в этом порядке, тогда как все остальные подстроки длины 2 встречаются дважды. Таким образом, правильный вывод

["fa","fd"]

правила

И функции, и полные программы разрешены, а стандартные лазейки - нет. Точное форматирование вывода является гибким, в пределах разумного. В частности, создание вывода для пустой строки допустимо, но выдача ошибки - нет. Побеждает самое низкое число байтов.

Контрольные примеры

"" -> [""]
"abcaa" -> ["b","c"]
"rererere" -> ["ererer"]
"asdfasdfd" -> ["fa","fd"]
"ffffhhhhfffffhhhhhfffhhh" -> ["hffff","fffff","hhhhh","hfffh"]
"asdfdfasddfdfaddsasadsasadsddsddfdsasdf" -> ["fas","fad","add","fds"]

Leaderboard

Вот список лидеров по языкам, который я обещал.

Чтобы убедиться, что ваш ответ обнаружен, начните его с заголовка, используя следующий шаблон уценки:

# Language Name, N bytes

где Nразмер вашего представления. Если вы улучшите свой счет, вы можете сохранить старые результаты в заголовке, вычеркнув их. Например:

# Ruby, <s>104</s> <s>101</s> 96 bytes

<script src='https://ajax.googleapis.com/ajax/libs/jquery/2.1.1/jquery.min.js'></script><script>site = 'meta.codegolf',postID = 5314,isAnswer = true,QUESTION_ID = 45056;jQuery(function(){var u='https://api.stackexchange.com/2.2/';if(isAnswer)u+='answers/'+postID+'?order=asc&sort=creation&site='+site+'&filter=!GeEyUcJFJeRCD';else u+='questions/'+postID+'?order=asc&sort=creation&site='+site+'&filter=!GeEyUcJFJO6t)';jQuery.get(u,function(b){function d(s){return jQuery('<textarea>').html(s).text()};function r(l){return new RegExp('<pre class="snippet-code-'+l+'\\b[^>]*><code>([\\s\\S]*?)<\\/code><\/pre>')};b=b.items[0].body;var j=r('js').exec(b),c=r('css').exec(b),h=r('html').exec(b);if(c!==null)jQuery('head').append(jQuery('<style>').text(d(c[1])));if (h!==null)jQuery('body').append(d(h[1]));if(j!==null)jQuery('body').append(jQuery('<script>').text(d(j[1])))})})</script>

Zgarb
источник
Есть ли ограничения на комбинаторные встроенные функции?
Мартин Эндер
3
@ MartinBüttner В этом соревновании все идет. Если будет получено достаточно ответов, я добавлю список лидеров по языкам, так что даже более плохо оснащенные языки могут иметь значимую конкуренцию.
Згарб
Хотите использовать мой код в фрагменте таблицы лидеров гольфа ? Тогда вам не нужно будет отслеживать все изменения, чтобы обновлять таблицу лидеров. Если вы это сделаете, я могу добавить его для вас, и я бы пройти ответы, чтобы они соответствовали формату заголовка.
Мартин Эндер
@ MartinBüttner Спасибо, я ценю это!
Згарб
Все сделано! Дайте мне знать, если что-то не работает. (Не стесняйтесь повторно использовать его для ваших испытаний в будущем.)
Мартин Эндер

Ответы:

3

Pyth, 27 26 байтов

&zhfTmf!/>zhxzYYm<>zkdUzUz

Попробуй это здесь.

Обратите внимание, что из-за ошибки в онлайн-компиляторе регистр пустой строки корректно работает только в версии командной строки, которую можно найти здесь.

Вы также можете исправить ошибку, указав новую строку в качестве ввода для онлайн-компилятора.

Объяснение:

                                   z = input(), implicit.
&z                                 Prints empty string if input is empty.
  hfT                              Take the first non-empty list from
     m                  Uz         A list of list of substrings of z, divided by length
                m<>zkdUz           with some shorter strings repeated later, to no effect.
      f                            Where the substrings are filtered on
       !/      Y                   There being 0 occurrences of the substring in
         >z                        The slice of z
           hxzY                    from the character after the first character
                                   of the first occurrence of the substring in z
                                   to the end of z.
isaacg
источник
Сбой при вводе пустой строки.
Оптимизатор
@ Оптимизатор Я думаю, что это ошибка в онлайн-компиляторе, на самом деле. Работает на версии командной строки. На самом деле, zни один ввод не дает сбоя в сети, так что это определенно ошибка в интерпретаторе.
Исаак
Не дает EOF?
Оптимизатор
@Optimizer Pyth ожидает ввода с конца строки, который может быть неправильным.
Исаак
Так что передача пустой строки даже невозможна?
Оптимизатор
13

Python 3, 124 123 111 96 байт

f=lambda s,n=1:[x for x in[s[i:i+n]for i in range(len(s)+1)]if s.find(x)==s.rfind(x)]or f(s,n+1)

Ищет такие строки, что первое вхождение слева совпадает с первым вхождением справа. Значение +1in rangeпредназначено для случая пустой строки.

Теперь, если бы только Python имел .count()подсчет совпадений , то это было бы немного короче.

Sp3000
источник
6

Mathematica, 95 94 79 байтов

Cases[Tally@StringCases[#,___,Overlaps->All],{s_,1}:>s]~MinimalBy~StringLength&

StringCasesполучает все возможные подстроки, Tallyи Casesотфильтровывает те, которые появляются более одного раза, и MinimalByнаходит самые короткие.

Мартин Эндер
источник
Разве &в конце кода нет ничего лишнего ?
Дэвид Дж. Аист
Мальчик, ты быстр!
Дэвид Дж. Аист
4

GolfScript, 44 байта

:S;-1:x{;S,x):x-),{S>x<}%:^1/{^\/,2=},.!}do`

Принимает ввод как строку в stdin и выводит в синтаксисе двойного массива: например [["b"] ["c"]]. Онлайн демо

рассечение

:S;          # Store input in S and pop it
-1:x         # Store -1 in x
{            # do-while loop
  ;          #   Pop x the first time and [] every subsequent time
  S,x):x-),  #   Increment x and build an array [0 1 ... len(S)-x]
  {S>x<}%    #   Map that array to [substr(S,0,x) substr(S,1,x) ...]
  :^         #   Store in ^ (to avoid the token coalescing with the next char)
  1/         #   Split by length 1 to iterate over 1-elt arrays rather than strings
  {^\/,2=},  #   Filter to arrays which occur exactly once as a subarray of ^
  .!         #   Duplicate and test emptiness
}do          # end do-while loop: loop if the filtered array is empty
`            # Stringify for output

Это устроено так, что для пустой строки не требуется особый случай (который я включил в качестве контрольного примера в онлайн-демонстрацию, указанную выше).

Питер Тейлор
источник
3

CJam, 52 43 40 байт

]]q:Q,,{)Q,1$-),f{Q><}:R{R\a/,2=},}%{}=p

Ввод строки без кавычек

Пояснение :

]]                                       "For empty string input case";
  q:Q                                    "Read the input and store in Q";
     ,,                                  "Take length of input and 0 to length array";
       {                          }%     "Map the above array on this code block";
        )Q                               "Increment the number in the current iteration, L";
         Q,1$                            "Take input's length and copy the above number";
             -)                          "Get upper limit of next loop to get substrings";
               ,f{   }                   "Get 0 to above number array and for each";
                  Q><                    "Get the L length substring at Ith index where";
                                         "I loops from 0 to Q, - L + 1";
                      :R                 "Store this list of substring of length L in R";
                        {R\a/,2=},       "Filter to get unique substrings";
                                    {}=  "Get the first non empty substring array";
                                         "This leaves nothing on stack if all are empty";
                                       p "Print the top stack element. At this point, its";
                                         "Either the first non empty substring array or";
                                         "the ]] i.e. [""] which we added initially";

Пример:

asdfdfasddfdfaddsasadsasadsddsddfdsasdf

Выход

["fas" "fad" "add" "fds"]

Попробуйте онлайн здесь

оптимизатор
источник
3

Скала, 120 байт

readLine.inits.flatMap(_.tails).toList.groupBy(l=>l).filter(x=>x._2.length<2).map(_._1).groupBy(_.length).minBy(_._1)._2

Я начал с 140, который по крайней мере уже вписывается в твит.

(                                        // added for comments
 readLine                                // input
.inits.flatMap(_.tails).toList           // get all substrings of that string
.groupBy(l=>l).filter(x=>x._2.length<2)  // remove substrings that occur more than once
.map(_._1).groupBy(_.length)             // take the substring and group by length
.minBy(_._1)._2                          // take the list of shortest substrings
)
Доминик Мюллер
источник
Я думаю? Почему не (_)работает как личность вместо l=>l?
гордый haskeller
Мне тоже интересно. Как- list.groupBy(_)то так же, как x => list.groupBy(x). Я понятия не имею, почему они реализовали это так.
Доминик Мюллер
3

JavaScript (ES6), 109 110

Отредактируйте поиск вместо indexOf, так как входная строка буквенно-цифровая. Спасибо @IsmaelMiguel

Рекурсивная функция, ищущая подстроки, начинающиеся с длины 1 и идущие вверх.

F=(s,n=1,r)=>
s?[...s].map((a,i)=>~s.indexOf(a=s.substr(i,n),s.search(a)+1)?r:r=[...r||[],a])&&r||F(s,n+1):[s]

Разгромил и объяснил

 F = function(s, n=1) { // start with length 1
   var i, a, p, r;
   if (s == "") // special case for empty input string
     return [s];
   for (i = 0; i < s.length; i++) 
   // for each possibile substring of length n
   // (should stop at s.length-n+1 but going beyond is harmless)
   // Golfed: "[...s].map((a,i)" ... using i, a is overwrittem
   {
     a = s.substr(i, n); // substring at position i
     p = s.search(a); // p is the first position of substring found, can be i or less
     p = s.indexOf(a, p + 1) // p is now the position of a second instance of substring, or -1 if not found
     if (~p) // ~p is 0 if p is -1
     {
       ; // found more than once, do nothing
     }
     else
     {
       r = r || []; // if r is undefined, then it becomes an empty array
       r.push(a); // save substring 
       // Golfed: "r=[...r||[],a]"
     }
   }
   if (r) // if found some substring, saved in r
   {
     return r;
   }
   return F(s, n+1) // recursive retry for a bigger length
 }

Тест в консоли FireFox / FireBug

;["", "abcaa", "rererere", "asdfasdfd", "ffffhhhhfffffhhhhhfffhhh", 
 "asdfdfasddfdfaddsasadsasadsddsddfdsasdf"]
.forEach(x=>console.log(x,F(x)))

Выход

 [""]
abcaa ["b", "c"]
rererere ["ererer"]
asdfasdfd ["fa", "fd"]
ffffhhhhfffffhhhhhfffhhh ["hffff", "fffff", "hhhhh", "hfffh"]
asdfdfasddfdfaddsasadsasadsddsddfdsasdf ["fas", "fad", "add", "fds"]
edc65
источник
Используйте .searchвместо, .indexOfи вы сохраните 2 байта.
Исмаэль Мигель
@IsmaelMiguel нет, потому что 1) поиск не имеет параметра смещения 2) поиск ожидает регулярное выражение и завершится ошибкой с такими специальными символами, как. * [] И т. Д.
edc65
1
Но на первом вы можете смело его заменить (на свой s.indexOf(a)+1). Хотя это не работает с этими символами, вам не нужно беспокоиться! Цитируя ОП: « Input: An alphanumeric string s.»
Исмаэль Мигель
@ IsmaelMiguel верно, спасибо. Пропустил «буквенно-цифровое» ограничение
edc65
1
@IsmaelMiguel Я не нашел пути ... Мне нужно правдивое или ложное, и любой массив (даже пустой []) является истинным значением в javascript
edc65
3

Ява, 168 176 233

Вот довольно простой пример вложенного цикла.

void n(String s){for(int l=0,i=0,t=s.length(),q=0;l++<t&q<1;i=0)for(String b;i<=t-l;)if(s.indexOf(b=s.substring(i,i+++l),s.indexOf(b)+1)<0){System.out.println(b);q++;}}

Или немного более читабельным:

void t(String s){
    for(int l=0,i=0,t=s.length(),q=0;l++<t&q<1;i=0)
        for(String b;i<=t-l;)
            if(s.indexOf(b=s.substring(i,i++ +l),s.indexOf(b)+1)<0){
                System.out.println(b);
                q++;
            }
}
Geobits
источник
Если вы хотите удобочитаемости, разделите +++, чтобы показать, поможет ли это + ++или ++ +поможет ... И если вы хотите сэкономить еще несколько байтов, может быть способ сделать это путем инициализации q=1, замены q++на q=tи замены l++<t&q<1чем-то вроде t>l+=q. Вероятно, требуется настроить одно или два других смещения, чтобы заставить его работать.
Питер Тейлор
@Peter Ну, под читабельностью я в основном имел в виду «мне не нужно горизонтально прокручивать», но я уточнил +++. Я пытался настроить его (особенно q, который кажется несколько расточительным), но пока не нашел ничего солидного.
Geobits
@PeterTaylor Из-за лексических правил Java +++всегда разрешается ++ +.
FUZxxl
@ FUZxxl, я сомневаюсь, что даже большинство пользователей Java знают это, и на этом сайте есть много людей, которые не знают Java.
Питер Тейлор
1
Использование indexOf со смещением вместо lastIndexOf должно сократить 1 байт (см. Мой ответ на JavaScript)
edc65
3

Хаскелл, 169 162 155 153 151 138 120 115

import Data.List
l=length
q k=filter$(==)k.l
p y=q(minimum.map l$y)$y
f x=p$concat$q 1$group$sort$(tails x>>=inits)

Чтобы использовать это:

f "asdfdfasddfdfaddsasadsasadsddsddfdsasdf"

Который дает:

["add","fad","fas","fds"]

Btw. Я ненавижу последнюю строку моего кода (повторение h y). Кто-нибудь намекает, чтобы избавиться от этого?

RobAu
источник
1
Как насчет того, чтобы определить g y=q(minimum.(map l)$y)$y( map lдействительно ли нужны круглые скобки ?), А затем f=g.concat.q 1.group.sort.concatMap inits.tails?
FUZxxl
1
Использование >>=вместо concatMap, т.е. f x=p$concat$q 1$group$sort$(tails x>>=inits)экономит 2 байта. Почему Data.Ordимпорт?
Ними,
1
Скобки в qненужны, так как вы можете написать filter$(==)k.l, как и последний $и пробелы перед ys в p. Вы также можете удалить точки с запятой после импорта ( Data.Ordкажется, действительно ненужным).
Згарб
Лексах компилятор не принимает с $последующим пробелом. Он побреет несколько байтов, но есть ли это в спецификации языка?
RobAu
1
GHC примет это.
Zgarb
3

J 61 58 44 42 40 38 37 байт

[:>@{.@(#~#@>)#\<@(~.#~1=#/.~)@(]\)]

Вот версия, разделенная на отдельные компоненты решения:

unqs =. ~. #~ 1 = #/.~               NB. uniques; items that appear exactly once
allsbsq =. #\ <@unqs@(]\) ]        NB. all unique subsequences
shrtsbsq =. [: >@{.@(#~ #@>) allsbsq NB. shortest unique subsequence
  • x #/. yвычисляет для каждого отдельного элемента, xкак часто происходит в y. Если мы используем это как y #/. y, мы получаем для каждого отдельного элемента в yего количестве. Например, a #/. aдля a =. 1 2 2 3 4 4урожайности 1 2 1 2.
  • 1 = yпроверяет, какие элементы yравны 1. Например, 1 = a #/. aурожайность 1 0 1 0.
  • u~является рефлексивным монадического глагола u. Это так u~ yже, как y u y. Таким образом, так #/.~ yже, как #/.~ y. При применении к двоичному глагола, u~является пассивным из u. То x u~ yесть так же, как y u x. Они используются во многих других местах, которые я не упоминаю явно.
  • ~. yявляется гвоздем из y, вектор с дубликатами удалены. Например, ~. aурожайность 1 2 3 4.
  • x # y( копия ) выбирает из yэлементов по индексам, где xсодержится 1.
  • Таким образом, (1 = y #/. y) # (~. y)создается вектор тех элементов, из yкоторых появляются только один раз. В молчаливом обозначении этот глагол записывается как ~. #~ 1 = #/.~; давайте назовем эту фразу unqsдля остальной части объяснения.
  • x ]\ yсоздает массив всех инфиксов вектора длины xby . Например, урожайность1 + y - xyx3 ]\ 'asdfasdfd

    asd
    sdf
    dfa
    fas
    asd
    sdf
    dfd
    
  • # yэто число из y, то есть, количество элементов в y.

  • u\ yприменяется uк каждому префикса из y. Между прочим, #\ yсоздает вектор целых чисел из 1в #y.
  • < yкладет yв коробку. Это необходимо, потому что массивы нельзя разорвать, и мы вычисляем массив суффиксов различной длины; в штучной упаковке массив считается как скаляр.
  • Таким образом, (i. # y) <@:unqs@(]\) yгенерируется вектор #yштучных массивов длины k (для всех 0 ≤ k < #y) инфиксов y, которые встречаются ровно один раз. Молчаливая форма этого глагола - i.@# <@unqs@(]\) ]или, i.@# <@(~. #~ 1 = #/.~)@(]\) ]если мы не используем unqsимя. Давайте назовем эту фразу allsbsqдля остальной части этого объяснения. Например, allsbsq 'asdfasdfd'дает:

    ┌┬─┬──┬───┬────┬─────┬──────┬───────┬────────┐
    ││ │fa│dfa│sdfa│asdfa│asdfas│asdfasd│asdfasdf│
    ││ │fd│fas│dfas│sdfas│sdfasd│sdfasdf│sdfasdfd│
    ││ │  │dfd│fasd│dfasd│dfasdf│dfasdfd│        │
    ││ │  │   │sdfd│fasdf│fasdfd│       │        │
    ││ │  │   │    │asdfd│      │       │        │
    └┴─┴──┴───┴────┴─────┴──────┴───────┴────────┘
    
  • (#@> y) # yберет из вектора штучных массивов yте, которые не пусты.

  • {. yзанимает первый элемент вектора y.
  • > yудаляет окно с y.
  • Таким образом, > {. (#@> y) # yполучается неупакованный первый непустой массив из вектора штучных массивов y. Эта фраза написана >@{.@(#~ #@>)в негласной записи.
  • Наконец, [: >@{.@(#~ #@>) allsbsqсобирает предыдущую фразу с, allsbsqчтобы создать решение проблемы, которую мы имеем. Вот полная фраза с пробелами:

    [: >@{.@(#~ #@>) i.@# <@(~. #~ 1 = #/.~)@(]\) ]
    
FUZxxl
источник
2

Haskell, 135 байт

import Data.List
f ""=[""]
f g=map(snd)$head$groupBy(\a b->fst a==fst b)$sort[(length y,y)|[y]<-group$sort[x|x@(_:_)<-tails g>>=inits]]
Ними
источник
2

PHP, 171 152 134 125

function f($s){while(!$a&&++$i<strlen($s))for($j=0;$b=substr($s,$j++,$i);)strpos($s,$b)==strrpos($s,$b)&&($a[]=$b);return$a;}

http://3v4l.org/RaWTN

Стивен
источник
Вам не нужно явно определять $j=0. Впереди у вас есть substr($s,$j++,$i). Без определения $jвы можете переписать это substr($s,0+$j++,$i)и сохранить 2 байта. Почему это? Ну, первый раз, $jбудет null. И вы будете эффективно переходить nullк substr, что я не думаю, что это будет работать хорошо. Использование 0+$j++преобразует nullв 0. Если вы видите, что это не нужно, продолжайте без него и просто удалите $j=0деталь.
Исмаэль Мигель
Пробовал это; это не работает, потому что PHP не имеет сильной области видимости, поэтому $jне очищается и не инициализируется повторно для каждой итерации while()цикла. Таким образом , в то время как это нуль (и , следовательно , будет преобразован 0по $j++вызову) первый раз, на последующих итераций внешнего цикла он оставил на значении это было раньше. Это не столько инициализация, сколько сброс. Спасибо за предложение, хотя :-)
Стивен
Здесь я предлагаю вам решение длиной 141 байт: function f($s){$l=strlen($s);while(!$a&&++$i<$l)for($j=0;$j<$l;)($b=substr($s,$j++,$i))&(strpos($s,$b)==strrpos($s,$b)&&($a[]=$b));return$a;}Изменения: Убрал ВСЕ ваши ||1, использовал побитовый &( AND) вместо &&одного места, переместил $j<$l&&[...]деталь за пределы for(сохраняя 2 байта) и удалил некоторые ненужные скобки.
Исмаэль Мигель
1
Один 134-байтовый подарок для вас: function f($s){$l=strlen($s);while(!$a&&++$i<$l)for($j=0;$j<$l;)strpos($s,$b=substr($s,$j++,$i))==strrpos($s,$b)&&($a[]=$b);return$a;}Изменения, внесенные в предыдущий код: перенесли $b=substr($s,$j++,$i)в strpos($s,$b)создание strpos($s,$b=substr($s,$j++,$i)), удалили ненужные скобки и удалили ненужные &.
Исмаэль Мигель
1
Управляемая чуть больше рубки :-) substr($s,$j++,$i)возвращает, ""когда $jдостигает длины строки, и falseпосле этого, так что присваивание также может служить условным разрывом цикла. Тогда есть только одно использование $lоставшихся, так что это также можно объединить.
Стивен
2

Groovy (Java regex для реализации Oracle), 124

c={m=it=~/(?=(.*?)(?=(.*))(?<=^(?!.*\1(?!\2$)).*))/;o=m.collect({it[1]});o.findAll({it.size()==o.min({it.size()}).size()});}

Протестировано на Groovy 2.4 + Oracle JRE 1.7. Регулярное выражение должно работать для Java 6 - Java 8, так как ошибка, которая позволяет коду выше работать, не исправлена. Не уверен в предыдущей версии, поскольку в Java 5 есть ошибка, которая была исправлена ​​в Java 6.

Регулярное выражение находит самую короткую строку, которая не имеет повторяющейся подстроки в другом месте, в каждой позиции входной строки. Код снаружи заботится о фильтрации.

(?=(.*?)(?=(.*))(?<=^(?!.*\1(?!\2$)).*))
  • Поскольку струны могут перекрываться, я заглядываю в будущее (?=...).
  • (.*?) поиск из самой короткой подстроки
  • (?=(.*)) захватывает остальную часть строки, чтобы отметить текущую позицию.
  • (?<=^(?!.*\1(?!\2$)).*)является эмуляцией поиска переменной длины, которая использует ошибку реализации, которая позволяет (?<=.*)пройти проверку длины.
  • (?!.*\1(?!\2$))просто проверяет, что вы не можете найти такую ​​же подстроку в другом месте. (?!\2$)Отклоняет исходное положение , в котором сопоставляется подстрока.

    Предел внешней конструкции просмотра не применяется к вложенной конструкции просмотра. Следовательно, вложенный отрицательный упреждения (?!.*\1(?!\2$))фактически проверяет всю строку, а не только до правой границы упреждения .

n̴̖̋h̷͉a̷̭̿h̸̡̅ẗ̵̨d̷̰ĥ̷̳
источник
2

Rebol, 136 байтов

f: func[s][repeat n length? b: copy s[unless empty? x: collect[forall s[unless find next find b t: copy/part s n t[keep t]]][return x]]]

Ungolfed:

f: func [s] [
    repeat n length? b: copy s [
        unless empty? x: collect [
            forall s [
                unless find next find b t: copy/part s n t [keep t]
            ]
        ][return x]
    ]
]

Пример использования:

>> f ""       
== none

>> f "abcaa"
== ["b" "c"]

>> f "rererere"
== ["ererer"]

>> f "asdfasdfd"
== ["fa" "fd"]

>> f "ffffhhhhfffffhhhhhfffhhh"
== ["hffff" "fffff" "hhhhh" "hfffh"]

>> f "asdfdfasddfdfaddsasadsasadsddsddfdsasdf"
== ["fas" "fad" "add" "fds"]


NB. Я полагаю, суть кода в том, как работает эта findчасть. Надеюсь, это поможет объяснить ...

>> find "asdfasdfd" "df"
== "dfasdfd"

>> next find "asdfasdfd" "df"
== "fasdfd"

>> find next find "asdfasdfd" "df" "df"
== "dfd"

>> ;; so above shows that "df" is present more than once - so not unique
>> ;; whereas below returns NONE because "fa" found only once - ie. bingo!

>> find next find "asdfasdfd" "fa" "fa"
== none
draegtun
источник
1

Хаскелл, 119

f s=[r|n<-[1..length s],l<-[map(take n)$take(length s-n+1)$iterate(drop 1)s],r<-[[j|j<-l,[j]==[r|r<-l,r==j]]],r/=[]]!!0
гордый хаскеллер
источник
Вы можете положить q = lengthкуда-нибудь и использовать q, сбривает несколько байтов
RobAu
1

Брахилог , 10 байт

sᶠ≡ᵍ~gˢlᵍt

Попробуйте онлайн!

sᶠ            The list of every substring of the input
  ≡ᵍ          grouped by identity,
    ~gˢ       with length-1 groups converted to their elements and other groups discarded,
       lᵍ     and grouped by their length,
         t    has the output as its last group.

Хотя он не сортируется естественным образом по значению, по которому он группируется, а упорядочивает группы по первому вхождению каждого значения, первые вхождения каждой длины располагаются в порядке убывания. Я не уверен на 100%, что фильтрация уникальности не может испортить это, но я еще не придумал тестовый пример, который пока не проходит.

Несвязанная строка
источник
1

05AB1E , 10 байтов

Œʒ¢}é.γg}н

Ничего не выводит для пустой строки.

Попробуйте онлайн или проверьте все контрольные примеры .

Объяснение:

Œ           # Get all substrings of the (implicit) input-String
 ʒ          # Filter it by:
  ¢         #  Count how many times the current substring occurs in the (implicit) input-String
            #  (only 1 is truthy in 05AB1E, so the filter will leave unique substrings)
          # After the filter: sort the remaining substrings by length
     g}   # Then group them by length as well
         н  # And only leave the first group containing the shortest substrings
            # (which is output implicitly as result)

Это использует преимущество 05AB1E, имеющего только 1истинную ценность, а все остальное - ложь. Самая короткая уникальная подстрока всегда гарантированно встречается ровно один раз для всех возможных строк ввода. (Для входной строки, содержащей только те же символы (т. Е. aaaaa), Сама входная строка как подстрока встречается только один раз, поэтому результат таков ["aaaaa"]. Для входной строки с повторяющимся шаблоном (т. Е. "abcabc") Все еще существуют уникальные подстроки, которые только произойдет один раз ( ["abca","abcab","abcabc","bca","bcab","bcabc","ca","cab","cabc"]), так что это приведет к ["ca"].)

Кевин Круйссен
источник
0

Python 2, 150

import re
a=input()
r=range
l=len(a)
d=0
for i in r(l):
 if d:break
 for j in r(l-i):
  k=a[j:i+j+1]
  if len(re.findall("(?="+k+")",a))<2:d=1;print k
KSFT
источник
Серая область, она должна печататься "", но вы ничего не печатаете.
Якуб
1
@Jakube «Точное форматирование вывода является гибким»
KSFT
Но у вас нет выхода вообще.
Якуб
2
@Jakube Вывод - пустая строка, как и должно быть. У меня просто нет кавычек.
KSFT
1
@Jakube Я позволю это, так как в любом случае пустая строка - это особый случай.
Згарб