Найти нечетный персонаж в шаблоне

20

вход

Первая строка будет определенной строкой, повторяемой любое количество раз. Например, это может быть abcabcabcabc, [];[];[];и т.д. Это может быть отрезана; например: 1231231231. Всегда находите самую короткую строку; например, если строка есть 22222, то строка 2не22 или 22222или что-то еще. Строка всегда будет повторяться как минимум 2 полных раза.

Все последующие строки будут смещены на любое число. Например, это может быть:

abcabcabc
cabcabcab
bcabcabca

(смещение на 1), или это может быть:

abcdefabcdefabcdefabc
cdefabcdefabcdefabcde
efabcdefabcdefabcdefa

(смещено на 4).

Один из символов на входе будет неправильным. (Это гарантированно не будет в первой строке.) Например, в этом входе:

a=1a=1a=1
=1a=1a=1a
1a=11=1a=
a=1a=1a=1
=1a=1a=1a

1на линии 3 является нечетным один из.

Выход

Вы должны вывести (начиная с нуля, начиная с верхнего левого угла) координаты нечетного числа. Например, в приведенном выше вводе соответствующий вывод 4,2. Вы также можете выводить 4 2, или "4""2", или даже [[4],[2]], или любой другой формат, при условии, что вы можете сказать, каким должен быть вывод.

Контрольные примеры

Входные данные:

codegolfcodegolfco
egolfcodegolfcodeg
lfcodegolfcodegoff
odegolfcodegolfcod
golfcodegolfcodego
fcodegolfcodegolfc

Выход: 16,2

Входные данные:

][[][][[][][[][][[][][[
[][][[][][[][][[][][[][
[][[][][[][][[][][[][][
[[][][[]]][[][][[][][[]

Выход: 8,3

Входные данные:

...
. .
...

Выход: 1,1

Входные данные:

ababa
babab
ababb
babab

Выход: 4,2

Идти!

Дверная ручка
источник
Какие символы могут содержаться в строке? Версия для печати ASCII? ASCII? Unicode?
Денис
@Dennis Только для печати ASCII (что в принципе можно предположить для любой задачи, связанной со строками; в противном случае нам пришлось бы указывать это для почти каждой задачи: P)
Ручка двери
Я так и предположил. Я думаю о подходе, который потребовал бы неиспользованного символа, поэтому я решил спросить.
Денис
Должны ли мы проверить случай, как это: abc/cab/abc- и вывод 0 2здесь?
user2846289
@VadimR Нет, так как только один символ будет неправильным.
Дверная ручка

Ответы:

7

Bash Perl, 231 229 218 178 164 166 138 106 74 байта

/^(((.*).*)\2+)\3$/;$_.=$1x2;$.--,die$+[1]if/^(.*)(.)(.*)
.*\1(?!\2).\3/

Сценарий требует использования -nпереключателя, который составляет два байта.

Идея добавления двух копий всех полных повторений шаблона была взята из ответа МТ0 .

В отличие от всех других ответов, этот подход пытается извлечь шаблон текущей строки ввода в каждой итерации; он потерпит неудачу в строке, содержащей нечетный символ (и вместо этого будет использовать шаблон предыдущей строки). Это сделано для включения извлечения шаблона в цикл, который позволяет сохранить несколько байтов.

Неуправляемая версия

#!/usr/bin/perl -n

# The `-n' switch makes Perl execute the entire script once for each input line, just like
# wrapping `while(<>){…}' around the script would do.

/^(((.*).*)\2+)\3$/;

# This regular expression matches if `((.*).*)' - accessible via the backreference `\2' -
# is repeated at least once, followed by a single repetition of `\3" - zero or more of the
# leftmost characters of `\2' - followed by the end of line. This means `\1' will contain
# all full repetitions of the pattern. Even in the next loop, the contents of `\1' will be
# available in the variable `$1'.

$_.=$1x2;

# Append two copies of `$1' to the current line. For the line, containing the odd
# character, the regular expression will not have matched and the pattern of the previous
# line will get appended.
#
# Since the pattern is repeated at least two full times, the partial pattern repetition at
# the end of the previous line will be shorter than the string before it. This means that
# the entire line will the shorter than 1.5 times the full repetitions of the pattern, 
# making the two copies of the full repetitions of the pattern at least three times as 
# long as the input lines.

$.-- , die $+[1] if

# If the regular expression below matches, do the following:
#
#   1. Decrement the variable `$.', which contains the input line number.
#
#      This is done to obtain zero-based coordinates.
#
#   2. Print `$+[1]' - the position of the last character of the first subpattern of the
#      regular expression - plus some additional information to STDERR and exit.
#
#      Notably, `die' prints the (decremented) current line number.

/^(.*)(.)(.*)
.*\1(?!\2).\3/;

# `(.*)(.)(.*)', enclosed by `^' and a newline, divides the current input line into three
# parts, which will be accesible via the backreferences `\1' to `\3'. Note that `\2'
# contains a single character.
#
# `.*\1(?!\2).\3' matches the current input line, except for the single character between
# `\1' and `\3' which has to be different from that in `\2', at any position of the line
# containing the pattern repetitions. Since this line is at least thrice as long as
# `\1(?!\2).\3', it will be matched regardless of by how many characters the line has been
# rotated.

пример

Для теста

codegolfcodegolfco
egolfcodegolfcodeg
lfcodegolfcodegoff
odegolfcodegolfcod
golfcodegolfcodego
fcodegolfcodegolfc

выход версии гольфа

16 at script.pl line 1, <> line 2.

это означает, что нечетный символ имеет координаты 16,2.

Это явное злоупотребление использует преимущества либерального формата вывода.

Непосредственно перед выходом содержимое некоторых специальных переменных Perl:

$_  = lfcodegolfcodegoff\ncodegolfcodegolfcodegolfcodegolf
$1  = lfcodegolfcodego
$2  = f
$3  = f

( $nсодержит совпадение подшаблона, доступного через обратную ссылку \n.)

Деннис
источник
Умная ловля блока ответа. Он может быть оптимизирован одним байтом:^((.*?)(.*?))(?=\1+\2$)
Хейко Обердик
Я переключился на язык, которым пользуются популярные дети. Вероятно, можно играть в гольф дальше; это мой первый Perl-скрипт за последние десять лет ...
Деннис
2
... и вы опоздали на десятилетие, если думаете, что Perl - это то, чем пользуются популярные дети
ardnew
этот ответ не получает любовь, которую он заслуживает. выглядит как победитель @Doorknob
ardnew
8

Perl, 212 191 181 168 байт

$_=<>;/^(((.*?)(.*?))\2+)\3$/;$x=$1x4;while(<>){chop;$x=~/\Q$_\E/&&next;for$i(0..y///c-1){for$r(split//,$x){$b=$_;$b=~s/(.{$i})./$1$r/;$x=~/\Q$b\E/&&die$i,$",$.-1,$/}}}
  • Эта версия использует оптимизированный трюк для перехвата блока ответа, изученного в ответе Денниса .
  • Оптимизация с помощью свойства, что все строки имеют одинаковую длину.
  • Конец строки также необходим для последней строки, в противном случае chompвместо chopдолжен использоваться.
  • Добавлена ​​оптимизация комментария ardnew .

Старая версия, 212 байт:

$_=<>;chop;/^(.+?)\1+(??{".{0,".(-1+length$1).'}'})$/;$;=$1;while(<>){$x=$;x length;chop;$x=~/\Q$_\E/&&next;for$i(0..-1+length$_){for$r(split//,$;){$b=$_;$b=~s/(.{$i})./$1$r/;$x=~/\Q$b\E/&&exit print$i,$",$.-1}}}

Безголовая версия:

$_ = <>;  # read first line
/^(((.*?)(.*?))\2+)\3$/;
# The repeat unit \2 consists of \3 and \4,
# and the start part \2 can be added at the end (as partial or even full unit).
$x = $1 x 4; # $x is long enough to cover each following line

# Old version:
# /^(.+?)\1+(??{ ".{0," . (-1 + length $1) . '}' })$/;
# $a = $1; # $a is the repeat unit.
# The unit is caught by a non-greedy pattern (.+?) that is
# repeated at least once: \1+
# The remaining characters must be less than the unit length.
# The unit length is known at run-time, therefore a "postponed"
# regular expression is used for the remainder.

# process the following lines until the error is found
while (<>) {
    # old version:
    # $x = $a x length;
    # $x contains the repeated string unit, by at least one unit longer
    # than the string in the current line
    chop; # remove line end of current line
    $x =~ /\Q$_\E/ && next;
          # go to next line, if current string is a substring of the repeated units;
          # \Q...\E prevents the interpretation of special characters
    # now each string position $x is checked, if it contains the wrong character:
    for $i (0 .. y///c - 1) {  # y///c yields the length of $_
        for $r (split //, $x) { #/ (old version uses $a)
            # replace the character at position $i with a
            # character from the repeat unit
            $b = $_;
            $b =~ s/(.{$i})./$1$r/;
            $x =~ /\Q$b\E/
               && die $i, $", $. - 1, $/;
               # $" sets a space and the newline is added by $/;
               # the newline prevents "die" from outputting line numbers
        }
    }
}
Хайко Обердиек
источник
Отличное решение и комментарии, мне нужно узнать больше регулярных выражений;)
Newbrict
1
первое chopне нужно - должно быть удалено. финал exit printможет быть заменен на die(добавить, ,$/чтобы скрыть лишние вещи (если требуется)). также length$_можно заменить наy///c
ardnew
@ardnew: Большое спасибо, я удалил первое chop, потому что $совпадает с символом новой строки в конце строки. Сокрытие лишних вещей dieчерез добавленную новую строку кажется мне необходимым. Также y///cнамного короче length$_и на один байт короче, чем lengthбез лишних $_.
Хайко Обердик
1
@ardnew: я забыл о многословии умереть . Он даже включает в себя печать номера строки! Я буду использовать это в моем следующем обновлении.
Денис
3

C 187 байт

Ограничения.

  • Не используйте входные строки длиннее 98 символов :)

Гольф версия

char s[99],z[99],*k,p,i,I,o,a;c(){for(i=0;k[i]==s[(i+o)%p];i++);return k[i];}main(){for(gets(k=s);c(p++););for(;!(o=o>p&&printf("%d,%d\n",I,a))&&gets(k=z);a++)while(o++<p&&c())I=I<i?i:I;}

Неуправляемая версия

char s[99],z[99],*k,p,i,I,o,a;

c()
{
    for(i=0
       ;k[i]==s[(i+o)%p]
       ;i++)
       ;
    return k[i];
}

main()
{
    for(gets(k=s);c(p++);)
         ;
    for(;!(o=o>p&&printf("%d,%d\n",I,a)) && gets(k=z);a++)
           while(o++ < p && c())
            I=I<i?i:I;
}
аср
источник
2

Питон, 303 292

r=raw_input
R=range
s=r()
l=len(s)
m=1
g=s[:[all((lambda x:x[1:]==x[:-1])(s[n::k])for n in R(k))for k in R(1,l)].index(True)+1]*l*2
while 1:
 t=r()
 z=[map(lambda p:p[0]==p[1],zip(t,g[n:l+n]))for n in R(l)]
 any(all(y)for y in z)or exit("%d,%d"%(max(map(lambda b:b.index(False),z)),m))
 m+=1

Ввод идет через стандартный ввод. Я объясню, если есть спрос, но, похоже, я все равно не выиграю.

Fraxtil
источник
1

Perl, 157 154

Изменить : -3 благодаря предложению ardnew.

<>=~/^(((.*?).*?)\2+)\3$/;$p=$2;$n=$+[1];while(<>){s/.{$n}/$&$&/;/(\Q$p\E)+/g;$s=$p;1while/./g*$s=~/\G\Q$&/g;print$n>--($m=pos)?$m:$m-$n,$",$.-1,$/if pos}

Это заняло у меня некоторое время (конечно, не 5 дней;), и идея об алгоритме была изначально неуловима (хотя я чувствовал, что он там был), но в конце концов (и внезапно) все стало ясно.

Если длина строки кратна длине шаблона, и даже если строка не начинается с начала шаблона, конкатенация строки с самим собой создаст шаблон вместо конкатенации (представьте бесконечное повторение слова на круговой ленте - место сварка не важна). Таким образом, идея состоит в том, чтобы обрезать линию до нескольких единиц длины и объединить оригинал с ней. Результат, даже для строки, содержащей неправильный символ, гарантированно соответствует шаблону хотя бы один раз. Оттуда легко найти положение оскорбительного персонажа.

Первая строка бесстыдно позаимствована из ответа Хейко Обердика :-)

<>=~/^(((.*?).*?)\2+)\3$/;      # Read first line, find the repeating unit
$p=$2;                          # and length of whole number of units.
$n=$+[1];                       # Store as $p and $n.
while(<>){                      # Repeat for each line.
    s/.{$n}/$&$&/;              # Extract first $n chars and
                                # append original line to them.
    /(\Q$p\E)+/g;               # Match until failure (not necessarily from the
                                # beginning - doesn't matter).
    $s=$p;                      # This is just to reset global match position
                                # for $s (which is $p) - we could do without $s,
                                # $p.=''; but it's one char longer.
                                # From here, whole pattern doesn't match -
    1while/./g*$s=~/\G\Q$&/g;   # check by single char.
                                # Extract next char (if possible), match to 
                                # appropriate position in a pattern (position 
                                # maintained by \G assertion and g modifier).
                                # We either exhaust the string (then pos is 
                                # undefined and this was not the string we're
                                # looking for) or find offending char position.

    print$n>--($m=pos)?$m:$m-$n,$",$.-1,$/if pos
}
user2846289
источник
1
хорошо сделано. я думаю, что вы можете заменить /.{$n}/;$_=$&.$_;наs/.{$n}/$&$&/;
ardnew
1

JavaScript (ES6) - 147 133 136 символов

s.split('\n').map((x,i)=>(v=/^(.*)(.)(.*)᛫.*\1(?!\2).\3/.exec(x+'᛫'+(a=/^(((.*).*)\2+)\3\n/.exec(s)[1])+a))&&console.log(v[1].length,i))

Ожидает, что проверяемая строка будет в переменной, sи выдаст результат на консоль.

var repetitionRE = /^(((.*).*)\2+)\3\n/;
                                        // Regular expression to find repeating sequence
                                        // without any trailing sub-string of the sequence.
var sequence = repetitionRE.exec(s)[1]; // Find the sequence string.
s.split('\n')                           // Split the input into an array.
 .map(
   ( row, index ) =>                    // Anonymous function using ES6 arrow syntax
   {
     var testStr = row + '᛫'+ sequence + sequence;
                                        // Concatenate the current row, a character which won't
                                        // appear in the input and two copies of the repetitions
                                        // of the sequence from the first line.
     var match = /^(.*)(.)(.*)᛫.*\1(?!\2).\3/.exec(testStr);
                                        // Left of the ᛫ finds sub-matches for a single
                                        // character and the sub-strings before and after.
                                        // Right of the ᛫ looks for any number of characters
                                        // then the before and after sub-matches with a
                                        // different character between.
      if ( match )
       console.log( match[1].length, index );
                                        // Output the index of the non-matching character
                                        // and the row.
   }         
 );

Тестовый пример 1

s="codegolfcodegolfco\negolfcodegolfcodeg\nlfcodegolfcodegoff\nodegolfcodegolfcod\ngolfcodegolfcodego\nfcodegolfcodegolfc"
s.split('\n').map((x,i)=>(v=/^(.*)(.)(.*)᛫.*\1(?!\2).\3/.exec(x+'᛫'+(a=/^(((.*).*)\2+)\3\n/.exec(s)[1])+a))&&console.log(v[1].length,i))

Выходы

16 2

Тестовый пример 2

s="][[][][[][][[][][[][][[\n[][][[][][[][][[][][[][\n[][[][][[][][[][][[][][\n[[][][[]]][[][][[][][[]"
s.split('\n').map((x,i)=>(v=/^(.*)(.)(.*)᛫.*\1(?!\2).\3/.exec(x+'᛫'+(a=/^(((.*).*)\2+)\3\n/.exec(s)[1])+a))&&console.log(v[1].length,i))

Выходы

8 3

Тестовый пример 3

s="...\n. .\n..."
s.split('\n').map((x,i)=>(v=/^(.*)(.)(.*)᛫.*\1(?!\2).\3/.exec(x+'᛫'+(a=/^(((.*).*)\2+)\3\n/.exec(s)[1])+a))&&console.log(v[1].length,i))

Выходы

1 1

Тестовый пример 4

s="ababa\nbabab\nababb\nbabab"
s.split('\n').map((x,i)=>(v=/^(.*)(.)(.*)᛫.*\1(?!\2).\3/.exec(x+'᛫'+(a=/^(((.*).*)\2+)\3\n/.exec(s)[1])+a))&&console.log(v[1].length,i))

Выходы

4 2

Тестовый пример 5

s="xyxy\nyyxy"
s.split('\n').map((x,i)=>(v=/^(.*)(.)(.*)᛫.*\1(?!\2).\3/.exec(x+'᛫'+(a=/^(((.*).*)\2+)\3\n/.exec(s)[1])+a))&&console.log(v[1].length,i))

Выходы

0 1

Тестовый пример 6

s="ababaababa\nababaaaaba"
s.split('\n').map((x,i)=>(v=/^(.*)(.)(.*)᛫.*\1(?!\2).\3/.exec(x+'᛫'+(a=/^(((.*).*)\2+)\3\n/.exec(s)[1])+a))&&console.log(v[1].length,i))

Выходы

6 1
mt0
источник
К сожалению, этот подход терпит неудачу , если, например, s="xyxy\nyyxy". Для второй строки, match[4]будет yy; это должно быть просто y.
Деннис
Переработано и сокращено на 14 символов.
MT0
Очень хорошо! В какой-то момент я попробовал то же самое второе регулярное выражение, но я добавил минимальный шаблон дважды вместо максимального (и, таким образом, потерпел неудачу). Одна небольшая проблема: первое регулярное выражение сообщит ababо шаблоне ababaababa; вам нужно использовать ^…$.
Денис
/^…\n/работает или/^…$/m
MT0
1
Возможно, ему не понадобится ведущий ^(по крайней мере, он не нужен ни для одного из 6 тестовых случаев, которые я перечислил - но, вероятно, есть контрпример, где он есть, поэтому я оставил его).
MT0