Разбор формата словаря Книгоед

42

Недавно я потворствовал некоторой ностальгии в форме Bookworm Deluxe:

Если вы еще этого не видели, это словесная игра, цель которой состоит в том, чтобы соединить соседние плитки и сформировать слова. Чтобы определить, является ли строка допустимым словом, она проверяет его по своему внутреннему словарю, который хранится в сжатом формате, который выглядит следующим образом:

aa
2h
3ed
ing
s
2l
3iis
s
2rdvark
8s
4wolf
7ves

Правила распаковки словаря просты:

  1. Прочитайте число в начале строки и скопируйте столько символов из начала предыдущего слова. (Если числа нет, скопируйте столько символов, сколько вы делали в прошлый раз.)

  2. Добавьте следующие слова к слову.

Итак, наше первое слово aa, за которым следует 2h, что означает «скопировать первые две буквы aaи добавить h», формируя aah. Затем 3edстановится aahed, и поскольку в следующей строке нет номера, мы снова копируем 3 символа в форму aahing. Этот процесс продолжается на протяжении всего словаря. Результирующие слова из небольшого примера ввода:

aa
aah
aahed
aahing
aahs
aal
aaliis
aals
aardvark
aardvarks
aardwolf
aardwolves

Ваша задача состоит в том, чтобы выполнить эту распаковку как можно меньше байтов.

Каждая строка ввода будет содержать ноль или более цифр, 0-9 за которыми следуют одна или несколько строчных букв a-z. Вы можете взять ввод и выдать вывод либо в виде списка строк, либо в виде отдельной строки со словами, разделенными любым символом, кроме 0-9/ a-z.

Вот еще один небольшой тестовый пример с несколькими крайними случаями, не описанными в этом примере:

abc cba 1de fg hi 0jkl mno abcdefghijk 10l
=> abc cba cde cfg chi jkl mno abcdefghijk abcdefghijl

Вы также можете проверить свой код в полном словаре: ввод , вывод .

Дверная ручка
источник
Есть ли вероятность, что во второй строке не будет номера? Кроме того, можем ли мы предположить, что ни у одного числа кроме 0начальных 0s не будет?
Эрик Outgolfer
@EriktheOutgolfer Да, это возможно; Я добавил это в контрольный пример. И да, вы можете предположить, что (а также то, что число не будет больше, чем длина предыдущего слова).
Дверная ручка
11
Это симпатичный формат сжатия:]
Poke
1
locateПрограмма использует этот тип кодирования на путевых именах.
Дэн Д.
Я написал эту программу для моего реального использования, около 15 лет назад. К сожалению, я не думаю, что у меня больше нет источника ...
Хоббс

Ответы:

13

Vim, 57 байт

:%s/\a/ &
:%norm +hkyiwjP
:g/\d/norm diw-@"yl+P
:%s/ //g

Попробуйте онлайн!

DJMcMayhem
источник
Будет ли <H<Gработать вместо последней замены?
Критиси Литос
@cowsquack К сожалению, нет. Каждый ввод, который не начинается с числа, увеличивает количество начальных пробелов, поэтому нет способа гарантировать, что <решение будет достаточно удалено.
DJMcMayhem
Я думаю, что вы можете сделать :%s/ *вместо последней замены, чтобы сохранить два байта.
Декстер CD
10

JavaScript (ES6),  66 62  61 байт

a=>a.map(p=s=>a=a.slice([,x,y]=/(\d*)(.*)/.exec(s),p=x||p)+y)

Попробуйте онлайн!

комментарии

a =>                  // a[] = input, re-used to store the previous word
  a.map(p =           // initialize p to a non-numeric value
  s =>                // for each string s in a[]:
    a =               //   update a:
      a.slice(        //     extract the correct prefix from the previous word:
        [, x, y] =    //       load into x and y:
          /(\d*)(.*)/ //         the result of a regular expression which splits the new
          .exec(s),   //         entry into x = leading digits and y = trailing letters
                      //       this array is interpreted as 0 by slice()
        p = x || p    //       update p to x if x is not an empty string; otherwise leave
                      //       it unchanged; use this as the 2nd parameter of slice()
      )               //     end of slice()
      + y             //     append the new suffix
  )                   // end of map()
Arnauld
источник
5

Perl 6 , 50 48 байтов

-2 байта благодаря nwellnhof

{my$l;.map:{$!=S[\d*]=substr $!,0,$l [R||]=~$/}}

Попробуйте онлайн!

Порт решения Арно . Чувак, этот R||трюк был "американскими горками" от «Я думаю, что это могло быть возможно», до «нет, это невозможно», до «вроде возможно» и, наконец, «ага!»

Объяснение:

{my$l;.map:{$!=S[\d*]=substr $!,0,$l [R||]=~$/}}
{                                              }  # Anonymous code block
 my$l;    # Declare the variable $l, which is used for the previous number
      .map:{                                  }  # Map the input list to
            $!=              # $! is used to save the previous word
               S[\d*]=       # Substitute the number for
                      substr $!,0    # A substring of the previous word
                                 ,              # With the length of 
                                           ~$0     # The num if it exists
                                  $l [R||]=        # Otherwise the previous num

$l [R||]=~$/Часть примерно переводится , $l= ~$/||+$lно ... это имеет такое же количество байтов :(. Первоначально он сохранял байты, используя анонимную переменную, поэтому my$lон исчез, но это не работает, поскольку область теперь является заменой, а не mapблоком кода. Ну что ж. В любом случае, Rэто обратный метаоператор, поэтому он переворачивает аргументы ||, поэтому $lпеременной присваивается новый номер (~$/ ), если он существует, в противном случае он сам снова.

Это может быть 47 байт, если Perl 6 не выдал своего рода избыточную ошибку компилятора =~.

Джо Кинг
источник
5

Рубин , 49 45 43 байта

$0=$_=$0[/.{0#{p=$_[/\d+/]||p}}/]+$_[/\D+/]

Попробуйте онлайн!

объяснение

$0=                                         #Previous word, assign the value of
   $_=                                      #Current word, assign the value of
      $0[/.{0#{              }}/]           #Starting substring of $0 of length p which is
               p=$_[/\d+/]||p               #defined as a number in the start of $_ if any 
                                 +$_[/\D+/] #Plus any remaining non-digits in $_
Кирилл Л.
источник
5

C 65 57 байт

n;f(){char c[99];while(scanf("%d",&n),gets(c+n))puts(c);}

Попробуйте онлайн!

Объяснение:

n;                     /* n is implicitly int, and initialized to zero. */

f() {                  /* the unpacking function. */

    char c[99];        /* we need a buffer to read into, for the longest line in
                          the full dictionary we need 12 + 1 bytes. */

    while(             /* loop while there is input left. */

        scanf("%d",&n) /* Read into n, if the read fails because this line
                          doesn't have a number n's value does not change.
                          scanf's return value is ignored. */

        ,              /* chain expressions with the comma operator. The loop
                          condition is on the right side of the comma. */

        gets(c+n))     /* we read into c starting from cₙ. c₀, c₁.. up to cₙ is
                          the shared prefix of the word we are reading and the
                          previous word. When gets is successful it returns c+n
                          else it will return NULL. When the loop condition is
                          NULL the loop exits. */

        puts(c);}      /* print the unpacked word. */
Декстер CD
источник
5

брейкфак , 201 байт

,[[[-<+>>>+<<]>-[---<+>]<[[-<]>>]<[-]>>[<<,>>>[-[-<++++++++++>]]++++<[->+<]-[----->-<]<]<]>>>[[>>]+[-<<]>>[[>>]+[<<]>>-]]+[>>]<[-]<[<<]>[->[>>]<+<[<<]>]>[>.>]+[>[-]<,.[->+>+<<]>>----------]<[<<]>-<<<,]

Попробуйте онлайн!

Требует завершающий перевод строки в конце ввода. Версия без этого требования на 6 байт длиннее:

брейкфук , 207 байт

,[[[-<+>>>+<<]>-[---<+>]<[[-<]>>]<[-]>>[<<,>>>[-[-<++++++++++>]]++++<[->+<]-[----->-<]<]<]>>>[[>>]+[-<<]>>[[>>]+[<<]>>-]]+[>>]<[-]<[<<]>[->[>>]<+<[<<]>]>[>.>]+[>[-]<,[->+>+<<]>>[----------<.<]>>]<[<<]>-<<<,]

Попробуйте онлайн!

Обе версии предполагают, что все числа строго меньше 255.

объяснение

Лента выложена следующим образом:

tempinputcopy 85 0 inputcopy number 1 a 1 a 1 r 1 d 0 w 0 o 0 l 0 f 0 ...

Ячейка «число» равна 0, если цифры не введены, и n + 1, если число n введено. Вход берется в ячейку с отметкой «85».

,[                     take input and start main loop
 [                     start number input loop
  [-<+>>>+<<]          copy input to tempinputcopy and inputcopy
  >-[---<+>]           put the number 85 in the cell where input was taken
  <[[-<]>>]            test whether input is less than 85; ending position depends on result of comparison
                       (note that digits are 48 through 57 while letters are 97 through 122)
  <[-]>                clean up by zeroing out the cell that didn't already become zero
  >[                   if input was a digit:
   <<,>>               get next input character
   >[-[-<++++++++++>]] multiply current value by 10 and add to current input
   ++++                set number cell to 4 (as part of subtracting 47)
   <[->+<]             add input plus 10*number back to number cell
   -[----->-<]         subtract 51
  <]                   move to cell we would be at if input were a letter
 <]                    move to input cell; this is occupied iff input was a digit

                       part 2: update/output word

 >>>                   move to number cell
 [                     if occupied (number was input):
  [>>]+[-<<]>>         remove existing marker 1s and decrement number cell to true value
  [[>>]+[<<]>>-]       create the correct amount of marker 1s
 ]
 +[>>]<[-]             zero out cell containing next letter from previous word
 <[<<]>                return to inputcopy
 [->[>>]<+<[<<]>]      move input copy to next letter cell
 >[>.>]                output word so far
 +[                    do until newline is read:
  >[-]<                zero out letter cell
  ,.                   input and output next letter or newline
  [->+>+<<]            copy to letter cell and following cell
  >>----------         subtract 10 to compare to newline
 ]
 <[<<]>-               zero out number cell (which was 1 to make copy loop shorter)
 <<<,                  return to input cell and take input
]                      repeat until end of input
Nitrodon
источник
4

Python 3.6+, 172 195 156 123 122 121 104 байта

import re
def f(l,n=0,w=""):
 for s in l:t=re.match("\d*",s)[0];n=int(t or n);w=w[:n]+s[len(t):];yield w

Попробуйте онлайн!

объяснение

Я прогнулся и использовал регулярные выражения. Это сэкономило как минимум 17 байтов. :

t=re.match("\d*",s)[0]

Когда строка вообще не начинается с цифры, длина этой строки будет 0. Это значит, что:

n=int(t or n)

будет, nесли tпусто, а int(t)иначе.

w=w[:n]+s[len(t):]

удаляет номер, из которого найдено регулярное выражение s(если номер не найден, он удаляет 0символы, оставляя не sобрезанным), и заменяет все, кроме первых nсимволов предыдущего слова, на текущий фрагмент слова; а также:

yield w

выводит текущее слово.

wizzwizz4
источник
4

Haskell, 82 81 байт

tail.map concat.scanl p["",""]
p[n,l]a|[(i,r)]<-reads a=[take i$n++l,r]|1<2=[n,a]

Принимает и возвращает список строк.

Попробуйте онлайн!

        scanl p["",""]        -- fold function 'p' into the input list starting with
                              -- a list of two empty strings and collect the
                              -- intermediate results in a list
  p [n,l] a                   -- 1st string of the list 'n' is the part taken form the last word
                              -- 2nd string of the list 'l' is the part from the current line
                              -- 'a' is the code from the next line
     |[(i,r)]<-reads a        -- if 'a' can be parsed as an integer 'i' and a string 'r'
       =[take i$n++l,r]       -- go on with the first 'i' chars from the last line (-> 'n' and 'l' concatenated) and the new ending 'r'
     |1<2                     -- if parsing is not possible
       =[n,a]                 -- go on with the previous beginning of the word 'n' and the new end 'a'
                              -- e.g. [         "aa",     "2h",      "3ed",       "ing"       ] 
                              -- ->   [["",""],["","aa"],["aa","h"],["aah","ed"],["aah","ing"]]
  map concat                  -- concatenate each sublist
tail                          -- drop first element. 'scanl' saves the initial value in the list of intermediate results. 

Редактировать: -1 байт благодаря @Nitrodon.

Ними
источник
1
Вопреки обычному опыту игры в гольф на Haskell, вы можете сэкономить здесь один байт, не определяя вспомогательную функцию в качестве инфиксного оператора.
Nitrodon
@Nitrodon: хорошо заметили! Благодарность!
Ними
3

Japt, 19 18 17 байт

Первоначально вдохновлен решением JS Арно .

;£=¯V=XkB ªV +XoB

Попытайся

                      :Implicit input of string array U
 £                    :Map each X
   ¯                  :  Slice U to index
      Xk              :    Remove from X
;       B             :     The lowercase alphabet (leaving only the digits or an empty string, which is falsey)
          ªV          :    Logical OR with V (initially 0)
    V=                :    Assign the result to V for the next iteration
             +        :  Append
              Xo      :  Remove everything from X, except
;               B     :   The lowercase alphabet
  =                   :  Reassign the resulting string to U for the next iteration
мохнатый
источник
2

Желе , 16 байт

⁹fØDVo©®⁸ḣ;ḟØDµ\

Попробуйте онлайн!

Как это работает

⁹fØDVo©®⁸ḣ;ḟØDµ\  Main link. Argument: A (array of strings)

              µ\  Cumulatively reduce A by the link to the left.
⁹                     Yield the right argument.
  ØD                  Yield "0123456789".
 f                    Filter; keep only digits.
    V                 Eval the result. An empty string yields 0.
     o©               Perform logical OR and copy the result to the register.
       ®              Yield the value in the register (initially 0).
        ⁸ḣ            Head; keep that many character of the left argument.
          ;           Concatenate the result and the right argument.
            ØD        Yield "0123456789".
           ḟ          Filterfalse; keep only non-digits.
Деннис
источник
1

Сетчатка 0.8.2 , 69 байт

+`((\d+).*¶)(\D)
$1$2$3
\d+
$*
+m`^((.)*(.).*¶(?<-2>.)*)(?(2)$)1
$1$3

Попробуйте онлайн! Ссылка включает в себя более сложные тестовые случаи. Объяснение:

+`((\d+).*¶)(\D)
$1$2$3

Для всех строк, которые начинаются с букв, скопируйте число из предыдущей строки, циклически, пока все строки не начнутся с цифры.

\d+
$*

Перевести число в одинарное.

+m`^((.)*(.).*¶(?<-2>.)*)(?(2)$)1
$1$3

Используйте группы балансировки, чтобы заменить все 1буквы на соответствующие буквы из предыдущей строки. (Оказывается, это немного сложнее, чем замена всех трасс 1s.)

Нил
источник
1

Groovy , 74 байта

{w="";d=0;it.replaceAll(/(\d*)(.+)/){d=(it[1]?:d)as int;w=w[0..<d]+it[2]}}

Попробуйте онлайн!

Объяснение:

{                                                                        }  Closure, sole argument = it
 w="";d=0;                                                                  Initialize variables
          it.replaceAll(/(\d*)(.+)/){                                   }   Replace every line (since this matches every line) and implicitly return. Loop variable is again it
                                     d=(it[1]?:d)as int;                    If a number is matched, set d to the number as an integer, else keep the value
                                                        w=w[0..<d]+it[2]    Set w to the first d characters of w, plus the matched string
ASCII-только
источник
0

Perl 5 -p , 45 41 байт

s:\d*:substr($p,0,$l=$&+$l*/^\D/):e;$p=$_

Попробуйте онлайн!

Объяснение:

s:\d*:substr($p,0,$l=$&+$l*/^\D/):e;$p=$_ Full program, implicit input
s:   :                           :e;      Replace
  \d*                                       Any number of digits
      substr($p,0,              )           By a prefix of $p (previous result or "")
                  $l=  +                      With a length (assigned to $l) of the sum
                     $&                         of the matched digits
                          *                     and the product
                        $l                        of $l (previous length or 0)
                           /^\D/                  and whether there is no number in the beginning (1 or 0)
                                                (product is $l if no number)
                                    $p=$_ Assign output to $p
                                          Implicit output
Wastl
источник
0

05AB1E , 20 19 17 байт

õUvyþDõÊi£U}Xyá«=

Попробуйте онлайн или проверьте все контрольные примеры .

Объяснение:

õ                  # Push an empty string ""
 U                 # Pop and store it in variable `X`
v                  # Loop `y` over the (implicit) input-list
 yþ                #  Push `y`, and leave only the digits (let's call it `n`)
   DõÊi  }         #  If it's NOT equal to an empty string "":
       £           #   Pop and push the first `n` characters of the string
        U          #   Pop and store it in variable `X`
          X        #  Push variable `X`
           yá      #  Push `y`, and leave only the letters
             «     #  Merge them together
              =    #  Print it (without popping)
Кевин Круйссен
источник
0

Common Lisp, 181 байт

(do(w(p 0))((not(setf g(read-line t()))))(multiple-value-bind(a b)(parse-integer g :junk-allowed t)(setf p(or a p)w(concatenate'string(subseq w 0 p)(subseq g b)))(format t"~a~%"w)))

Попробуйте онлайн!

Ungolfed:

(do (w (p 0))   ; w previous word, p previous integer prefix (initialized to 0)
    ((not (setf g (read-line t ()))))   ; read a line into new variable g
                                        ; and if null terminate: 
  (multiple-value-bind (a b)            ; let a, b the current integer prefix
      (parse-integer g :junk-allowed t) ; and the position after the prefix
    (setf p (or a p)                    ; set p to a (if nil (no numeric prefix) to 0)
          w (concatenate 'string        ; set w to the concatenation of prefix
             (subseq w 0 p)             ; characters from the previous word 
             (subseq g b)))             ; and the rest of the current line
    (format t"~a~%"w)))                 ; print the current word

Как обычно, длинные идентификаторы Common Lisp делают его не особенно подходящим для PPCG.

Renzo
источник
0

C # (интерактивный компилятор Visual C #) , 134 байта

a=>{int l=0,m,n;var p="";return a.Select(s=>{for(m=n=0;s[m]<58;n=n*10+s[m++]-48);return p=p.Substring(0,l=m>0?n:l)+s.Substring(m);});}

Попробуйте онлайн!

-9 байт благодаря @ASCIIOnly!

Менее гольф ...

// a is an input list of strings
a=>{
  // l: last prefix length
  // m: current number of digits
  // n: current prefix length
  int l=0,m,n;
  // previous word
  var p="";
  // run a LINQ select against the input
  // s is the current word
  return a.Select(s=>{
    // nibble digits from start of the
    // current word to build up the
    // current prefix length
    for(m=n=0;
      s[m]<58;
      n=n*10+s[m++]-48);
    // append the prefix from the
    // previous word to the current
    // word and capture values
    // for the next iteration
    return
      p=p.Substring(0,l=m>0?n:l)+
      s.Substring(m);
  });
}
Dana
источник
134?
Только для ASCII
Это довольно круто :) Я изменился l=n>0?n:lна, l=m>0?n:lпотому что это не было в том случае, если строка начиналась с нуля ( 0jkl). Спасибо за совет!
Дана
0

Scala , 226 129 102 байта

Спасибо @ ASCII-только за их работу здесь (и за Groovy ответ).

s=>{var(w,d,r)=("",0,"(\\d*)(.+)".r)
s map(_ match{case r(a,b)=>{if(a>"")d=a.toInt
w=w.take(d)+b}
w})}

Попробуйте онлайн!

В. Куртуа
источник
: | обе ссылки одинаковы
только ASCII
да, редактирование Я не знал, как это сделать, и спешил, поэтому я не изменил то, что сделал.
В. Куртуа
130
только ASCII
129
Только для ASCII,
127
только для ASCII,