Почему массив [idx ++] + = «a» увеличивает idx один раз в Java 8, но в два раза в Java 9 и 10?

751

Для решения проблемы товарищ по гольфу написал следующий код :

import java.util.*;
public class Main {
  public static void main(String[] args) {
    int size = 3;
    String[] array = new String[size];
    Arrays.fill(array, "");
    for(int i = 0; i <= 100; ) {
      array[i++%size] += i + " ";
    }
    for(String element: array) {
      System.out.println(element);
    }
  }
}

При выполнении этого кода в Java 8 мы получаем следующий результат:

1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 91 94 97 100 
2 5 8 11 14 17 20 23 26 29 32 35 38 41 44 47 50 53 56 59 62 65 68 71 74 77 80 83 86 89 92 95 98 101 
3 6 9 12 15 18 21 24 27 30 33 36 39 42 45 48 51 54 57 60 63 66 69 72 75 78 81 84 87 90 93 96 99 

При выполнении этого кода в Java 10 мы получаем следующий результат:

2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 
2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 100 102 
2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 100 

При использовании Java 10 нумерация полностью отключена. Так что же здесь происходит? Это ошибка в Java 10?

Следите за комментариями:

  • Эта проблема возникает при компиляции с Java 9 или более поздней версии (мы нашли ее в Java 10). Компиляция этого кода на Java 8, затем запуск на Java 9 или более поздней версии, включая ранний доступ Java 11, дает ожидаемый результат.
  • Этот вид кода не является стандартным, но действителен в соответствии со спецификацией. Он был найден Кевином Круйссеном в ходе дискуссии о гольфе , поэтому возник странный случай использования.
  • Дидье Л обнаружил, что проблему можно воспроизвести с помощью гораздо меньшего и более понятного кода:

    class Main {
      public static void main(String[] args) {
        String[] array = { "" };
        array[test()] += "a";
      }
      static int test() {
        System.out.println("evaluated");
        return 0;
      }
    }
    

    Результат при компиляции в Java 8:

    evaluated

    Результат при компиляции в Java 9 и 10:

    evaluated
    evaluated
    
  • Проблема , как представляется, ограничивается конкатенацией и оператор присваивания ( +=) с выражением с побочным эффектом (ы) в качестве левого операнда, как и в array[test()]+="a", array[ix++]+="a", test()[index]+="a", или test().field+="a". Чтобы включить конкатенацию строк, по крайней мере одна из сторон должна иметь тип String. Попытка воспроизвести это на других типах или конструкциях не удалась.

Оливье Грегуар
источник
5
Комментарии не для расширенного обсуждения; этот разговор был перенесен в чат .
Самуэль Лью
13
@JollyJoker Ограничено +=применением косвенных Stringссылок. Итак, во-первых, ваш массив должен быть String[]. Проблема не возникает с int[], long[]и друзьями. Но да, ты в принципе прав!
Оливье Грегуар
2
@ OlivierGrégoire массив не должен быть String[]. Если это так, Object[]и вы делаете array[expression] += "foo";, это то же самое. Но да, это не относится к примитивным массивам, так как он должен быть в состоянии хранить ссылки типа String( Object[], CharSequence[], Comparable[]...), чтобы сохранить результат конкатенации.
Хольгер
30
Этому был присвоен идентификатор ошибки JDK-8204322 .
Стюарт Маркс
1
@StuartMarks спасибо! Это было включено в ответ: я действительно хотел, чтобы вопрос оставался вопросом о том, нормально это или ошибка. Тем не менее, мы могли бы более точно указать идентификатор ошибки в ответе. Я адаптирую это прямо сейчас.
Оливье Грегуар

Ответы:

625

Это ошибка при javacзапуске из JDK 9 (которая внесла некоторые изменения в отношении конкатенации строк, что, как я подозреваю, является частью проблемы), что было подтверждено javacкомандой под идентификатором ошибки JDK-8204322 . Если вы посмотрите на соответствующий байт-код для строки:

array[i++%size] += i + " ";

Это:

  21: aload_2
  22: iload_3
  23: iinc          3, 1
  26: iload_1
  27: irem
  28: aload_2
  29: iload_3
  30: iinc          3, 1
  33: iload_1
  34: irem
  35: aaload
  36: iload_3
  37: invokedynamic #5,  0 // makeConcatWithConstants:(Ljava/lang/String;I)Ljava/lang/String;
  42: aastore

Где последний aaloadфактическая загрузка из массива. Тем не менее, часть

  21: aload_2             // load the array reference
  22: iload_3             // load 'i'
  23: iinc          3, 1  // increment 'i' (doesn't affect the loaded value)
  26: iload_1             // load 'size'
  27: irem                // compute the remainder

Что примерно соответствует выражению array[i++%size](минус фактическая загрузка и сохранение), там дважды. Это неверно, как сказано в спецификации в jls-15.26.2 :

Выражение присваивания соединения формы E1 op= E2эквивалентно E1 = (T) ((E1) op (E2)), где Tэто тип E1, за исключением того, что E1вычисляется только один раз.

Таким образом, для выражения array[i++%size] += i + " ";часть array[i++%size]должна оцениваться только один раз. Но это оценивается дважды (один раз для загрузки и один раз для магазина).

Так что да, это ошибка.


Некоторые обновления:

Ошибка исправлена ​​в JDK 11, и будет обратный порт для JDK 10 (но не JDK 9, поскольку он больше не получает публичные обновления ).

Алексей Шипилев упоминает на странице JBS (и @DidierL в комментариях здесь):

Обходной путь: компилировать с -XDstringConcat=inline

Это вернется к использованию, StringBuilderчтобы сделать конкатенацию, и не имеет ошибки.

Йорн Верни
источник
34
Кстати, это относится ко всему левому выражению, а не только к индексу, обеспечивающему подвыражение. Это выражение может быть сколь угодно сложным. Смотрите, например IntStream.range(0, 10) .peek(System.out::println).boxed().toArray()[0] += "";...
Хольгер
9
@Holger Левая часть даже не должна включать массивы, проблема также возникает с простой test().field += "sth".
Дидье Л
44
Не то, чтобы это имело значение, поведение в любом случае ужасно нарушено, но первая оценка - для магазина, а вторая - для загрузки, так что array[index++] += "x";будем читать array[index+1]и писать в array[index]
Хольгер
5
@TheCoder Да, я так думаю. JDK 9 не является релизом долгосрочной поддержки (LTS). JDK 8 был, а следующий выпуск LTS - JDK 11. См. Здесь: oracle.com/technetwork/java/javase/eol-135779.html Обратите внимание, что публичные обновления JDK 9 закончились в марте.
Йорн Верни
15
На JDK-8204322 Алексей Шипилев предложил скомпилировать -XDstringConcat=inlineв качестве обходного пути для тех, кому это нужно.
Дидье Л