Распараллеливание цикла for

9

Я хочу распараллелить forциклы следующего кода. Как это сделать?

#!/bin/bash
N=$1 
n=$2
for (( i=1; i<=$N; i++ )); do
  min=100000000000000  //set min to some garbage value
  for (( j=1; j<=$n; j++ )); do
    val=$(/path/to/a.out)
    val2=`echo $val | bc`  

      if (( $val2 < $min )); then
        min=$val2; 
      fi
  done
  arr=("${arr[@]}" "$min")
done
Ричард Уильямс
источник
возможный дубликат GNU Parallel
Жиль "ТАК - перестань быть злым"
Смотрите также Четыре задания параллельно ... как мне это сделать?
Жиль "ТАК - перестать быть злым"

Ответы:

10
#!/bin/bash
# set -x # debug version
N=${1:-123}
n=${2:-45}
workers=${workers:-${3:-10}}
((workers < 1)) && ((workers = 1))
((workers > 20)) && ((workers = 20))

((min=100000000000000))  #set min to some garbage value

work() {
  for i in ${*}; do
    for (( j=1; j<=${n}; j++ )); do
      val=$(/path/to/a.out)
      val2=$(echo ${val} | bc)
      (( val2 < min )) && (( min = val2 ));
    done
    echo ${min}
    # # debug version
    # echo ${i} ${j} ${min}
  done
}

# --
arr=($(
  seq ${N} | xargs -n$[N/workers + 1] | while read i; do
    work ${i} &
  done
  wait
))
echo ${arr[*]}
# --

# # debug version
# seq ${N} | xargs -t -n$[N/workers + 1] | while read i; do
#  work ${i} &
# done
# wait

Всегда используйте рабочих при порождении параметризованного числа процессов и ограничивайте максимальное количество рабочих, которые могут появиться .

xargs -n | while read это простой способ перебора списков в пакетном режиме.

  • seq создает список чисел от 1 до N.
  • xargs -n разбивает этот список на н / работников + 1 пакет.
    • например, N = 100 работников = 10 будет производить 10 строк до 11 чисел от 1 до 100.
  • while read i читает каждую строку чисел.
  • work ${i} &просто вызывает workфункцию с ${i}партией чисел.

Для отладки я добавил закомментированный код отладки. Просто замените его echoна отладочную версию, а код - # --на отладочную версию, и вы увидите, как он работает в пакетном режиме. Раскомментируйте set -xболее подробный отладочный вывод, который вы можете перенаправить в файл.

Просто запустите отладочную версию с другими параметрами, чтобы посмотреть, как она работает:

parallel.sh 223 5 1
parallel.sh 223 5 5
parallel.sh 223 5 10
parallel.sh 223 5 20

Отказ от ответственности: этот код не синхронизирует minзначение между рабочими процессами. Получение минимального значения не является ужасным упражнением. Это, вероятно, сделает:

parallel.sh 223 5 20 | tr ' ' '\n' | sort -n | head -1

Или просто добавьте то же самое в сам скрипт:

echo ${arr[*]} | tr ' ' '\n' | sort -n | head -1
nicerobot
источник
Можете ли вы объяснить код? Мне не понятно, как вы использовали рабочие потоки здесь.
Ричард Уильямс
@prasenjit Готово. Я надеюсь, что это полезно.
nicerobot
8

Используя GNU Parallel:

#!/bin/bash

N=$1
n=$2

arr=($(
# Generate all combinations of 1..n and 1..N
parallel -k --tag /path/to/a.out {1} {2} '|' bc :::: <(seq $N) <(seq $n) |
  perl -ane 'BEGIN{$min=1e30} $last||=$F[0]; if($F[0] != $last) {print $min,"\n";$min=1e30;$last=$F[0]} $min = $F[2]<$min ? $F[2] : $min; END {print $min,"\n"}'
))
echo ${arr[*]}

Это будет работать /path/to/a.outна каждом процессоре. Вывод будет выглядеть так:

1 1 19269
1 2 6158
1 3 2794
1 4 25104
2 1 13160
2 2 32683
2 3 12535
2 4 15197
3 1 8228
3 2 7673
3 3 8428
3 4 24463

Скрипт perl просматривает первый столбец и находит минимум в 3-м столбце с таким же первым столбцом.

Вы можете установить GNU Parallel просто:

wget http://git.savannah.gnu.org/cgit/parallel.git/plain/src/parallel
chmod 755 parallel

Посмотрите вступительные видео, чтобы узнать больше: https://www.youtube.com/playlist?list=PL284C9FF2488BC6D1

Оле Танге
источник
Ссылка в вашем последнем абзаце ссылается на страницу в фейсбуке, которая сообщает посетителю, что он выиграл эксклюзивный подарок (реклама или мошенничество). Там нет видео. Вы должны удалить это.
Марко