Вычислить OEIS A005434

Задача состоит в том, чтобы как можно быстрее вычислить OEIS A005434 .

Рассмотрим двоичную строку Sдлины n. Индексируя с 1, мы можем определить, S[1..i+1]совпадают ли S[n-i..n]точно для всех iв порядке от 0до n-1. Например,

S = 01010

дает

[Y, N, Y, N, Y].

Это потому , что 0совпадает 0, 01не совпадает 10, 010совпадает 010, 0101не совпадает 1010 и, наконец, 01010соответствует самому себе.

Определите f(n)количество различных массивов Ys и Ns, получаемых при переборе всех 2^nвозможных битовых строк Sдлины n.

Наблюдатель заметит, что этот вопрос - более простой вариант другого моего недавнего вопроса . Тем не менее, я ожидаю, что умные трюки могут сделать это намного быстрее и проще.

задача

Для увеличения, nначиная с 1, ваш код должен выводить n, f(n).

Пример ответов

Для n = 1..24, правильные ответы:

1, 2, 3, 4, 6, 8, 10, 13, 17, 21, 27, 30, 37, 47, 57, 62, 75, 87, 102, 116, 135, 155, 180, 194

счет

Ваш код должен повторяться от n = 1предоставления ответа для каждого nпо очереди. Я рассчитываю весь пробег, убив его через две минуты.

Ваш результат - самый высокий nза это время.

В случае ничьей победит первый ответ.

Где будет проверяться мой код?

Я буду запускать ваш код в Virtualbox на гостевой виртуальной машине Lubuntu (на моем хосте Windows 7).

Мой ноутбук имеет 8 ГБ оперативной памяти и процессор Intel i7 5600U @ 2,6 ГГц (Broadwell) с 2 ядрами и 4 потоками. Набор команд включает SSE4.2, AVX, AVX2, FMA3 и TSX.

Ведущие записи по языку

п = 599 в Руст бу Андерс Касерорг.
n = 30 в С по Грими. Параллельная версия получает до 32 при запуске в Cygwin.

math.uni-bielefeld.de/~sillke/SEQUENCES/autocorrelation-range.c (связанный со страницей OEIS), запуск с -O3 может вычислять до 100 за <0,02 секунды на моем компьютере

vroomfondel

@rogaos О, дорогой. Я должен удалить вопрос, но у него уже есть ответ.

Я думаю, что это все еще крутая проблема - но, может быть, до 1000 вместо этого? Или спросите ответы на гольф достаточно быстрой программы

vroomfondel

@rogaos Я только что полностью убрал жесткий лимит.

Ответы:

Ржавчина , n ≈ 660

use std::collections::HashMap;
use std::iter::once;
use std::rc::Rc;

type Memo = HashMap<(u32, u32, Rc<Vec<u32>>), u64>;

fn f(memo: &mut Memo, mut n: u32, p: u32, mut s: Rc<Vec<u32>>) -> u64 {
    debug_assert!(p != 0);
    let d = n / p;
    debug_assert!(d >= 1);
    let r = n - p * if d >= 2 { d - 1 } else { 1 };

    let k = s.binary_search(&(n - r + 1)).unwrap_or_else(|i| i);
    for &i in &s[..k] {
        if i % p != 0 {
            return 0;
        }
    }

    if d >= 3 {
        let o = n - (p + r);
        n = p + r;
        s = Rc::new(s[k..].iter().map(|i| i - o).collect());
    } else if n == p {
        return 1;
    } else if k != 0 {
        s = Rc::new(s[k..].to_vec());
    }

    let query = (n, p, s);
    if let Some(&c) = memo.get(&query) {
        return c;
    }
    let (n, p, s) = query;

    let t = Rc::new(s.iter().map(|i| i - p).collect::<Vec<_>>());
    let c = if d < 2 {
        (1..r + 1).map(|q| f(memo, r, q, t.clone())).sum()
    } else if r == p {
        (1..p + 1)
            .filter(|&q| p % q != 0 || q == p)
            .map(|q| f(memo, r, q, t.clone()))
            .sum()
    } else {
        let t = match t.binary_search(&p) {
            Ok(_) => t,
            Err(k) => {
                Rc::new(t[..k]
                            .iter()
                            .cloned()
                            .chain(once(p))
                            .chain(t[k..].iter().cloned())
                            .collect::<Vec<_>>())
            }
        };
        (1..t.first().unwrap() + 1)
            .filter(|&q| p % q != 0 || q == p)
            .map(|q| f(memo, r, q, t.clone()))
            .sum()
    };
    memo.insert((n, p, s), c);
    c
}

fn main() {
    let mut memo = HashMap::new();
    let s = Rc::new(Vec::new());
    for n in 1.. {
        println!("{} {}",
                 n,
                 (1..n + 1)
                     .map(|p| f(&mut memo, n, p, s.clone()))
                     .sum::<u64>());
    }
}

Попробуйте онлайн!

Как это работает

Это запоминающаяся реализация рекурсивного предиката Ξ, приведенного в книге Лео Гибаса «Периоды в строках» (1981). Функция f(memo, n, p, s)находит количество корреляций длины nс наименьшим периодом, pа также каждый из периодов в наборе s.

Андерс Касеорг
источник

Заставляет задуматься, есть ли более быстрое решение другой связанной проблемы. Очень впечатляюще!

Интересно, что это полностью ограничено памятью. Он ускоряется до ~ 500, а затем внезапно замедляется, когда заканчивается ОЗУ.

Просто простой перебор, чтобы начать испытание:

#include <stdio.h>
#include <stdint.h>
#include <string.h>

typedef uint16_t u16;
typedef uint64_t u64;

static u64 map[1<<16];

int main(void)
{
    for (u64 n = 1;; ++n) {
        u64 result = 1;
        u64 mask = (1ul << n) - 1;
        memset(map, 0, sizeof(map));

        #pragma omp parallel
        #pragma omp for
        for (u64 x = 1ul << (n - 1); x < 1ul << n; ++x) {

            u64 r = 0;
            for (u64 i = 1; i < n; ++i)
                r |= (u64) (x >> i == (x & (mask >> i))) << i;
            if (!r)
                continue;

            u16 h = (u16) (r ^ r >> 13 ^ r >> 27);
            while (map[h] && map[h] != r)
                ++h;

            if (!map[h]) {
                #pragma omp critical
                if (!map[h]) {
                    map[h] = r;
                    ++result;
                }
            }
        }

        printf("%ld\n", result);
    }
}

Компилировать с clang -fopenmp -Weverything -O3 -march=native. На моей машине он достигает n = 34 за 2 минуты.

РЕДАКТИРОВАТЬ: посыпать некоторые директивы OMP для легкого параллелизма.

Grimmy
источник

@Lembik Существует ли хороший ответ за пределами SE для удаления? Разве вы не должны ждать, пока кто-то (возможно, комментатор) представит этот алгоритм в качестве ответа и примет этот ответ?

Grimmy

Вы делаете очень хорошее замечание

К сожалению, я не могу по-настоящему протестировать ваш параллельный код в virtualbox, так как у меня на процессоре всего два ядра.

Я запустил его в Cygwin, и он дошел до 32.