Удалить некоторые биты и считать

26

Рассмотрим все 2^nразные двоичные строки длины nи предположим n > 2. Вам разрешено удалять ровно b < n/2биты из каждой двоичной строки, оставляя строки с n-bоставшейся длиной . Количество оставшихся отдельных строк зависит от того, какие биты вы удаляете. Предполагая, что ваша цель состоит в том, чтобы оставить как можно меньше оставшихся различных строк, эта задача состоит в том, чтобы написать код, чтобы вычислить, как мало вы можете оставить как функцию n.

Пример n=3и b = 1. Вы можете оставить только две строки 11и 00.

Ибо n=9и b = 1,2,3,4у нас есть70,18,6,2

Ибо n=8и b = 1,2,3у нас есть40,10,4

Ибо n=7и b = 1,2,3у нас есть20,6,2

Ибо n=6и b = 1,2у нас есть12,4

Ибо n=5и b = 1,2у нас есть6,2

Этот вопрос был изначально задан мной в 2014 году в другой форме на МО .

Вход и выход

Ваш код должен принимать целое число nи выводить одно целое число для каждого значения, bначиная с b = 0и увеличивая.

Гол

Ваш результат является самым большим, nза который ваш код завершается за все b < n/2меньше чем за минуту на моем ПК на базе Linux. В случае разрыва связи, самый большой bваш код получает для совместных самых больших nпобед. В случае разрыва связи по этому критерию, самый быстрый код для самых больших значений nи bрешает. Если время находится в пределах секунды или двух друг от друга, выигрывает первый опубликованный ответ.

Языки и библиотеки

Вы можете использовать любой язык библиотеки, который вам нравится. Поскольку я должен запустить ваш код, было бы полезно, если бы он был бесплатным (как в пиве) и работал в Linux.

Ануш
источник
Я предполагаю в b > 0качестве дополнительного ввода-требования? Или бы n=3и b=0просто выход в 2^nкачестве результата?
Кевин Круйссен
@KevinCruijssen Это должно 2^nдействительно выводить .
Anush
Кроме того, вы говорите, что ввод - одиночный nи одиночный b, но счет является наибольшим, nдля которого код завершает все b < n/2в течение минуты. Разве не было бы лучше иметь один вход nв этом случае и выводить все результаты для 0 <= b < n/2? Или мы должны обеспечить две программы / функции: один принимает два входа nи b, и один принимает только ввод nи вывод всех результатов в диапазоне 0 <= b < n/2?
Кевин Круйссен
2
Ну, я уже проголосовал за твой вызов, поэтому не могу сделать это снова. :) Хотя я понятия не имею, как рассчитать это эффективно (эффективные алгоритмы O были чем-то, в чем я всегда был плох ... и одним из немногих предметов в ИТ-колледже, который мне приходилось переделывать пару раз), похоже, что очень интересный вызов Мне любопытно посмотреть, какие ответы придут люди.
Кевин Круйссен
2
Есть ли рабочий пример? Было бы неплохо начать как с точки зрения правильности, так и для сравнения скорости.
maxb

Ответы:

6

Python 2.7 / Gurobi n = 9

Это решение - очень прямое использование решения Gurobi ILP для булевых задач со смешанными целыми числами (MIP).

Единственная хитрость заключается в том, чтобы убрать симметрию в дополнении 1, чтобы уменьшить размеры задачи вдвое.

Используя ограниченную по времени «бесплатную» лицензию Gurobi LLC, мы ограничены 2000 ограничениями, но решение 10 дел 1 в любом случае выходит за рамки 60-секундного ограничения на моем ноутбуке.

from gurobipy import *
from itertools import combinations

def mincover(n,d):
    bs = pow(2,n-1-d)
    m = Model()
    m.Params.outputFlag = 0
    b = {}
    for i in range(bs):
      b[i] = m.addVar(vtype=GRB.BINARY, name="b%d" % i)
    m.update()
    for row in range(pow(2,n-1)):
      x = {}
      for i in combinations(range(n), n-d):
        v = 0
        for j in range(n-d):
          if row & pow(2,i[j]):
            v += pow(2,j)
        if v >= bs:
          v = 2*bs-1-v
        x[v] = 1
      m.addConstr(quicksum(b[i] for i in x.keys()) >= 1)
    m.setObjective(quicksum(b[i] for i in range(bs) ), GRB.MINIMIZE)
    m.optimize()
    return int(round(2*m.objVal,0))

for n in range(4,10):
    for d in range((n//2)+1):
        print n, d, mincover(n,d)

UPDATE + CORR: 10,2 имеет оптимальный размер решения 31 (см., Например, Гуроби показывает, что симметричное решение размера 30 не существует (возвращает проблему неосуществимой) .. [моя попытка показать асимметричную выполнимость при 30 осталась неубедительной после 9,5 часов работы], например шаблоны целых чисел 0 7 13 14 25 28 35 36 49 56 63 64 95 106 118 128 147 159 170 182 195 196 200 207 225 231 240 243 249 252 255или0 7 13 14 19 25 28 35 36 49 56 63 64 95 106 118 128 159 170 182 195 196 200 207 225 231 240 243 249 252 255

jayprich
источник
Вы побили рекорд «самая быстрая заявленная бесконечная награда»?
user202729
Я не вижу здесь щедрости, что ты имеешь в виду?
апреля 18
@ user202729 Да .. Я установил слишком низко. Я должен был установить его на n = 10 :)
Anush
На самом деле решить его при n = 9 не так уж и просто. Вот почему OP использует существующую библиотеку (которая должна быть лучше, чем рукописное решение, как у меня).
user202729
1
Благодаря @ChristianSievers я вижу, что МО утверждает, что 10,2 имеет только асимметричные оптимумы, которые я не могу ни опровергнуть, ни проверить. Если я уберу ярлык предположения симметрии, который работает до n = 9, то оказывается, что Гуроби все еще может решить до n = 9 за требуемое время.
Джайприч
3

C ++, n = 6

Грубая сила с некоторыми небольшими оптимизациями.

#include<cassert>
#include<iostream>
#include<vector>

// ===========
/** Helper struct to print binary representation.
`std::cout<<bin(str,len)` prints (str:len) == the bitstring 
represented by last (len) bits of (str).
*/
struct bin{
    int str,len;
    bin(int str,int len):str(str),len(len){}
};
std::ostream& operator<<(std::ostream& str,bin a){
    if(a.len)
        return str<<bin(a.str>>1,a.len-1)<<char('0'+(a.str&1));
    else if(a.str)
        return str<<"...";
    else
        return str;
}
// ===========

/// A patten of (len) bits of ones.
int constexpr pat1(int len){
    return (1<<len)-1;
}

// TODO benchmark: make (res) global variable?

/**Append all distinct (subseqs+(sfx:sfxlen)) of (str:len) 
with length (sublen) to (res).
*/
void subseqs_(
    int str,int len,int sublen,
    int sfx,int sfxlen,
    std::vector<int>& res
){
    // std::cout<<"subseqs_ : str = "<<bin(str,len)<<", "
    // "sublen = "<<sublen<<", sfx = "<<bin(sfx,sfxlen)<<'\n';

    assert(len>=0);

    if(sublen==0){ // todo remove some branches can improve perf?
        res.push_back(sfx);
        return;
    }else if(sublen==len){
        res.push_back(str<<sfxlen|sfx);
        return;
    }else if(sublen>len){
        return;
    }

    if(str==0){
        res.push_back(sfx);
        return;
    }

    int nTrail0=0;
    for(int ncut;str&&nTrail0<sublen;

        ++nTrail0,
        ncut=__builtin_ctz(~str)+1, // cut away a bit'0' of str
        // plus some '1' bits
        str>>=ncut,
        len-=ncut
    ){
        ncut=__builtin_ctz(str)+1; // cut away a bit'1' of str
        subseqs_(str>>ncut,len-ncut,sublen-nTrail0-1,
            sfx|1<<(sfxlen+nTrail0),sfxlen+nTrail0+1,
            res
        ); // (sublen+sfxlen) is const. TODO global var?
    }

    if(nTrail0+len>=sublen) // this cannot happen if len<0
        res.push_back(sfx);
}

std::vector<int> subseqs(int str,int len,int sublen){
    assert(sublen<=len);
    std::vector<int> res;
    if(__builtin_popcount(str)*2>len){ // too many '1's, flip [todo benchmark]
        subseqs_(pat1(len)^str,len,sublen,0,0,res);
        int const p1sublen=pat1(sublen);
        for(int& r:res)r^=p1sublen;
    }else{
        subseqs_(str,len,sublen,0,0,res);
    }
    return res;
}

// ==========

/** Append all distinct (supersequences+(sfx:sfxlen)) of (str:len)
with length (suplen) to (res).
Define (a) to be a "supersequence" of (b) iff (b) is a subsequence of (a).
*/
void supseqs_(
    int str,int len,int suplen,
    int sfx,int sfxlen,
    std::vector<int>& res
){
    assert(suplen>=len);

    if(suplen==0){
        res.push_back(sfx);
        return;
    }else if(suplen==len){
        res.push_back(str<<sfxlen|sfx);
        return;
    }

    int nTrail0; // of (str)
    if(str==0){
        res.push_back(sfx);
        // it's possible that the supersequence is '0000..00'
        nTrail0=len;
    }else{
        // str != 0 -> str contains a '1' bit ->
        // supersequence cannot be '0000..00'
        nTrail0=__builtin_ctz(str);
    }
    // todo try `nTrail0=__builtin_ctz(str|1<<len)`, eliminates a branch
    // and conditional statement

    for(int nsupTrail0=0;nsupTrail0<nTrail0;++nsupTrail0){
        // (nsupTrail0+1) last bits of supersequence matches with 
        // nsupTrail0 last bits of str.
        supseqs_(str>>nsupTrail0,len-nsupTrail0,suplen-1-nsupTrail0,
            sfx|1<<(nsupTrail0+sfxlen),sfxlen+nsupTrail0+1,
            res);
    }

    int const strMatch=str?nTrail0+1:len; 
    // either '1000..00' or (in case str is '0000..00') the whole (str)

    for(int nsupTrail0=suplen+strMatch-len;nsupTrail0-->nTrail0;){
        // because (len-strMatch)<=(suplen-1-nsupTrail0),
        // (nsupTrail0<suplen+strMatch-len).

        // (nsupTrail0+1) last bits of supersequence matches with
        // (strMatch) last bits of str.
        supseqs_(str>>strMatch,len-strMatch,suplen-1-nsupTrail0,
            sfx|1<<(nsupTrail0+sfxlen),sfxlen+nsupTrail0+1,
            res);
    }

    // todo try pulling constants out of loops
}

// ==========

int n,b;
std::vector<char> done;
unsigned min_undone=0;

int result;
void backtrack(int nchoice){
    assert(!done[min_undone]);
    ++nchoice;
    std::vector<int> supers_s;
    for(int s:subseqs(min_undone,n,n-b)){
        // obviously (s) is not chosen. Try choosing (s)
        supers_s.clear();
        supseqs_(s,n-b,n,0,0,supers_s);
        for(unsigned i=0;i<supers_s.size();){
            int& x=supers_s[i];
            if(!done[x]){
                done[x]=true;
                ++i;
            }else{
                x=supers_s.back();
                supers_s.pop_back();
            }
        }

        unsigned old_min_undone=min_undone;
        while(true){
            if(min_undone==done.size()){
                // found !!!!
                result=std::min(result,nchoice);
                goto label1;
            }
            if(not done[min_undone])
                break;
            ++min_undone;
        }
        if(nchoice==result){
            // backtrack more will only give worse result
            goto label1;
        }

        // note that nchoice is already incremented
        backtrack(nchoice);

        label1: // undoes the effect of (above)
        for(int x:supers_s)
            done[x]=false;
        min_undone=old_min_undone;
    }
}

int main(){
    std::cin>>n>>b;

    done.resize(1<<n,0);
    result=1<<(n-b); // the actual result must be less than that

    backtrack(0);
    std::cout<<result<<'\n';
}

Запустите локально:

[user202729@archlinux golf]$ g++ -std=c++17 -O2 delbits.cpp -o delbits
[user202729@archlinux golf]$ time for i in $(seq 1 3); do ./delbits <<< "6 $i"; done
12
4
2

real    0m0.567s
user    0m0.562s
sys     0m0.003s
[user202729@archlinux golf]$ time ./delbits <<< '7 1'
^C

real    4m7.928s
user    4m7.388s
sys     0m0.173s
[user202729@archlinux golf]$ time for i in $(seq 2 3); do ./delbits <<< "7 $i"; done
6
2

real    0m0.040s
user    0m0.031s
sys     0m0.009s
user202729
источник
1
Главным образом, чтобы побудить других опубликовать свой код, если он быстрее, чем мой.
user202729
Пожалуйста? ... (примечание: это пример проблемы с набором обложек.)
user202729
1
Я работаю над этим. Я просто не могу придумать какой-нибудь умный способ сделать это. Если никто не отправит ответ, я поставлю мой, который пока может достигать только n = 4.
mypetlion