Итак, у меня есть этот дамп в Википедии размером около 10 ГБ и названный «enwiki-latest-pages-article.xml.bz2». Я пытался следующие команды в терминале, чтобы распаковать дамп:
tar jxf enwiki-latest-pages-articles.xml.bz2
А также
tar xvf enwiki-latest-pages-articles.xml.bz2
Но оба они возвращают следующую ошибку
tar: This does not look like a tar archive
tar: Skipping to next header
command-line
tar
bzip2
Арун Мохан
источник
источник
7z
util для извлечения всегоОтветы:
Вы не можете использовать
tar
команду, потому что архив не является файлом .tar. *. Чтобы распаковать файл bzip2, используйте следующую команду (это не сохранит оригинальный файл .bz2):Если вы хотите извлечь его и сохранить оригинал, выполните эту команду:
Источник: https://superuser.com/questions/480950/how-to-decompress-a-bz2-file
источник
bunzip2
.Просто используйте
bunzip2
:И если это
gzip
сжатый файл:источник