За время работы с Windows я накопил большое количество сохраненных копий файловой системы и архивов системы и дисков с данными. Я пытаюсь отогнать их до полезных частей, отбрасывая все, что, вероятно, будет бесполезным.
От просмотра множества прокручиваемых файлов при повторном копировании с накопителя на рабочий диск, я думаю, у меня есть стартовый список «хороших» и «бесполезных» файлов, но мне было интересно, есть ли какой-нибудь авторитетный вид списка файлов (происходящих из ранее существовавшей среды Windows), который следует немедленно отбросить как ненужный?
Победители: (Я знаю, что этот список, скорее всего, превратится в беспорядок, если будут предприняты какие-либо усилия, чтобы сделать его всеобъемлющим, так что это не то, что я ищу, если только они не будут окружены дерьмом, которое может привести к их непреднамеренному уничтожению) ( редактировать: если ЕДИНСТВЕННЫЙ способ - это супер всеобъемлющий метод, основанный на белом списке, пусть так и будет. Я бы предпочел, чтобы это было не так, но нищие не могут быть выбирающими ... большую часть времени. )
*.tar.*, *.rar, *.zip
*.mp(e)g, *.avi, *.mkv, *.wmv, *.asf
Проигравшие: (Это то, что я действительно ищу)
*.exe, *.bat, *.dll, *.com, *.lnk
Я также знаю, что будут исключения. Как установочные файлы .exe, используемые для установки чего-либо в Wine. Для целей этого вопроса эта проблема не одна. Все файлы, о которых идет речь, являются копиями (копий, возможно, даже большего количества копий), поэтому установщики, которые я действительно хочу сохранить, где-то хороши, безопасны и, вероятно, защищены от записи.
Ответы:
Вероятно, самый простой способ отсеять мусор - это дата создания или последнего изменения (вам может потребоваться поэкспериментировать, чтобы определить, какой из них лучше) - просто используйте дату, когда система была установлена, в качестве отправной точки.
Согласно принципу Парето, простой фильтр, вероятно, даст вам 80% эффекта, который вы ищете.
(Конечно, вы можете или даже должны объединить этот список с черно-белыми списками, которые вы начали собирать.)
источник
find . -type f -mtime +572w -exec ls -l {} \;
просмотра выходных данных и, возможно, набора целевого времени отсечения, а затем использования -delete вместо -exec для массового удаления нежелательных сообщений. Затемfind . -empty -delete
следует удалить пустые каталоги и файлы. Затем с помощью выборочной очистки имени файла / расширения. Есть идеи получше?find
флаг здесь-newer
используется так:find /mnt/windowsfs \! -newer "/mnt/windowsfs/reference/filename" | xargs rm -f
Только вы знаете, что вам нужно / хотите сохранить. Однако вы можете в некоторой степени идентифицировать системные файлы Windows и другие установленные программные файлы.
Установите Windows и эти программы заново на виртуальной машине, затем составьте два списка всех имен файлов в виртуальной машине ;
В ВМ составьте первый список недавно установленной системы
dir /S /B /A-D C:\ >vmlist.1
В ВМ сделайте второй список системы после обновлений
dir /S /B /A-D C:\ >vmlist.2
Вернувшись в * nix, объедините эти два файла и удалите дубликаты строк.
sort -u vmlist.1 vmlist.2 >vmlist
Список теперь будет выглядеть так (но гораздо дольше, конечно):
C:\name with 6 special chars [$.^|]
C:\Windows\System32\asr_fmt.exe
C:\Windows\System32\asr_ldm.exe
C:\Windows\System32\asr_pfu.exe
Теперь преобразуйте список в
regex
шаблоны, подходящие дляgrep
sed -r 's/\\/\//g; s/[]$.^|[]/\\&/g; s/^[[:alpha:]]:/^.*/; s/$/$/' vmlist >vmlist.rex
Список регулярных выражений будет выглядеть следующим образом.
^.*/name with 6 special chars \[\$\.\^\|\]$
^.*/Windows/System32/asr_fmt\.exe$
^.*/Windows/System32/asr_ldm\.exe$
^.*/Windows/System32/asr_pfu\.exe$
Составьте список файлов, содержащихся в целевом каталоге архива
find '/my/archive/dir' -type f >arclist
Теперь создайте подсписок из
arclisl
файлов, которые соответствуют шаблонам регулярных выражений.<arclist grep -f vmlist.rex >arcmatches
arcmatches
содержит совпадающие файлы Windows. Проверьте их и удалите, когда вы удовлетворены тем, что видите. Вот команда удаления (удаления).<arcmatches xargs -d'\n' rm -v
источник
thumbs.db
Файл бесполезен на Unix-подобных системах, насколько я знаю.Это (вероятно, скрытый) файл, созданный для кэширования миниатюр изображений в системах Windows. Поскольку каждая папка с изображениями получает свою собственную
thumbs.db
при просмотре изображений папки, на вашем жестком диске может быть довольно много таких вещей, в зависимости от количества папок с изображениями.Я не знаю, как каждый * nix работает с миниатюрами, но, по крайней мере, в моем случае (Ubuntu / GNOME) все миниатюры по умолчанию хранятся в одном месте: в
.thumbnails/
папке в моем домашнем каталоге (и в подпапках, таких как.thumbnails/normal
и.thumbnails/large
). , Когда я перешел с Windows на Linux, я избавился от всех этихthumbs.db
файлов.источник
Список файлов Windows, которые бесполезны для Unix
меры
источник
В корневом каталоге C: /, pagefile.sys должен быть довольно большой файл, который вам больше не нужен.
В большинстве случаев весь Windows-Dir бесполезен - кроме как с эмулятором, виртуальной машиной.
Шрифты могут быть исключением (по крайней мере, * .ttf / * .TTF).
источник