Какие файлы, связанные с Windows, бесполезны для пользователей * nix?

10

За время работы с Windows я накопил большое количество сохраненных копий файловой системы и архивов системы и дисков с данными. Я пытаюсь отогнать их до полезных частей, отбрасывая все, что, вероятно, будет бесполезным.

От просмотра множества прокручиваемых файлов при повторном копировании с накопителя на рабочий диск, я думаю, у меня есть стартовый список «хороших» и «бесполезных» файлов, но мне было интересно, есть ли какой-нибудь авторитетный вид списка файлов (происходящих из ранее существовавшей среды Windows), который следует немедленно отбросить как ненужный?

Победители: (Я знаю, что этот список, скорее всего, превратится в беспорядок, если будут предприняты какие-либо усилия, чтобы сделать его всеобъемлющим, так что это не то, что я ищу, если только они не будут окружены дерьмом, которое может привести к их непреднамеренному уничтожению) ( редактировать: если ЕДИНСТВЕННЫЙ способ - это супер всеобъемлющий метод, основанный на белом списке, пусть так и будет. Я бы предпочел, чтобы это было не так, но нищие не могут быть выбирающими ... большую часть времени. )

*.tar.*, *.rar, *.zip
*.mp(e)g, *.avi, *.mkv, *.wmv, *.asf

Проигравшие: (Это то, что я действительно ищу)

*.exe, *.bat, *.dll, *.com, *.lnk

Я также знаю, что будут исключения. Как установочные файлы .exe, используемые для установки чего-либо в Wine. Для целей этого вопроса эта проблема не одна. Все файлы, о которых идет речь, являются копиями (копий, возможно, даже большего количества копий), поэтому установщики, которые я действительно хочу сохранить, где-то хороши, безопасны и, вероятно, защищены от записи.

killermist
источник
6
Почему вы делаете это по расширению? Разве не должно храниться почти все в вашей пользовательской папке, а все вне ее?
Майкл Мрозек
Не пользуясь Windows в течение некоторого времени, я не знаю, какие каталоги бесполезны, и, кроме того, использовав нестандартные каталоги для хранения вещей, таких как размещение файлов в Program Files или скрытых в каталоге Windows, я не надену Не сбрасывайте со счетов те места, где могут скрываться драгоценные камни. Я знаю, что некоторые файлы, как правило, имеют более высокую врожденную ценность, чем другие, поэтому я пытаюсь подойти к этому с «долгого пути».
убийца
Я спросил SU о миграции, но они не были заинтересованы . Я не уверен, что кто-то делал такой список; Я всегда просто держал определенные папки, а не определенные типы файлов
Майкл Мрозек
@MichaelMrozek Я ценю этот вопрос. Будут ли они расстроены, если я все равно выложу это? Или это просто расстроило бы вещи? Или он (возможно, дополнительно) будет помечен / закрыт как не по теме и / или не годный для подбора?
убийца
Наверное; если они не хотели, чтобы он был перенесен, это было потому, что он не очень подходит
Майкл Мрозек

Ответы:

3

Вероятно, самый простой способ отсеять мусор - это дата создания или последнего изменения (вам может потребоваться поэкспериментировать, чтобы определить, какой из них лучше) - просто используйте дату, когда система была установлена, в качестве отправной точки.

Согласно принципу Парето, простой фильтр, вероятно, даст вам 80% эффекта, который вы ищете.

(Конечно, вы можете или даже должны объединить этот список с черно-белыми списками, которые вы начали собирать.)

Александр Щебликин
источник
Кажется, это основа хорошей идеи. Большинство файлов ОС сохраняют дату своего изменения / создания с момента, когда они были впервые сохранены на CD или упакованы в архив обновления.
убийца
У вас есть рекомендуемая команда поиска для этого? То, что я нашел, может показаться хорошим началом для find . -type f -mtime +572w -exec ls -l {} \; просмотра выходных данных и, возможно, набора целевого времени отсечения, а затем использования -delete вместо -exec для массового удаления нежелательных сообщений. Затем find . -empty -deleteследует удалить пустые каталоги и файлы. Затем с помощью выборочной очистки имени файла / расширения. Есть идеи получше?
убийца
Один полезный findфлаг здесь -newerиспользуется так:find /mnt/windowsfs \! -newer "/mnt/windowsfs/reference/filename" | xargs rm -f
Александр Щебликин
8

Только вы знаете, что вам нужно / хотите сохранить. Однако вы можете в некоторой степени идентифицировать системные файлы Windows и другие установленные программные файлы.

Установите Windows и эти программы заново на виртуальной машине, затем составьте два списка всех имен файлов в виртуальной машине ;

  1. В ВМ составьте первый список недавно установленной системы

      dir /S /B /A-D C:\ >vmlist.1

  2. В ВМ сделайте второй список системы после обновлений

      dir /S /B /A-D C:\ >vmlist.2  

  3. Вернувшись в * nix, объедините эти два файла и удалите дубликаты строк.

      sort -u vmlist.1 vmlist.2 >vmlist  

  4. Список теперь будет выглядеть так (но гораздо дольше, конечно):

      C:\name with 6 special chars [$.^|]
      C:\Windows\System32\asr_fmt.exe
      C:\Windows\System32\asr_ldm.exe
      C:\Windows\System32\asr_pfu.exe
     

  5. Теперь преобразуйте список в regexшаблоны, подходящие дляgrep

    sed -r 's/\\/\//g; s/[]$.^|[]/\\&/g; s/^[[:alpha:]]:/^.*/; s/$/$/' vmlist >vmlist.rex

  6. Список регулярных выражений будет выглядеть следующим образом.

      ^.*/name with 6 special chars \[\$\.\^\|\]$
      ^.*/Windows/System32/asr_fmt\.exe$
      ^.*/Windows/System32/asr_ldm\.exe$
      ^.*/Windows/System32/asr_pfu\.exe$

  7. Составьте список файлов, содержащихся в целевом каталоге архива

      find '/my/archive/dir' -type f >arclist

  8. Теперь создайте подсписок из arclislфайлов, которые соответствуют шаблонам регулярных выражений.

      <arclist grep -f vmlist.rex >arcmatches  

  9. arcmatchesсодержит совпадающие файлы Windows. Проверьте их и удалите, когда вы удовлетворены тем, что видите. Вот команда удаления (удаления).

      <arcmatches xargs -d'\n' rm -v


Peter.O
источник
Хотя это демонстрирует изощренность в «удалении окон из архивов», в данном случае это будет нецелесообразно (в лучшем случае), поскольку некоторым из них более десяти лет, и версию используемых окон будет трудно определить, если таковые имеются. совсем. Изящество было бы неплохо, если бы это было возможно, но я думаю, что, когда я прохожу это, это будет грубая сила, которая в конечном итоге правит днем ​​(днями).
убийца
Возможно ли, что какой-то бесстрашный человек (или множественное число) сел и создал опубликованные версии vmlist для Win95 до текущей версии (возможно, сможет остановиться на WinXP, не уверен ...)?
убийца
Если вы хотите пойти по этому пути, вот список виртуальных машин, предлагаемых Microsoft, включая XP, Vista и 7.
phunehehe
3

thumbs.dbФайл бесполезен на Unix-подобных системах, насколько я знаю.

Это (вероятно, скрытый) файл, созданный для кэширования миниатюр изображений в системах Windows. Поскольку каждая папка с изображениями получает свою собственную thumbs.dbпри просмотре изображений папки, на вашем жестком диске может быть довольно много таких вещей, в зависимости от количества папок с изображениями.

Я не знаю, как каждый * nix работает с миниатюрами, но, по крайней мере, в моем случае (Ubuntu / GNOME) все миниатюры по умолчанию хранятся в одном месте: в .thumbnails/папке в моем домашнем каталоге (и в подпапках, таких как .thumbnails/normalи .thumbnails/large). , Когда я перешел с Windows на Linux, я избавился от всех этих thumbs.dbфайлов.

Анжу Фабулина
источник
1

Список файлов Windows, которые бесполезны для Unix

  • Thumbs.db, ehthumbs.db, ehthumbs_vista.db
  • * .ini пример, desktop.ini
  • * .dll - обозначает библиотеку динамических ссылок. Каждое программное обеспечение использует и нуждается в этих файлах для запуска. Эти файлы могут вызвать много проблем, особенно если вы удалите антивирусное программное обеспечение, а затем установите другое.
  • * .sys пример, C: /pagefile.sys
  • * .old - файлы с этим расширением обычно остаются антивирусными программами специально для старых определений и т. д.
  • * .bak– файлы резервных копий, сгенерированные антивирусным или системным программным обеспечением при проверке жесткого диска.
  • Также эти расширения * .tmp, * .temp * .chk * .gid * .nch, * WBK - , * .fts, * .ftg, *. $$$ * .err, * .-, . ~ , ~ . *. ?? $, *. _ , *. ~ mp, * ._ mp, * .prv, * .sik, CHKLIST.MS, * .ilk, * .aps, * .mcp, * .pch, *. $ db, *.? $ ?, *. ?? ~, *.? ~ ?, * .db $, *. ^, * ._ dd, * ._ detmp, 0 * .nch, chklist. *, mscreate.dir, * .diz, * .syd, * .grp, * .cnt, *. ~ mp
  • неработающие ярлыки - Иногда при удалении программы с добавлением / удалением по умолчанию она оставляет ярлыки для этой программы.
  • старые мини-дампы - это мини-дампы файлов, которые регистрируются окнами, когда система имеет синий экран.

меры

  • Если уже в Windows (Запустите инструмент дефрагментации и инструмент cleanmgr). Это удалит много ненужных файлов.
  • Удалите те файлы, которые не нужны в Unix.
Г-н Махбубур Рахман
источник
0
C:/pagefile.sys

В корневом каталоге C: /, pagefile.sys должен быть довольно большой файл, который вам больше не нужен.

В большинстве случаев весь Windows-Dir бесполезен - кроме как с эмулятором, виртуальной машиной.

Шрифты могут быть исключением (по крайней мере, * .ttf / * .TTF).

неизвестный пользователь
источник
Pagefile был одной из первых целей. Каталог Windows часто является хорошей целью, если только пользователи не используют его для скрытия файлов в ... что иногда бывает и не может быть сброшено со счетов. Шрифты являются хорошей целью для сохранения, но могут быть обременены лицензией.
убийца
1
@killermist: Хорошо - если у вас есть лицензия Windows, вам разрешено использовать шрифты. Если нет, то нет.
пользователь неизвестен