Переписать историю мерзавцев, чтобы заменить все CRLF на LF?

32

Я собираюсь перенести частный репозиторий Git из win32 box в Ubuntu. Хотя я могу сделать окончательный коммит dos2unix, но я бы хотел переписать всю историю, поэтому некоторые графические интерфейсы Git будут отображать log / diff правильно. Например, gitg вставит пустые строки для каждого CR / LF.

Xiè Jìléi
источник

Ответы:

25

Вы можете использовать git filter-branchдля этого, с --tree-filterопцией, и указав --allдля ветви.

Вот пример (начатый в пустой директории с текстовым файлом типа Unix:

Приготовление:

$ hexdump -C testfile 
00000000  61 0d 0a 62 0d 0a 63 0d  0a                       |a..b..c..|
00000009

$ git init
Initialized empty Git repository in /home/seigneur/tmp/a/.git/

$ git add testfile && git commit -m "dos file checked in"
[master (root-commit) df4970f] dos file checked in
 1 files changed, 3 insertions(+), 0 deletions(-)
 create mode 100644 testfile

Команда:

$ git filter-branch --tree-filter 'git ls-files -z | xargs -0 dos2unix' -- --all

Выход:

Rewrite df4970f63e3196216d5986463f239e51eebb4014 (1/1)dos2unix: converting file testfile to Unix format ...

Ref 'refs/heads/master' was rewritten

$ hexdump -C testfile 
00000000  61 0a 62 0a 63 0a                                 |a.b.c.|
00000006

Я настоятельно рекомендую сделать полное резервное копирование заранее . Выполнение этого с вашей машины Linux (если у вас не установлена ​​хорошая оболочка в вашей среде Windows), возможно, проще.

Редактировать: конверсия была изменена в первый раз.

Мат
источник
1
Спасибо, этот пост мне очень помог. У меня было несколько файлов с пробелами в имени, немного изменение оригинальной команды зафиксировал его: git filter-branch --tree-filter 'git ls-files -z | xargs -0 dos2unix' -- --all. Флаги -zи -0скажите git ls-filesи xargsраспечатать и интерпретировать nullкак конец строки.
Иван
Другая альтернатива команде dos2unix - полагаться на сам git:git filter-branch --prune-empty --tree-filter 'git add --renormalize .' -- --all
Vilmantas Baranauskas
6

Ответ Мэта прибил проблему прямо на голову. К сожалению, в Ubuntu Linux, начиная с версии 10.04 (Lucid Lynx), команды dos2unix / unix2dos больше не доступны и были заменены на fromdos / todos. Кроме того, оба набора команд преобразования имеют различную степень незнания о существовании двоичных файлов, поэтому, если ваш репозиторий содержит изображения, шрифты и т. Д., Они будут испорчены этим процессом.

Мне удалось найти обходной путь для проблемы повреждения двоичных файлов, которая использует команду Linux file для правильной идентификации и обработки только текстовых файлов, как показано ниже. В приведенной ниже команде используется параметр --tag-name-filter для сохранения существующих тегов путем их перемещения в новые исправленные коммиты. Также он использует флаг --force, чтобы гарантировать, что команда будет работать в том случае, если вы ранее запускали tree-filter в своем хранилище.

git filter-branch --force --tree-filter 'git ls-files | xargs file | sed -n -e "/.*: .*text.*/s/\(.*\): .*/\1/p" | xargs fromdos' --tag-name-filter cat -- --all
mgorovoy
источник
3

И без каких-либо дополнительных инструментов (таких как 'fromdos', 'dos2unix' и т. Д.):

git filter-branch --force --tree-filter 'git ls-files | xargs file | sed -n -e "/.*: .*text.*/s/\(.*\): .*/\1/p" | xargs -0 sed -i"" -e "s/"$(printf "\015")"$//"' --tag-name-filter cat -- --all

Кроссплатформенный (OS X, FreeBSD, Linux) полезный аналог 'fromdos', 'dos2unix':

sed -i'' -e 's/'"$(printf '\015')"'$//'

Возможно полезный 'unix2dos':

sed -i '' -e 's|$|'"`printf '\015'`"'|' file.name

Если вы абсолютно уверены, что делаете, вы можете использовать эту простую встроенную команду для удаления "/ r" из всех файлов в текущем каталоге ".":

find . -type f -exec sed -i'' -e 's/'"$(printf '\015')"'$//' {} \;
METAJIJI
источник
1
Скорее измените \ r \ n на \ n вместо удаления только \ r
xdevs23
Я думаю, что соответствующий sedвызов может быть заменен на более короткий:sed -n -e "s/\(.*\): .*text.*/\1/p"
dma_k