Вопросы с тегом «text-processing»

54
Есть ли способ изменить файл на месте?

У меня довольно большой файл (35 ГБ), и я хотел бы отфильтровать этот файл на месте (т. Е. У меня недостаточно места на диске для другого файла), в частности, я хочу grep и игнорировать некоторые шаблоны - есть ли способ сделать это без использования другого файла? Допустим, я хочу отфильтровать...

54
Как сделать оператор if из результата выполненной команды

Я пытаюсь сделать оператор IF из вывода выполненной команды. Вот как я пытаюсь это сделать, но это не работает. Кто-нибудь знает правильный способ сделать это? if [ "`netstat -lnp | grep ':8080'`" == *java* ]; then echo "Found a Tomcat!"...

52
объединять текстовые файлы по столбцам

У меня есть два текстовых файла. Первый имеет содержание: Languages Recursively enumerable Regular в то время как второй имеет содержание: Minimal automaton Turing machine Finite Я хочу объединить их в один файл по столбцам. Итак, я попытался, paste 1 2и его вывод: Languages Minimal automaton...

50
Неверная фильтрация utf8

У меня есть текстовый файл в неизвестной или смешанной кодировке. Я хочу видеть строки, которые содержат последовательность байтов, которая не является допустимой UTF-8 (путем передачи текстового файла в какую-то программу). Эквивалентно, я хочу отфильтровать строки, которые являются...

48
Как распечатать все строки после совпадения до конца файла?

Входной файл1: dog 123 4335 cat 13123 23424 deer 2131 213132 bear 2313 21313 Я даю совпадение по шаблону из in other file(как dog 123 4335из file2). Я соответствую шаблону строки, dog 123 4335и после печати всех строк без строки соответствия мой вывод: cat 13123 23424 deer 2131 213132 bear 2313...

48
Как проверить, использует ли файл CRLF или LF, не изменяя его?

Мне нужно периодически запускать команду, которая гарантирует, что некоторые текстовые файлы хранятся в режиме Linux. К сожалению, dos2unixвсегда изменяет файл, который может испортить временные метки файла и папки и вызвать ненужные записи. Сценарий, который я пишу, написан на Bash, поэтому я бы...

47
Есть ли надежный инструмент командной строки для обработки CSV-файлов?

Я работаю с CSV-файлами, и иногда мне нужно быстро проверить содержимое строки или столбца из командной строки. Во многих случаях cut, head, tailи друзья будут делать эту работу; тем не менее, сокращение не может легко справиться с такими ситуациями, как "this, is the first entry", this is the...

46
Как я могу проверить кодировку текстового файла ... Это действительно, и что это?

У меня есть несколько .htmфайлов, которые открываются в Gedit без каких-либо предупреждений / ошибок, но когда я открываю эти же файлы Jedit, он предупреждает меня о недопустимой кодировке UTF-8 ... В метатеге HTML указано «charset = ISO-8859-1». Jedit допускает Список резервных кодировок и Список...

45
Как конвертировать TXT в PDF?

Я хочу конвертировать .txtфайлы в .pdf. Я использую это: ls | while read ONELINE; do convert -density 400 "$ONELINE" "$(echo "$ONELINE" | sed 's/.txt/.pdf/g')"; done Но это приводит к одной «ошибке» - если в текстовом файле есть очень длинная строка, она не переносится. Введите текст Выходной PDF -...

44
Удалить последнюю строку из файла

Я использую, sed чтобы быстро удалить строки с определенной позиции, как sed '1d' sed '5d' Но что делать, если я хочу удалить последнюю строку файла, и я не знаю количество строк (я знаю, что могу получить это, используя wcи несколько других приемов). В настоящее время используется обходной путь...

41
Заменить переменные среды в файле с их фактическими значениями?

Есть ли простой способ заменить / оценить переменные среды в файле? Например, у меня есть файл, config.xmlкоторый содержит: <property> <name>instanceId</name> <value>$INSTANCE_ID</value> </property> <property> <name>rootPath</name>...

40
Как получить только уникальные результаты без сортировки данных?

$ cat data.txt aaaaaa aaaaaa cccccc aaaaaa aaaaaa bbbbbb $ cat data.txt | uniq aaaaaa cccccc aaaaaa bbbbbb $ cat data.txt | sort | uniq aaaaaa bbbbbb cccccc $ В результате мне нужно отобразить все строки исходного файла, удалив все дубликаты (не только последовательные), сохранив при этом исходный...

39
команда на вкладке макета разделенный список красиво

Иногда, я получаю как разделенный вкладкой список, который не совсем выровнен, например var1 var2 var3 var_with_long_name_which_ruins_alignment var2 var3 Есть ли простой способ сделать их выровненными? var1 var2 var3 var_with_long_name_which_ruins_alignment var2 var3...

39
Grep от конца файла до начала

У меня есть файл с 30 000 000 строк (учет радиуса), и мне нужно найти последнее совпадение данного шаблона. Команда: tac accounting.log | grep $pattern дает то, что мне нужно, но это слишком медленно, потому что ОС должна сначала прочитать весь файл, а затем отправить в канал. Итак, мне нужно...

37
Самый простой способ комментировать / раскомментировать определенные строки с помощью командной строки

Есть ли способ комментировать / раскомментировать сценарий shell / config / ruby ​​с помощью командной строки? например: $ comment 14-18 bla.conf $ uncomment 14-18 bla.conf это добавит или удалит #знак bla.confна линии 14к 18. Обычно я использую sed, но я должен знать содержимое этих строк, а затем...

36
Как можно объединить все строки, заканчивающиеся символом обратной косой черты?

Используя общий инструмент командной строки, такой как sed или awk, возможно ли объединить все строки, заканчивающиеся заданным символом, например, обратную косую черту? Например, учитывая файл: foo bar \ bash \ baz dude \ happy Я хотел бы получить этот вывод: foo bar bash baz dude...