Вопросы с тегом «text-processing»

9
Как посчитать количество символов в строке, кроме конкретного символа?

Это часть файла N W N N N N N N N N N N C N N N N N N N N N N A N N N N N N N N N N N N N N N N N N N N N G N N N N N N N N N N C N N N C N N N N N N C C N N N N N N N N В каждой строке я хочу подсчитать общее количество всех символов, которые не являются "N" вывод моего желания 1 1 1 0 1 2 2...

9
Как найти повторяющиеся строки во многих больших файлах?

У меня есть ~ 30 тыс. Файлов. Каждый файл содержит ~ 100 тыс. Строк. Строка не содержит пробелов. Строки в отдельном файле сортируются и дублируются бесплатно. Моя цель: я хочу , чтобы найти все все повторяющиеся строки через два или более файлов , а также имена файлов, содержащие дублированные...

9
Как я могу удалить последний разделитель запятых в конце файла?

Как удалить последний запятую из файла в Linux? Пример файла: "is_supported_kafka_ranger" : "true", "kafka_log_dir" : "/var/log/kafka", "kafka_pid_dir" : "/var/run/kafka", "kafka_user" : "kafka", "kafka_user_nofile_limit" : "128000", "kafka_user_nproc_limit" : "65536", Ожидаемые результаты:...

8
Насколько интеллектуальны утилиты Unix?

Утилиты Unix, такие как sort, find, grep, diff и др., Очень удобны для выполнения быстрых задач, иногда вообще без написания кода. Я хотел знать, какие алгоритмы они используют внутри и как разумно выбрать конкретный алгоритм для конкретной задачи? Например, если сортировка получает огромный...

8
Получение текста от последнего маркера до EOF в POSIX.2

У меня есть текст с маркерными линиями, такими как: aaa --- bbb --- ccc Мне нужно получить текст от последнего маркера (не включительно) до EOF. В этом случае это будет ccc Есть ли элегантный способ в POSIX.2? Прямо сейчас я использую два прогона: первый с nlи grepдля последнего вхождения с...

8
Изменить дату «29 июля 2011 года» на «20110729»

У меня много HTML-файлов содержит дату в формате July 29th, 2011 Я хочу изменить формат даты July 29th, 2011на 20110729, December 9th, 2010на 20101209и т. Д. Я думаю, что sedможет работать, но все еще не может найти решение из-за его косвенной...

8
grep окружающие персонажи матча

Я ищу, чтобы найти и заменить в гигантском дампе базы данных, и он не делает то, что я думаю, должно произойти. Я хотел бы найти для моей целевой строки в файле, а затем увидеть окружающие 8 символов или около того (мне может потребоваться изменить это число, в зависимости от). Как я могу это...

8
Как найти и заменить несколько игл одним словом через одно выражение?

Предположим, у вас есть текстовый файл: foo fnord bar bizz foo poit И теперь я хотел бы заменить оба слова "foo" и "bar" на "narf". Я знаю, что мог бы использовать: sed -e 's/foo/narf/g' -e 's/bar/narf/g' fileName Тем не менее, я хотел бы поработать с оператором OR, который указывает регулярному...

8
Как я могу преобразовать данные, разделенные табуляцией, в данные, разделенные запятыми?

Я запрашиваю список снимков ec2 с помощью инструмента командной строки ec2 amazon: ec2-describe-snapshots -H --hide-tags > snapshots.csv Данные выглядят примерно так: SnapshotId VolumeId StartTime OwnerId VolumeSize Description snap-00b66464 vol-b99a38d0 2012-01-05 5098939 160 my backup Как я...

8
Как получить все линии между первым и последним появлением шаблонов?

Как я могу обрезать файл (хороший входной поток), чтобы получить только строки в диапазоне от первого вхождения шаблона fooдо последнего вхождения шаблона bar? Например, рассмотрим следующий вход: A line like foo this foo bar something something else foo bar and the rest Я ожидаю этот вывод: foo...

8
Просмотр изменений в .tex файлах

У меня есть два файла, paper.texи paper_suggested_changes.texпоследний является модифицированной версией первого с исправлениями. Мне нужно просмотреть два файла и выбрать, какие изменения принять или отклонить, как мне...

8
удаление первого и последнего символа каждой строки из командной строки

Я пытаюсь удалить первый и последний символы каждой строки в текстовом файле и сохранить полученную усеченную версию в новом файле. Кто-нибудь есть идеи о том, как сделать это эффективно с помощью awkили других программ / команд Linux, специально для больших файлов? input.txt (s,2,4,5,6)...

8
Как я могу использовать SED или AWK для замены заполнителей в файле шаблона переменным содержимым, содержащим специальные символы?

CentOS 6.3 Я пытаюсь получить небольшой скрипт для отправки электронного письма, содержащего копию заголовка письма в теле (для целей внутренней отчетности). Файл шаблона содержит следующее: Alert Report Alert has triggered at TMPDATE HEADERS ------- TMPHEADERS SOURCE IP --------- TMPSOURCEIP Я...

8
Групповая сортировка непрерывных абзацев (разделенных пустой строкой)?

Я думаю, что теперь у меня довольно большой опыт сортировки по столбцам ; однако я пока не нашел ничего, как сортировать непрерывные строки . Предположим, у нас есть текстовый файл, который выглядит следующим образом: (очень упрощенно, конечно) Echo Alpha Delta Charlie Golf Bravo Hotel Foxtrot...

8
Как я могу использовать Bash, чтобы найти 2 байта в двоичном файле, увеличить их значения и заменить?

Я пытаюсь найти два байта внутри двоичного файла, затем увеличить значение этих двух байтов и заменить их внутри файла. Эти два байта находятся на позициях 0x82-0x83. На данный момент я успешно извлек эти два байта, используя это: #!/usr/bin/env bash BYTES=$(tail -c +131 "$1" | head -c 2) Эти байты...

8
Какой самый простой способ добавить строку в начале каждой строки файла из командной строки?

Я ищу способ добавить некоторую строку в начало каждой строки (та же строка для каждой строки). Не что-то настраиваемое, а скорее то, что будет легко запомнить и доступно на любой POSIX-совместимой платформе (и каждой...