Вопросы с тегом «text-processing»

14
Как выполнить grep -v и исключить следующую строку после матча?

Как отфильтровать 2 строки для каждой строки, соответствующей регулярному выражению grep? это мой минимальный тест: SomeTestAAAA EndTest SomeTestABCD EndTest SomeTestDEFG EndTest SomeTestAABC EndTest SomeTestACDF EndTest И, очевидно, я пытался, например, grep -vA 1 SomeTestAAкоторый не работает....

14
SED соответствует шаблону N раз

Я хочу разбить файл на куски по 2 слова в каждом. $cat tmp word1 word2 word3 word4 word5 word6 word7 $sed -e 's/word. word. /&\n/g' tmp word1 word2 word3 word4 word5 word6 word7 $sed -e 's/word. \{2\}/&\n/g' tmp word1 word2 word3 word4 word5 word6 word7 Я ожидал, что последняя команда даст...

14
Удалите повторяющиеся строки, сохраняя порядок строк

[root@server]# awk '!seen[$0]++' out.txt > cleaned awk: (FILENAME=out.txt FNR=8547098) fatal error: internal error Aborted [root@server]# «Сервер» имеет: 8 ГБ ОЗУ + 16 ГБ SWAP, x> 300 ГБ свободного места, amd64, настольный ЦП. Научный Linux 6.6. На нем больше ничего не работает, чтобы сделать...

14
Объедините два файла построчно с символом тройки разделителя «|||»

У меня есть два параллельных файла с одинаковым количеством строк на двух языках, и я планирую объединить эти два файла построчно с разделителем |||. Например, два файла следующие: Файл А: 1Mo 1,1 I love you. 1Mo 1,2 I like you. Hi 1,3 I am hungry. Hi 1,4 I am foolish. Файл Б: 1Mo 1,1 Ich liebe...

13
Сортировать текстовые файлы с несколькими строками в ряд

У меня есть текстовый файл в этом формате: #################################### KEY2 VAL21 VAL22 VAL23 VAL24 #################################### KEY1 VAL11 VAL12 VAL13 VAL14 #################################### KEY3 VAL31 VAL32 VAL33 VAL34 Я хочу отсортировать этот файл KEYпострочно и сохранить в...

13
Печать строк между (и исключая) двумя рисунками

Я собираюсь отправить форму с помощью cURL, где часть содержимого берется из другого файла, выбранного с помощью sed Если param1используется шаблон совпадения строк из другого файла sed, команда ниже будет работать нормально: curl -d param1="$(sed -n '/matchpattern/p' file.txt)" -d param2=value2...

13
Как использовать регулярные выражения с AWK для замены строк?

Предположим, есть текст из файла: (bookmarks ("Chapter 1 Introduction 1" "#1" ("1.1 Problem Statement and Basic Definitions 23" "#2") ("Exercises 31" "#30") ("Notes and References 42" "#34")) ) Я хочу добавить 11 к каждому числу, за которым следует a "в каждой строке, если оно есть, т.е. (bookmarks...

13
Случайно нарисовать определенное количество линий из файла данных

У меня есть список данных, как 12345 23456 67891 -20000 200 600 20 ... Предположим, что размер этого набора данных (то есть строк файла) равен N. Я хочу случайным образом нарисовать mлинии из этого файла данных. Поэтому на выходе должны быть два файла, один из которых содержит эти mстроки данных, а...

13
Как отсортировать (по любому ключу) записи BibTex в файле `.bib`?

Я работаю с LaTeX и занимаюсь версионированием с Git. Для управления библиографией я использую Mendeley. Проблема в том, что каждый раз, когда Mendeley синхронизирует .bibэкспорт, они располагаются в другом порядке, что делает библиографическое управление версиями намного сложнее. Моя идея состоит...

13
Как использовать sed для манипулирования непрерывно потоковым выводом?

Я составляю презентацию для нетехнической аудитории. У меня есть программа, работающая на Bash, которая выводит непрерывный поток значений, некоторые из которых важны. Я хотел бы выделить важные результаты, поскольку они отображаются, чтобы аудитория могла понять их частоту. Проблема в том, что я...

13
Удалить последний символ в слове, но только если он есть - в bash

Как убрать последний символ только если он там есть? вход: OpenOffice.org/m openOffice.org/ozm Чел. Pfg. Фил. Профессор соответственно Roonstr./m roonstr./ozm желаемый результат: OpenOffice.org openOffice.org Pers Pfg Фил профессор соответственно Roonstr roonstr Я дошел до того, что осталась только...

13
Как добавить верхний и нижний колонтитулы в поток sed или awk?

У меня есть куча выходных, проходящих через sed и awk. Как можно префикс вывода с START и суффикс ответа с END? Например, если у меня есть All this code on all these lines and all these Как я мог получить: START All this code on all these lines and all these END ? Моя попытка была: awk '{print...

13
Удалить повторяющиеся записи из файла CSV

У меня есть файл [csv] с перепечаткой дубликатов данных, т.е. одни и те же данные напечатаны дважды. Я попытался с помощью Uniq Сортировать по по sort myfile.csv | uniq -uоднако нет никаких изменений в myfile.csv, и я не пробовал , sudo sort myfile.csv | uniq -uно никакой разницы. Так что в...

13
нелинейный инструмент для замены строк?

Недавно я задал вопрос о том, как удалить символ новой строки, если это происходит после другого конкретного символа. Инструменты обработки текста Unix очень мощные, но почти все они имеют дело со строками текста, что прекрасно в большинстве случаев, когда ввод вписывается в доступную память. Но...

13
Бинарный поиск в отсортированном текстовом файле

У меня есть большой отсортированный файл с миллиардами строк переменной длины. Учитывая новую строку, я хотел бы знать, какой номер байта он получит, если он будет включен в отсортированный файл. пример a\n c\n d\n f\n g\n Учитывая ввод 'foo', я бы получил вывод 9. Это легко сделать, просто...

13
Как извлечь данные из файла JSON

У меня есть бин, ищущий решение для моего вопроса, но не нашел или лучше сказал, что я не получил это с тем, что я нашел. Итак, давайте поговорим о том, о чем моя проблема. Я использую программное обеспечение Smart Home Control на Raspberry Pi, и, как я узнал в эти выходные, используя систему...