Вопросы с тегом «csv»

Файлы, содержащие данные, располагаются в таблице, часто с запятыми (отсюда значения, разделенные запятыми), для разделения столбцов. Строки разделены символами новой строки (но не все символы новой строки являются разделителями строк, так как поля могут быть заключены в кавычки, чтобы содержать разделители строк. Используйте этот тег для полноценных данных CSV, а не в простом случае одной записи на строку или полностью без кавычек (используйте csv-simple). для такого рода данных).

47
Есть ли надежный инструмент командной строки для обработки CSV-файлов?

Я работаю с CSV-файлами, и иногда мне нужно быстро проверить содержимое строки или столбца из командной строки. Во многих случаях cut, head, tailи друзья будут делать эту работу; тем не менее, сокращение не может легко справиться с такими ситуациями, как "this, is the first entry", this is the...

39
команда на вкладке макета разделенный список красиво

Иногда, я получаю как разделенный вкладкой список, который не совсем выровнен, например var1 var2 var3 var_with_long_name_which_ruins_alignment var2 var3 Есть ли простой способ сделать их выровненными? var1 var2 var3 var_with_long_name_which_ruins_alignment var2 var3...

34
Объедините несколько команд sed в один скрипт для обработки файла CSV

Наличие файла CSV, как это: HEADER "first, column"|"second "some random quotes" column"|"third ol' column" FOOTER и ищет результат как: HEADER first, column|second "some random quotes" column|third ol' column другими словами, удаляя "FOOTER", кавычки в начале, конце и вокруг |. Пока этот код...

31
Преобразуйте файл .xlsx (MS Excel) в .csv в командной строке с полями, разделенными точкой с запятой

Я понимаю, что это не совсем вопрос, связанный с Unix / Linux. Но так как это то, что я буду делать в Linux, я надеюсь, что у кого-то есть ответ. У меня есть онлайн файл Excel ( .xlsx), который периодически обновляется (кем-то еще). Я хочу написать сценарий и вставить его как cronjob, чтобы...

23
Удалить запятую между кавычками только в файле с разделителями-запятыми

У меня есть входной файл, разделенный запятыми ( ,). Есть некоторые поля, заключенные в двойные кавычки, в которых есть запятая. Вот пример строки 123,"ABC, DEV 23",345,534.202,NAME Мне нужно удалить все запятые внутри двойных кавычек, а также двойные кавычки. Таким образом, приведенная выше строка...

21
Командная строка дружественные таблицы

Существует ли такая вещь? Текстовые таблицы, которые хорошо отображаются в среде CLI. Я знаю, что могу cat foobar.csvи делаю, как хочу, но это не особенно практично и не привлекательно. Я не могу себе представить, что будет трудно отформатировать таблицу, и, возможно, следовать определенным...

16
Отфильтруйте файл .CSV на основе значений 5-го столбца файла и распечатайте эти записи в новый файл.

У меня есть файл .CSV в следующем формате: "column 1","column 2","column 3","column 4","column 5","column 6","column 7","column 8","column 9","column 10 "12310","42324564756","a simple string with a , comma","string with or, without commas","string 1","USD","12","70%","08/01/2013",""...

15
Превращение отдельных строк в разделенный запятыми список с цитируемыми записями

У меня есть следующие данные (список пакетов R, проанализированных из файла Rmarkdown), которые я хочу превратить в список, который я могу передать R для установки: d3heatmap data.table ggplot2 htmltools htmlwidgets metricsgraphics networkD3 plotly reshape2 scales stringr Я хочу превратить список в...

14
Извлечение данных из файла и размещение в разных файлах на основе значения одного столбца

Мы сгенерируем CSV-файл со значениями ниже yp1234,577,1,3 yp5678,577,3,5 yp9012,132,8,9 Мне нужно извлечь данные и создать файлы на основе второго столбца. Если это 577, то вся строка должна быть извлечена и помещена в отдельный файл. Я имею в виду, что мне нужен файл со строками со вторым столбцом...

14
Как подсчитать количество строк в файле после совпадения grep?

Я пытаюсь подсчитать количество строк после проблемной строки в CSV-файле. Я знаю, что могу использовать grep -a #синтаксис для вывода # количества строк после того, как найдено совпадение. Меня интересует только фактическое количество строк. Я понимаю, что могу установить значение MAX_INT,...

13
Выберите строки из текстового файла, идентификаторы которых указаны в другом файле

Я использую много сортировки grep awk в моей оболочке Unix для работы с текстовыми файлами столбцов, разделенных табуляцией среднего размера (около 10–100 млн строк). В этом отношении Unix Shell - моя электронная таблица. Но у меня есть одна огромная проблема - выбор записей по списку...

13
Манипулировать некоторыми плохо разделенными данными в полезном CSV

У меня есть некоторые выходные данные в виде: count id type 588 10 | 3 10 12 | 3 883 14 | 3 98 17 | 3 17 18 | 1 77598 18 | 3 10000 21 | 3 17892 2 | 3 20000 23 | 3 63 27 | 3 6 3 | 3 2446 35 | 3 14 4 | 3 15 4 | 1 253 4 | 2 19857 4 | 3 1000 5 | 3 ... Который довольно грязный и должен быть очищен до...

12
Как отобразить TSV (csv) в консоли, если пустые ячейки пропущены с помощью: `column -t -s $ '\ t'`

У меня есть файл с колонками, с которыми связано tab. У меня есть файл, когда в некоторых строках есть пустые ячейки (в начале, посередине). В таких случаях column -t -s $'\t'просто выходит из строя: Входные данные: $ echo -e 'A\tB\tC\tD\n\tb1\t\td1\n\t\t\td2\na3\t\t\td3' > in.tsv $ hexdump -C...

11
Удалить строки из файла в зависимости от строк, найденных в другом файле

Файл file1.txt содержит такие строки: /api/purchase/<hash>/index.html Например: /api/purchase/12ab09f46/index.html Файл file2.csv содержит такие строки: <hash>,timestamp,ip_address Например: 12ab09f46,20150812235200,22.231.113.64 a77b3ff22,20150812235959,194.66.82.11 Я хочу...

11
Переиндексация большого файла CSV

Я просмотрел ответы в этой полезной ветке , но моя проблема, похоже, иная, поэтому я не могу придумать хорошего ответа (по крайней мере, с sed). У меня есть большой файл CSV (200+ ГБ) со строками, которые выглядят следующим образом: <alphanumerical_identifier>,<number> где...

11
Форматировать вывод команды «ps» без пробелов

У меня есть следующая psкоманда, чтобы получить конкретные свойства всех запущенных процессов вместе с некоторыми свойствами: ps --no-headers -exo "uname,ppid,pid,etime,%cpu,%mem,args" Я хотел бы отформатировать его в CSV, чтобы я мог разобрать его. Обратите внимание, что я поставил аргументы в...