Есть ли простая команда для вывода столбцов с разделителями табуляции?

67

Например, у меня есть файл (производится с echo -e "var1\tvar2\t\var3\tvar4" > foo), которые выводятся как:

$ cat foo
case    elems   meshing nlsys
uniform 2350    0.076662        2.78
non-conformal   348     0.013332        0.55
scale   318     0.013333        0.44
smarter 504     0.016666        0.64
submodel        360     .009999 0.40
unstruct-quad   640     0.019999        0.80
unstruct-tri    1484    0.01    0.88

Я бы предпочел вывод, как это (здесь я использовал vimи :set tabstop=14):

case          elems         meshing       nlsys
uniform       2350          0.076662      2.78
non-conformal 348           0.013332      0.55
scale         318           0.013333      0.44
smarter       504           0.016666      0.64
submodel      360           .009999       0.40
unstruct-quad 640           0.019999      0.80
unstruct-tri  1484          0.01          0.88

Я могу получить ту же функциональность, catесли использую $ tabs=15в bash (см. Этот вопрос ). Есть ли программа, которая делает такое форматирование автоматически? Я не хочу экспериментировать со tabsзначением перед catсозданием файла.

Себастьян
источник

Ответы:

87

Я обычно использую columnпрограмму для этого, она находится в пакете, который называется bsdmainutilsDebian:

column -t foo

Выход:

case           elems  meshing   nlsys
uniform        2350   0.076662  2.78
non-conformal  348    0.013332  0.55
scale          318    0.013333  0.44
smarter        504    0.016666  0.64
submodel       360    .009999   0.40
unstruct-quad  640    0.019999  0.80
unstruct-tri   1484   0.01      0.88

Выдержка из column(1)моей системы:

...

-t      Determine the number of columns the input contains and create a
        table.  Columns are delimited with whitespace, by default, or
        with the characters supplied using the -s option.  Useful for
        pretty-printing displays.

...
Тор
источник
здорово! большое спасибо! Он был уже установлен на моей машине.
Себастьян
11
Вы можете добавить -s $'\t'(не найденный в каждой реализации столбца, хотя), если некоторые поля содержат пробелы.
Стефан Шазелас
2
@RakholiyaJenish $'\t'означает символ табуляции. Новая строка $'\n'и так далее.
Манве
2
Я использовал это как column -ts: /etc/passwd. Выглядит круто!
KYB
1
@kyb: выглядит еще лучше -n, т.е. избегайте объединения нескольких соседних разделителей
Thor
10

Несколько вариантов:

var1=uniform var2=2350 var3=0.076662 var4=2.78

printf '%-15s %-10s %-12s %s\n' \
  case elems messing nlsys \
  "$var1" "$var2" "$var3" "$var4"

printf '%s\t%s\t%s\t%s\n' \
  case elems messing nlsys \
  "$var1" "$var2" "$var3" "$var4" |
  expand -t 15,25,37

printf '%s\t%s\t%s\t%s\n' \
  case elems messing nlsys \
  "$var1" "$var2" "$var3" "$var4" |
  column -t -s $'\t'

column - нестандартная команда, некоторые реализации / версии не поддерживают опцию -s. Он вычисляет ширину столбца на основе входных данных, но это означает, что он может начать отображаться только после того, как на него введены все входные данные. $'...'Синтаксис ksh93 также встречается в zsh и bash.

С зш:

values=(
  case elems messing nlsys
  "$var1" "$var2" "$var3" "$var4"
)
print -arC4 -- "$values[@]"
Стефан Шазелас
источник
4

Вы также можете использовать rsв качестве альтернативы column -t:

(x=$(cat);rs -c -z $(wc -l<<<"$x")<<<"$x")

-cизменяет разделитель входного столбца, но сам по -cсебе устанавливает разделитель входного столбца на вкладку. -zустанавливает ширину каждого столбца равной ширине самого длинного элемента столбца вместо того, чтобы сделать все столбцы одинаковой ширины. Если в некоторых строках столбцов меньше, чем в первой строке, добавьте -n.

nisetama
источник
Что rsэто? Я не установил эту команду ни в CentOS, ни в системах Ubuntu / Mint.
Anthon
1
@Anthon Это команда BSD, которая также поставляется с OS X, названная в честь функции изменения формы в APL. Имя пакета Debian просто rs, поэтому вы можете установить его с помощью apt-get install rs.
Нисетама
Не могли бы вы привести пример того, как можно вызвать команду (x=$(cat);rs -c -z $(wc -l<<<"$x")<<<"$x")? Я не знаю, как бы я использовал это с CSV-файлом
Baxx
3

Еще один инструмент, который может сделать это, tsv-prettyот eBay TSV Utilities (отказ от ответственности: я автор). Требуется дополнительный шаг выравнивания числовых полей по десятичной запятой. Например:

$ tsv-pretty foo
case           elems   meshing  nlsys
uniform         2350  0.076662   2.78
non-conformal    348  0.013332   0.55
scale            318  0.013333   0.44
smarter          504  0.016666   0.64
submodel         360   .009999   0.40
unstruct-quad    640  0.019999   0.80
unstruct-tri    1484  0.01       0.88

Есть несколько вариантов форматирования. Например, -uподчеркивает заголовок и -fформатирует поплавки в поле аналогично для удобства чтения:

$ tsv-pretty foo -f -u
case           elems   meshing  nlsys
----           -----   -------  -----
uniform         2350  0.076662   2.78
non-conformal    348  0.013332   0.55
scale            318  0.013333   0.44
smarter          504  0.016666   0.64
submodel         360  0.009999   0.40
unstruct-quad    640  0.019999   0.80
unstruct-tri    1484  0.010000   0.88

Более подробная информация доступна в справочнике tsv-pretty .

JonDeg
источник
Это действительно полезно
Арефе
1

Речь шла о выводе столбцов с разделителями табуляции.

Таким образом, правильный ответ - это небольшая адаптация ответа @nisetama. Я добавил опцию -C $ '\ t', которая устанавливает форматирование вывода.

x=$(cat foo2); rs -C$'\t' $(wc -l <<<"$x") <<<"$x"

Kudo в @nisetama, хотя :)

thehpi
источник
1
function printTable()
{
    local -r delimiter="${1}"
    local -r data="$(removeEmptyLines "${2}")"

    if [[ "${delimiter}" != '' && "$(isEmptyString "${data}")" = 'false' ]]
    then
        local -r numberOfLines="$(wc -l <<< "${data}")"

        if [[ "${numberOfLines}" -gt '0' ]]
        then
            local table=''
            local i=1

            for ((i = 1; i <= "${numberOfLines}"; i = i + 1))
            do
                local line=''
                line="$(sed "${i}q;d" <<< "${data}")"

                local numberOfColumns='0'
                numberOfColumns="$(awk -F "${delimiter}" '{print NF}' <<< "${line}")"

                # Add Line Delimiter

                if [[ "${i}" -eq '1' ]]
                then
                    table="${table}$(printf '%s#+' "$(repeatString '#+' "${numberOfColumns}")")"
                fi

                # Add Header Or Body

                table="${table}\n"

                local j=1

                for ((j = 1; j <= "${numberOfColumns}"; j = j + 1))
                do
                    table="${table}$(printf '#| %s' "$(cut -d "${delimiter}" -f "${j}" <<< "${line}")")"
                done

                table="${table}#|\n"

                # Add Line Delimiter

                if [[ "${i}" -eq '1' ]] || [[ "${numberOfLines}" -gt '1' && "${i}" -eq "${numberOfLines}" ]]
                then
                    table="${table}$(printf '%s#+' "$(repeatString '#+' "${numberOfColumns}")")"
                fi
            done

            if [[ "$(isEmptyString "${table}")" = 'false' ]]
            then
                echo -e "${table}" | column -s '#' -t | awk '/^\+/{gsub(" ", "-", $0)}1'
            fi
        fi
    fi
}

function removeEmptyLines()
{
    local -r content="${1}"

    echo -e "${content}" | sed '/^\s*$/d'
}

function repeatString()
{
    local -r string="${1}"
    local -r numberToRepeat="${2}"

    if [[ "${string}" != '' && "${numberToRepeat}" =~ ^[1-9][0-9]*$ ]]
    then
        local -r result="$(printf "%${numberToRepeat}s")"
        echo -e "${result// /${string}}"
    fi
}

function isEmptyString()
{
    local -r string="${1}"

    if [[ "$(trimString "${string}")" = '' ]]
    then
        echo 'true' && return 0
    fi

    echo 'false' && return 1
}

function trimString()
{
    local -r string="${1}"

    sed 's,^[[:blank:]]*,,' <<< "${string}" | sed 's,[[:blank:]]*$,,'
}

ОБРАЗЦЫ ОБРАЗЦОВ

$ cat data-1.txt
HEADER 1,HEADER 2,HEADER 3

$ printTable ',' "$(cat data-1.txt)"
+-----------+-----------+-----------+
| HEADER 1  | HEADER 2  | HEADER 3  |
+-----------+-----------+-----------+

$ cat data-2.txt
HEADER 1,HEADER 2,HEADER 3
data 1,data 2,data 3

$ printTable ',' "$(cat data-2.txt)"
+-----------+-----------+-----------+
| HEADER 1  | HEADER 2  | HEADER 3  |
+-----------+-----------+-----------+
| data 1    | data 2    | data 3    |
+-----------+-----------+-----------+

$ cat data-3.txt
HEADER 1,HEADER 2,HEADER 3
data 1,data 2,data 3
data 4,data 5,data 6

$ printTable ',' "$(cat data-3.txt)"
+-----------+-----------+-----------+
| HEADER 1  | HEADER 2  | HEADER 3  |
+-----------+-----------+-----------+
| data 1    | data 2    | data 3    |
| data 4    | data 5    | data 6    |
+-----------+-----------+-----------+

$ cat data-4.txt
HEADER
data

$ printTable ',' "$(cat data-4.txt)"
+---------+
| HEADER  |
+---------+
| data    |
+---------+

$ cat data-5.txt
HEADER

data 1

data 2

$ printTable ',' "$(cat data-5.txt)"
+---------+
| HEADER  |
+---------+
| data 1  |
| data 2  |
+---------+

REF LIB по адресу: https://github.com/gdbtek/linux-cookbooks/blob/master/libraries/util.bash

Нам Нгуен
источник
интересное решение только для bash - спасибо, что поделились
Себастьян
Это слишком запутанно. И это не только bash, поскольку существуют внешние команды, такие sedкак используемые.
codeforester