Dicas LPI 103.2 – Processar fluxos de texto com o uso de filtros

Prosseguindo nos objetivos da Certificação LPI, iremos hoje apresentar os comandos fornecidos pelo pacote “GNU textutils” para realização de atividades de recortar, extrair e filtrar conteúdos em arquivos.

O Linux tem diversas ferramentas para trabalhar e transformar arquivos de textos puros, sem formatação especial. Estas ferramentas são úteis quando estamos trabalhando com scripts no shell, verificando arquivos de log, e etc.

Vamos aos comandos:

cat

Utilizado para visualizar conteúdo, podendo ser utilizado como redirecionador, tomando todo o conteúdo direcionado para sua entrada padrão e enviando para sua saída padrão.

Exemplo: para criar um arquivo com apenas algumas linhas de texto

# cat > teste.txt

tac

Tem função semelhante ao do cat, entretanto, mostra o conteúdo de trás para frente:

# tac arquivo.txt

head

Mostra o começo de arquivos. Por padrão, as primeiras linhas são mostradas. A quantidade de linhas a serem mostradas é indicada pela opção -n. A opção -c especifica o número de caracteres (bytes) a serem mostrados:

# head -n 50 LEIAME.TXT

tail

O comando tail visualiza as dez últimas de um arquivo. Funciona como oposto do head:

# tail -n 50 /var/log/syslog
# tail -f /var/log/dmesg

wc

O comando wc conta as linhas, palavras e caracteres de um ou mais arquivos. Se mais de um arquivo foi passado como argumento, ele irá apresentar as estatísticas de cada arquivo e também o total:

# wc LEIAME.TXT

nl

O comando nl é utilizado para numerar as linhas de um arquivo. O comando considera condições especiais para o cabeçalho e o rodapé do arquivo:

 # nl arquivo.txt

expand

Substitui espaços de tabulação (TAB’s) pos espaços simples, mantendo a mesma distância aparente:

unexpand

Substitui dois ou mais espaços simples, em um texto, por espaços de tabulação (TAB).

hexdump

Mostra arquivos binários. A opção -C torna a saída mais legível, mostrando a coluna de endereço hexadecimal, seguida pela coluna dos dados do arquivo (valores hexadecimais sequenciais separados a cada dois bytes) e, por último, pela coluna que mostra esses mesmos bytes no formato ASCII.

od

O comando od é utilizado para visualizarmos o conteúdo de um arquivo nos formatos hexadecimal, octal, ASCII e nome dos caracteres.

split

O comando split é usado para dividir grandes arquivos em n-arquivos menores. Os arquivos de saída são gerados de acordo com o tamanho do arquivo de entrada. O padrão é dividir o arquivo a cada mil linhas. Os nomes dos arquivos de saída seguem o padrão arquivosaidaaa arquivosaidaab arquivosaidaac e assim por diante.

# split -20 arquivo1.txt arquivosaida.txt

Com isso, encerramos essa primeira parte. No próximo artigo daremos continuidade ao assunto.

Categorias

Colunistas

Explorar

Newsletter

Ecossistema

Dicas LPI 103.2 – Processar fluxos de texto com o uso de filtros

cat

tac

head

tail

wc

nl

expand

unexpand

hexdump

od

split

Mais de Deividson Ludolf

Fios

cat

tac

head

tail

wc

nl

expand

unexpand

hexdump

od

split

Mais de Deividson Ludolf

Fios

O melhor do dev brasileiro, no seu e-mail