Carreira Dev

18 jan, 2013

Dicas LPI 103.2 – Processar fluxos de texto com o uso de filtros

Publicidade

Prosseguindo nos objetivos da Certificação LPI, iremos hoje apresentar os comandos fornecidos pelo pacote “GNU textutils” para realização de atividades de recortar, extrair e filtrar conteúdos em arquivos.

O Linux tem diversas ferramentas para trabalhar e transformar arquivos de textos puros, sem formatação especial. Estas ferramentas são úteis quando estamos trabalhando com scripts no shell, verificando arquivos de log, e etc.

Vamos aos comandos:

cat

Utilizado para visualizar conteúdo, podendo ser utilizado como redirecionador, tomando todo o conteúdo direcionado para sua entrada padrão e enviando para sua saída padrão.

Exemplo: para criar um arquivo com apenas algumas linhas de texto

# cat > teste.txt

tac

Tem função semelhante ao do cat, entretanto, mostra o conteúdo de trás para frente:

# tac arquivo.txt

head

Mostra o começo de arquivos. Por padrão, as primeiras linhas são mostradas. A quantidade de linhas a serem mostradas é indicada pela opção -n. A opção -c especifica o número de caracteres (bytes) a serem mostrados:

# head -n 50 LEIAME.TXT

tail

O comando tail visualiza as dez últimas de um arquivo. Funciona como oposto do head:

# tail -n 50 /var/log/syslog
# tail -f /var/log/dmesg

 

wc

O comando wc conta as linhas, palavras e caracteres de um ou mais arquivos. Se mais de um arquivo foi passado como argumento, ele irá apresentar as estatísticas de cada arquivo e também o total:

# wc LEIAME.TXT

nl

O comando nl é utilizado para numerar as linhas de um arquivo. O comando considera condições especiais para o cabeçalho e o rodapé do arquivo:

 # nl arquivo.txt

expand

Substitui espaços de tabulação (TAB’s) pos espaços simples, mantendo a mesma distância aparente:

unexpand

Substitui dois ou mais espaços simples, em um texto, por espaços de tabulação (TAB).

hexdump

Mostra arquivos binários. A opção -C torna a saída mais legível, mostrando a coluna de endereço hexadecimal, seguida pela  coluna dos dados do arquivo (valores hexadecimais sequenciais separados a cada dois bytes) e, por último, pela coluna que mostra esses mesmos bytes no formato ASCII.

od

O comando od é utilizado para visualizarmos o conteúdo de um arquivo nos formatos hexadecimal, octal, ASCII e nome dos caracteres.

split

O comando split é usado para dividir grandes arquivos em n-arquivos menores. Os arquivos de saída são gerados de acordo com o tamanho do arquivo de entrada. O padrão é dividir o arquivo a cada mil linhas. Os nomes dos arquivos de saída seguem o padrão arquivosaidaaa arquivosaidaab arquivosaidaac e assim  por diante.

# split -20 arquivo1.txt arquivosaida.txt

Com isso, encerramos essa primeira parte. No próximo artigo daremos continuidade ao assunto.