Prosseguindo nos objetivos da Certificação LPI, iremos hoje apresentar os comandos fornecidos pelo pacote “GNU textutils” para realização de atividades de recortar, extrair e filtrar conteúdos em arquivos.
O Linux tem diversas ferramentas para trabalhar e transformar arquivos de textos puros, sem formatação especial. Estas ferramentas são úteis quando estamos trabalhando com scripts no shell, verificando arquivos de log, e etc.
Vamos aos comandos:
cat
Utilizado para visualizar conteúdo, podendo ser utilizado como redirecionador, tomando todo o conteúdo direcionado para sua entrada padrão e enviando para sua saída padrão.
Exemplo: para criar um arquivo com apenas algumas linhas de texto
# cat > teste.txt
tac
Tem função semelhante ao do cat, entretanto, mostra o conteúdo de trás para frente:
# tac arquivo.txt
head
Mostra o começo de arquivos. Por padrão, as primeiras linhas são mostradas. A quantidade de linhas a serem mostradas é indicada pela opção -n. A opção -c especifica o número de caracteres (bytes) a serem mostrados:
# head -n 50 LEIAME.TXT
tail
O comando tail visualiza as dez últimas de um arquivo. Funciona como oposto do head:
# tail -n 50 /var/log/syslog # tail -f /var/log/dmesg
wc
O comando wc conta as linhas, palavras e caracteres de um ou mais arquivos. Se mais de um arquivo foi passado como argumento, ele irá apresentar as estatísticas de cada arquivo e também o total:
# wc LEIAME.TXT
nl
O comando nl é utilizado para numerar as linhas de um arquivo. O comando considera condições especiais para o cabeçalho e o rodapé do arquivo:
# nl arquivo.txt
expand
Substitui espaços de tabulação (TAB’s) pos espaços simples, mantendo a mesma distância aparente:
unexpand
Substitui dois ou mais espaços simples, em um texto, por espaços de tabulação (TAB).
hexdump
Mostra arquivos binários. A opção -C torna a saída mais legível, mostrando a coluna de endereço hexadecimal, seguida pela coluna dos dados do arquivo (valores hexadecimais sequenciais separados a cada dois bytes) e, por último, pela coluna que mostra esses mesmos bytes no formato ASCII.
od
O comando od é utilizado para visualizarmos o conteúdo de um arquivo nos formatos hexadecimal, octal, ASCII e nome dos caracteres.
split
O comando split é usado para dividir grandes arquivos em n-arquivos menores. Os arquivos de saída são gerados de acordo com o tamanho do arquivo de entrada. O padrão é dividir o arquivo a cada mil linhas. Os nomes dos arquivos de saída seguem o padrão arquivosaidaaa arquivosaidaab arquivosaidaac e assim por diante.
# split -20 arquivo1.txt arquivosaida.txt
Com isso, encerramos essa primeira parte. No próximo artigo daremos continuidade ao assunto.