Extrator de texto delimitado

Extraia uma coluna específica de linhas delimitadas por vírgula, tab ou caractere customizado.

Descrição

O CSV — Comma-Separated Values — é mais antigo do que a maioria das pessoas imagina. O formato existia antes de qualquer especificação formal: o FORTRAN II da IBM em 1958 já suportava certos tipos de entrada separada por vírgulas, e planilhas eletrônicas como o VisiCalc (1979) e mais tarde o Lotus 1-2-3 popularizaram o CSV como formato de exportação padrão. O RFC 4180, que define o tipo MIME `text/csv`, só foi publicado em 2005 — mais de quatro décadas depois de o formato estar em uso corrente. Esse longo período sem padronização explica por que até hoje existem variações irritantes de CSV no mundo real: arquivos com ponto e vírgula como delimitador (comuns em regiões onde vírgula é separador decimal, como na Europa), arquivos com ou sem cabeçalho na primeira linha, aspas como mecanismo de escape para vírgulas dentro de campos, codificações diferentes.

O Tab-Separated Values (TSV) ganhou muitos contextos justamente porque a tabulação raramente aparece em dados de texto natural — nomes, endereços e descrições frequentemente contêm vírgulas, mas quase nunca contêm tabs. Ferramentas UNIX clássicas como `awk`, `cut` e `paste` trabalham com texto delimitado por tabulação por padrão: `cut -d',' -f2 arquivo.csv` extrai a segunda coluna de um CSV; `awk '{print $2}'` extrai a segunda coluna de um TSV. Logs de servidores web, bancos de dados e aplicações usam uma variedade de delimitadores customizados — espaço, pipe (`|`), dois-pontos, ponto e vírgula — dependendo do domínio e da época em que foram projetados. Logs do Apache usam espaço. O arquivo `/etc/passwd` do Linux usa dois-pontos. Cada domínio tem suas convenções, e a extração de colunas específicas é uma operação cotidiana.

A situação de precisar de apenas uma coluna é incrivelmente comum no trabalho técnico real: você cola um trecho de log do servidor, uma exportação de CSV, uma saída de `ps aux` ou de `kubectl get pods` em um editor de texto e precisa extrair apenas um campo específico. Na linha de comando isso é trivial com `awk` ou `cut`, mas quando você está no meio de uma tarefa no navegador, abrir um terminal interrompe o fluxo. Esta ferramenta foi feita para esse momento: cole o bloco de texto, informe o delimitador e o índice da coluna desejada (começando em 1, como nas ferramentas UNIX), e obtenha o resultado imediatamente. Útil também para criar fixtures de teste: pegue uma coluna de um CSV exportado e use-a como entrada para outra ferramenta de processamento.

Detalhamento técnico

Pontos frequentes

  • Para que serve esta ferramenta?: Ela roda 100% no seu navegador: útil para validar, formatar ou converter dados no dia a dia de desenvolvimento.
  • Meus dados são enviados a algum servidor?: O processamento é feito localmente via JavaScript. Não armazenamos o conteúdo que você cola nas caixas de texto.
  • Posso usar em produção ou para dados reais?: Use por sua conta e risco. Para segredos (senhas, tokens), prefira ambientes controlados e políticas da sua empresa. E lembre sempre de revisar os conteúdos gerados. Nunca confie cegamente nas coisas que vê na internet.

Trecho para testar

  • Há também o bloco "Exemplo de Código" com o trecho completo; use esse texto rápido para colar nos campos e validar: Exemplo — a,b,c 1,2,3 (coluna 2) -> b 2

Guia da ferramenta

  • O que é texto delimitado Linhas onde colunas são separadas por um delimitador (vírgula, tab ou caractere customizado).

  • O que a ferramenta faz Extrai uma coluna específica (índice 1-based) de cada linha e devolve apenas essa coluna.

  • Por que usar Processar CSV simples e logs rapidamente, sem abrir planilhas ou scripts externos.

Exemplo de Código

Exemplo de código
a,b,c
1,2,3 (coluna 2) -> b
2

Exemplo

a,b,c
1,2,3 (coluna 2) -> b
2

Perguntas frequentes

Para que serve esta ferramenta?

Ela roda 100% no seu navegador: útil para validar, formatar ou converter dados no dia a dia de desenvolvimento.

Meus dados são enviados a algum servidor?

O processamento é feito localmente via JavaScript. Não armazenamos o conteúdo que você cola nas caixas de texto.

Posso usar em produção ou para dados reais?

Use por sua conta e risco. Para segredos (senhas, tokens), prefira ambientes controlados e políticas da sua empresa. E lembre sempre de revisar os conteúdos gerados. Nunca confie cegamente nas coisas que vê na internet.