Texto e hexadecimal (UTF-8)

Codifica texto em hex byte a byte (UTF-8) e decodifica hex contínuo ou com espaços.

Descrição

A base hexadecimal existe por um motivo prático e elegante: computadores falam em binário, mas binário é quase ilegível para humanos. Antes do hex, o sistema octal (base 8) foi o padrão nos primeiros computadores como o PDP-8 da DEC nos anos 1960 — o próprio Unix original foi desenvolvido em máquinas onde endereços de memória eram anotados em octal, e você ainda encontra esse vestígio hoje: `chmod 755` é notação octal. O hexadecimal venceu por uma razão matemática irresistível: um dígito hex representa exatamente 4 bits (um nibble), e um byte são exatamente 2 dígitos hex. Nunca há desperdício, nunca há ambiguidade. O byte máximo é `FF` (255), o mínimo é `00`. O mainframe IBM System/360, lançado em 1964, popularizou o hex em grande escala, e a partir daí a convenção se tornou universal na computação.

O uso mais clássico da representação hexadecimal é a inspeção dos bytes brutos de arquivos. Todo formato de arquivo tem uma assinatura nos primeiros bytes — os chamados magic numbers — que identificam o tipo independentemente da extensão. Um arquivo PNG sempre começa com `89 50 4E 47 0D 0A 1A 0A`. O JPEG começa com `FF D8 FF`. Arquivos ZIP começam com `50 4B 03 04` — que em ASCII são as letras `PK`, as iniciais de Phil Katz, criador do PKZip. PDF começa com `25 50 44 46`, ou seja, `%PDF`. Um editor hexadecimal permite ver esses bytes diretamente, o que é essencial para análise forense digital, recuperação de arquivos corrompidos e desenvolvimento de parsers para formatos binários. Ferramentas como Wireshark e tcpdump exibem o conteúdo de pacotes de rede em hex com a interpretação ASCII ao lado — é a forma canônica de debugar protocolos.

Para quem trabalha com português ou espanhol, a conversão hex revela algo não óbvio: muitos caracteres que você digita cotidianamente ocupam mais de um byte em UTF-8. A letra `ã` são 2 bytes: `C3 A3`. O `é` é `C3 A9`. O `ç` é `C3 A7`. A palavra `ação` tem 4 caracteres mas 7 bytes em UTF-8. Isso parece detalhe até que você trabalha com protocolos de rede com campos de tamanho fixo em bytes, com bancos de dados que distinguem `VARCHAR(10)` em caracteres versus bytes, com funções de hash que operam sobre bytes (o SHA-256 de `ação` é diferente dependendo de passar a string UTF-8 de 7 bytes ou uma codificação de 4 bytes), ou com operações criptográficas que precisam de alinhamento a blocos de 16 bytes. Ver os bytes reais de uma string elimina qualquer ambiguidade.

Detalhamento técnico

Pontos frequentes

  • Para que serve esta ferramenta?: Ela roda 100% no seu navegador: útil para validar, formatar ou converter dados no dia a dia de desenvolvimento.
  • Meus dados são enviados a algum servidor?: O processamento é feito localmente via JavaScript. Não armazenamos o conteúdo que você cola nas caixas de texto.
  • Posso usar em produção ou para dados reais?: Use por sua conta e risco. Para segredos (senhas, tokens), prefira ambientes controlados e políticas da sua empresa. E lembre sempre de revisar os conteúdos gerados. Nunca confie cegamente nas coisas que vê na internet.

Trecho para testar

  • Há também o bloco "Exemplo de Código" com o trecho completo; use esse texto rápido para colar nos campos e validar: Exemplo — Olá → bytes UTF-8 em hex

Guia da ferramenta

  • O que é texto em UTF-8 Texto Unicode codificado em bytes. Cada caractere pode usar um ou mais bytes.

  • O que é representação hexadecimal Cada byte é mostrado como dois dígitos hexadecimais (00 a FF), útil para inspecionar bytes “por baixo” do texto.

  • O que a ferramenta faz Codifica string em sequência de bytes UTF-8 em hex; ou decodifica hex (com ou sem espaços) de volta para texto.

  • Por que usar Depurar encoding, comparar com dumps de rede ou logs, ensinar ou validar que um caractere ocupa N bytes.

Exemplo de Código

Exemplo de código
Olá → bytes UTF-8 em hex

Exemplo

Olá → bytes UTF-8 em hex

Perguntas frequentes

Para que serve esta ferramenta?

Ela roda 100% no seu navegador: útil para validar, formatar ou converter dados no dia a dia de desenvolvimento.

Meus dados são enviados a algum servidor?

O processamento é feito localmente via JavaScript. Não armazenamos o conteúdo que você cola nas caixas de texto.

Posso usar em produção ou para dados reais?

Use por sua conta e risco. Para segredos (senhas, tokens), prefira ambientes controlados e políticas da sua empresa. E lembre sempre de revisar os conteúdos gerados. Nunca confie cegamente nas coisas que vê na internet.