Converter texto em hexadecimal e voltar (UTF-8)

Codifica texto em hex byte a byte (UTF-8) e decodifica hex contínuo ou com espaços.

Descrição

A base hexadecimal existe por um motivo prático e elegante: computadores falam em binário, mas binário é quase ilegível para humanos. Antes do hex, o sistema octal (base 8) foi o padrão nos primeiros computadores como o PDP-8 da DEC nos anos 1960 — o próprio Unix original foi desenvolvido em máquinas onde endereços de memória eram anotados em octal, e você ainda encontra esse vestígio hoje: `chmod 755` é notação octal. O hexadecimal venceu por uma razão matemática irresistível: um dígito hex representa exatamente 4 bits (um nibble), e um byte são exatamente 2 dígitos hex. Nunca há desperdício, nunca há ambiguidade. O byte máximo é `FF` (255), o mínimo é `00`. O mainframe IBM System/360, lançado em 1964, popularizou o hex em grande escala, e a partir daí a convenção se tornou universal na computação.

O uso mais clássico da representação hexadecimal é a inspeção dos bytes brutos de arquivos. Todo formato de arquivo tem uma assinatura nos primeiros bytes — os chamados magic numbers — que identificam o tipo independentemente da extensão. Um arquivo PNG sempre começa com `89 50 4E 47 0D 0A 1A 0A`. O JPEG começa com `FF D8 FF`. Arquivos ZIP começam com `50 4B 03 04` — que em ASCII são as letras `PK`, as iniciais de Phil Katz, criador do PKZip. PDF começa com `25 50 44 46`, ou seja, `%PDF`. Um editor hexadecimal permite ver esses bytes diretamente, o que é essencial para análise forense digital, recuperação de arquivos corrompidos e desenvolvimento de parsers para formatos binários. Ferramentas como Wireshark e tcpdump exibem o conteúdo de pacotes de rede em hex com a interpretação ASCII ao lado — é a forma canônica de debugar protocolos.

Para quem trabalha com português ou espanhol, a conversão hex revela algo não óbvio: muitos caracteres que você digita cotidianamente ocupam mais de um byte em UTF-8. A letra `ã` são 2 bytes: `C3 A3`. O `é` é `C3 A9`. O `ç` é `C3 A7`. A palavra `ação` tem 4 caracteres mas 7 bytes em UTF-8. Isso parece detalhe até que você trabalha com protocolos de rede com campos de tamanho fixo em bytes, com bancos de dados que distinguem `VARCHAR(10)` em caracteres versus bytes, com funções de hash que operam sobre bytes (o SHA-256 de `ação` é diferente dependendo de passar a string UTF-8 de 7 bytes ou uma codificação de 4 bytes), ou com operações criptográficas que precisam de alinhamento a blocos de 16 bytes. Ver os bytes reais de uma string elimina qualquer ambiguidade.

Hexadecimal exists for a practical and elegant reason: computers speak in binary, but binary is nearly unreadable for humans. Before hex, octal (base 8) was the standard on early computers such as the DEC PDP-8 in the 1960s — the original Unix was developed on machines where memory addresses were noted in octal, and you can still see traces of this today: `chmod 755` is octal notation. Hexadecimal won out because of one irresistible mathematical fact: one hex digit represents exactly 4 bits (one nibble), and one byte is exactly 2 hex digits. There is never any waste, never any ambiguity. The maximum byte is `FF` (255), the minimum is `00`. The IBM System/360 mainframe, launched in 1964, popularized hex at scale, and from that point the convention became universal in computing.

The classic use of hexadecimal representation is inspecting the raw bytes of files. Every file format has a signature in its first bytes — the so-called magic numbers — that identifies the type regardless of extension. A PNG file always begins with `89 50 4E 47 0D 0A 1A 0A`. JPEG begins with `FF D8 FF`. ZIP files start with `50 4B 03 04` — which in ASCII spells `PK`, the initials of Phil Katz, creator of PKZip. PDF begins with `25 50 44 46`, which is `%PDF`. A hex editor lets you see these bytes directly, essential for digital forensics, recovering corrupted files, and writing parsers for binary formats. Tools like Wireshark and tcpdump display network packet content in hex with the ASCII interpretation alongside — it is the canonical way to debug protocols.

For anyone working with Portuguese, Spanish, or any accented language, hex conversion reveals something non-obvious: many characters you type every day occupy more than one byte in UTF-8. The letter `ã` is 2 bytes: `C3 A3`. The `é` is `C3 A9`. The `ç` is `C3 A7`. The word `ação` has 4 characters but 7 bytes in UTF-8. This seems like a detail until you work with network protocols that have fixed-size byte fields, databases that distinguish `VARCHAR(10)` in characters versus bytes, hash functions that operate on bytes (the SHA-256 of `ação` differs depending on whether you pass the 7-byte UTF-8 string or a 4-byte encoding), or cryptographic operations that require 16-byte block alignment. Seeing the actual bytes of a string eliminates any ambiguity.

El hexadecimal existe por una razón práctica y elegante: los ordenadores hablan en binario, pero el binario es casi ilegible para los humanos. Antes del hex, el octal (base 8) fue el estándar en los primeros ordenadores como el DEC PDP-8 en los años sesenta — el propio Unix original se desarrolló en máquinas donde las direcciones de memoria se anotaban en octal, y todavía puedes ver ese rastro hoy: `chmod 755` es notación octal. El hexadecimal se impuso por un hecho matemático irresistible: un dígito hex representa exactamente 4 bits (un nibble) y un byte son exactamente 2 dígitos hex. Nunca hay desperdicio, nunca hay ambigüedad. El byte máximo es `FF` (255), el mínimo es `00`. El mainframe IBM System/360, lanzado en 1964, popularizó el hex a gran escala y desde entonces la convención se volvió universal en la informática.

El uso más clásico de la representación hexadecimal es la inspección de los bytes en bruto de los archivos. Cada formato de archivo tiene una firma en sus primeros bytes — los llamados magic numbers — que lo identifica independientemente de su extensión. Un archivo PNG siempre comienza con `89 50 4E 47 0D 0A 1A 0A`. El JPEG comienza con `FF D8 FF`. Los archivos ZIP empiezan con `50 4B 03 04` — que en ASCII deletrea `PK`, las iniciales de Phil Katz, creador de PKZip. El PDF comienza con `25 50 44 46`, es decir, `%PDF`. Un editor hexadecimal permite ver estos bytes directamente, lo que es esencial para el análisis forense digital, la recuperación de archivos corruptos y la escritura de parsers para formatos binarios. Herramientas como Wireshark y tcpdump muestran el contenido de los paquetes de red en hex con la interpretación ASCII al lado: es la forma canónica de depurar protocolos.

Para quienes trabajan con español, portugués o cualquier idioma con caracteres acentuados, la conversión a hex revela algo no obvio: muchos caracteres que escribes a diario ocupan más de un byte en UTF-8. La letra `ã` son 2 bytes: `C3 A3`. La `é` es `C3 A9`. La `ç` es `C3 A7`. La `ñ` es `C3 B1`. La palabra `ação` tiene 4 caracteres pero 7 bytes en UTF-8. Esto parece un detalle hasta que trabajas con protocolos de red que tienen campos de tamaño fijo en bytes, bases de datos que distinguen `VARCHAR(10)` en caracteres frente a bytes, funciones de hash que operan sobre bytes (el SHA-256 de `ñoño` varía según si pasas la cadena UTF-8 o una codificación de 4 bytes), u operaciones criptográficas que requieren alineación a bloques de 16 bytes. Ver los bytes reales de una cadena elimina cualquier ambigüedad.

Detalhamento técnico

Pontos frequentes

Para que serve esta ferramenta?: Ela roda 100% no seu navegador: útil para validar, formatar ou converter dados no dia a dia de desenvolvimento.
Meus dados são enviados a algum servidor?: O processamento é feito localmente via JavaScript. Não armazenamos o conteúdo que você cola nas caixas de texto.
Posso usar em produção ou para dados reais?: Use por sua conta e risco. Para segredos (senhas, tokens), prefira ambientes controlados e políticas da sua empresa. E lembre sempre de revisar os conteúdos gerados. Nunca confie cegamente nas coisas que vê na internet.

Trecho para testar

Há também o bloco "Exemplo de Código" com o trecho completo; use esse texto rápido para colar nos campos e validar: Exemplo — Olá → bytes UTF-8 em hex

Guia da ferramenta

O que é texto em UTF-8 Texto Unicode codificado em bytes. Cada caractere pode usar um ou mais bytes.
O que é representação hexadecimal Cada byte é mostrado como dois dígitos hexadecimais (00 a FF), útil para inspecionar bytes “por baixo” do texto.
O que a ferramenta faz Codifica string em sequência de bytes UTF-8 em hex; ou decodifica hex (com ou sem espaços) de volta para texto.
Por que usar Depurar encoding, comparar com dumps de rede ou logs, ensinar ou validar que um caractere ocupa N bytes.

Este capítulo no guia completo Guia de todas as ferramentas

Exemplo de Código

Exemplo de código

Olá → bytes UTF-8 em hex

Code example

Olá → bytes UTF-8 em hex

Ejemplo de código

Olá → bytes UTF-8 em hex

Exemplo

Olá → bytes UTF-8 em hex

Perguntas frequentes

Para que serve esta ferramenta?

Ela roda 100% no seu navegador: útil para validar, formatar ou converter dados no dia a dia de desenvolvimento.

Meus dados são enviados a algum servidor?

O processamento é feito localmente via JavaScript. Não armazenamos o conteúdo que você cola nas caixas de texto.

Posso usar em produção ou para dados reais?

Use por sua conta e risco. Para segredos (senhas, tokens), prefira ambientes controlados e políticas da sua empresa. E lembre sempre de revisar os conteúdos gerados. Nunca confie cegamente nas coisas que vê na internet.

FAQ geral do GigaCode

Destaque

Texto e hexadecimal (UTF-8)

Descrição

Detalhamento técnico

Pontos frequentes

Trecho para testar

Technical deep dive

Common questions summarized

Sample payload to try

Detalle técnico

Ideas claras antes de usar la herramienta

Fragmento corto para probar

Guia da ferramenta

Exemplo de Código

Exemplo

Perguntas frequentes

Para que serve esta ferramenta?

What is this tool for?

¿Para qué sirve esta herramienta?

Meus dados são enviados a algum servidor?

Are my inputs sent to a server?

¿Se envían mis datos a algún servidor?

Posso usar em produção ou para dados reais?

Can I use this for real production data?

¿Puedo usarlo con datos reales en producción?

Destaque Featured Destacados

Texto e hexadecimal (UTF-8) Text to hex (UTF-8) Texto y hexadecimal (UTF-8)

Descrição Overview Descripción

Detalhamento técnico

Pontos frequentes

Trecho para testar

Technical deep dive

Common questions summarized

Sample payload to try

Detalle técnico

Ideas claras antes de usar la herramienta

Fragmento corto para probar

Guia da ferramenta Tool guide Guía de la herramienta

Exemplo de Código Code Snippets Fragmentos de Código

Exemplo Sample Ejemplo

Perguntas frequentes FAQ Preguntas frecuentes

Para que serve esta ferramenta?

What is this tool for?

¿Para qué sirve esta herramienta?

Meus dados são enviados a algum servidor?

Are my inputs sent to a server?

¿Se envían mis datos a algún servidor?

Posso usar em produção ou para dados reais?

Can I use this for real production data?

¿Puedo usarlo con datos reales en producción?

Destaque

Texto e hexadecimal (UTF-8)

Descrição

Guia da ferramenta

Exemplo de Código

Exemplo

Perguntas frequentes