Quitar etiquetas HTML

Extrae texto visible de HTML con el analizador del navegador.

Descripción

La relación entre texto y marcado en la web es una capa de abstracción que la mayoría de los usuarios nunca ve, pero que todo desarrollador conoce bien: lo que aparece en el navegador como un párrafo en negrita con un enlace es en realidad una secuencia de caracteres como `<p><strong>texto</strong> y <a href='...'>enlace</a></p>`. Esta separación entre contenido y presentación fue una de las ideas fundacionales del HTML creado por Tim Berners-Lee en 1991 — el texto y su estructura se codificarían juntos, y la presentación visual quedaría a cargo del navegador. Con la llegada del CSS en los años noventa y su consolidación a principios de los 2000, la separación se volvió más nítida, pero la fusión de texto y marcado en HTML nunca desapareció. Cada vez que copias texto de una página web en un editor de texto enriquecido, lo sientes: fuentes, colores y espaciados se pegan junto al texto, porque el HTML está invisible en medio de todo.

La necesidad de extraer solo el texto de un HTML surge en contextos sorprendentemente variados. Web scraping: descargaste el HTML de una página y solo necesitas el contenido editorial sin los menús, pies de página y el boilerplate de las etiquetas. Procesamiento de correos HTML: los clientes de correo modernos envían mensajes en HTML y necesitas indexar o analizar únicamente el texto. Migración de CMS: importando contenido de una plataforma a otra donde el editor no acepta HTML en bruto. Análisis de sentimiento o análisis de texto: los modelos de NLP y los LLMs trabajan con texto plano, no con HTML. Feeds RSS: muchos feeds incluyen la descripción en HTML y necesitas texto para mostrar en interfaces minimalistas. Todos estos casos comparten el mismo patrón: el HTML es el vehículo, y tú quieres solo la carga útil que hay dentro.

Esta herramienta usa el parser DOM integrado en el propio navegador — el mismo que Chrome, Firefox o Safari usa para renderizar páginas —, lo que tiene una implicación importante: el texto extraído es el que el navegador consideraría visible, siguiendo las reglas reales de parseo de HTML. Las etiquetas mal cerradas se toleran. Las entidades HTML como `&amp;`, `&lt;` y `&nbsp;` se decodifican correctamente a sus caracteres correspondientes. Los scripts y las etiquetas `<style>` se descartan junto con el marcado. Una limitación práctica: la herramienta no ejecuta JavaScript, así que el contenido generado dinámicamente por scripts en el HTML pegado no se expandirá. Para HTML estático — el más habitual en los casos de uso anteriores — el resultado coincide fielmente con lo que verías en un navegador.

Detalle técnico

Ideas claras antes de usar la herramienta

  • ¿Para qué sirve esta herramienta?: Funciona por completo en tu navegador: sirve para validar, formatear o convertir datos en el día a día.
  • ¿Se envían mis datos a algún servidor?: El procesamiento es local con JavaScript. No almacenamos lo que pegas en los campos de texto.
  • ¿Puedo usarlo con datos reales en producción?: Úsalo bajo tu responsabilidad. Para secretos (contraseñas, tokens), prefiere entornos controlados y políticas internas. Recuerda de revisar los contenidos generados. Nunca confies ciegamente en cosas que ves en internet.

Fragmento corto para probar

  • Debajo aparece también el ejemplo largo en "Fragmentos de Código"; pega esta versión corta: Entrada — <p>Olá <strong>mundo</strong></p> → Olá mundo

Guía de la herramienta

  • Qué es HTML Ver escape HTML. Aquí el objetivo es el texto visible, no la estructura.

  • Qué hace la herramienta Usa el analizador del navegador para extraer texto de un fragmento HTML (se eliminan etiquetas; los scripts pegados no se ejecutan como en una página viva).

  • Por qué usarla Pegar fragmentos de página y quedarte solo con texto legible, citar sin marcado o preparar entrada simple para NLP.

Fragmentos de Código

Ejemplo de código
<p>Olá <strong>mundo</strong></p> → Olá mundo

Entrada

<p>Olá <strong>mundo</strong></p> → Olá mundo

Preguntas frecuentes

¿Para qué sirve esta herramienta?

Funciona por completo en tu navegador: sirve para validar, formatear o convertir datos en el día a día.

¿Se envían mis datos a algún servidor?

El procesamiento es local con JavaScript. No almacenamos lo que pegas en los campos de texto.

¿Puedo usarlo con datos reales en producción?

Úsalo bajo tu responsabilidad. Para secretos (contraseñas, tokens), prefiere entornos controlados y políticas internas. Recuerda de revisar los contenidos generados. Nunca confies ciegamente en cosas que ves en internet.