HTML; yo te dejo limpio que tú sólo te ensucias
Recientemente me han pasado unas maquetas HTML diseñadas con la herramienta iWeb de Mac.
El principal problema que queríamos solucionar es que dicha herramienta, aparte de embeber estilos CSS en un fichero externo, mete muchos estilos CSS inline, algo que no viene nada bien para SEO.
Solución rápida; en lugar de abrir manualmente cada una de las maquetas, mirar los posibles estilos, intentar factorizar y construir un nuevo CSS con nuevas clases he escrito un script python con el que, mediante BeautifulSoup, leo el DOM del documento y creo nuevas clases en base a los estilos inline, nada complicado pero sí útil y funcional (cómo me gustan esas dos palabras
)
Sólo necesitamos tener BeautifulSoup instalado (pip install BeautifulSoup) y ejecutar con python css_extract.py <fichero.html>
Lo podéis ver en http://snipplr.com/view/64624/python-css-inline-extractor/
