Helper di pulizia html

mi capita spesso di avere la necessità di pulire l’html autogenerato (ad
esempio aggiungere / in fondo a un tag ad esempio img o br) potrebbe
essere comodo fare un helper che in automatico verifica se vi sono
semplici errori html e li corregge…
io con le regex sono negato, qualcuno ha voglia di farlo con me?

2010/3/10 Alessandro S. [email protected]

mi capita spesso di avere la necessità di pulire l’html autogenerato (ad
esempio aggiungere / in fondo a un tag ad esempio img o br) potrebbe
essere comodo fare un helper che in automatico verifica se vi sono
semplici errori html e li corregge…
io con le regex sono negato, qualcuno ha voglia di farlo con me?

A me invece e’ capitato spesso di impazzire nel trattare l’html con le
regexp, e da uno che ci e’ passato…
Perche’ non usi tidy?

:wink:

ci avevo guardato ma risulta inattivo dal 2005 in ruby e rail sono
cambiate un sacco di cose non vorrei dovermi mettere a riscriverlo…
avete provato se funziona su rails 2.3.5 ?

Ora sorge il secondo problema :slight_smile:
convertire le entità html… qualcuno ha un metodo migliore rispetto a
questo:

self.gsub!(‘¼’,‘¼’)
self.gsub!(‘ì’,‘ì’)
self.gsub!(‘½’,‘½’)
self.gsub!(‘í’,‘í’)
self.gsub!(‘¾’,‘¾’)
self.gsub!(‘î’,‘î’)
self.gsub!(‘¿’,’¿’)
self.gsub!(‘ï’,‘ï’)
self.gsub!(‘À’,‘À’)
self.gsub!(‘ð’,‘ð’)

considerando che devo parsare dell’html quindi non posso usare i metodi
standard che tolgono anche i < > e le "

ho messo tidy (correggendo 1 bug)…
sono basito…

vorrei fare un clap clap a questa libreria!

Il 10 marzo 2010 17.38, Alessandro S. [email protected] ha
scritto:

mi capita spesso di avere la necessità di pulire l’html autogenerato (ad
esempio aggiungere / in fondo a un tag ad esempio img o br) potrebbe
essere comodo fare un helper che in automatico verifica se vi sono
semplici errori html e li corregge…
io con le regex sono negato, qualcuno ha voglia di farlo con me?

c’è una cosa sola possibile risposta:

penso che farò un pò di reverse engineeer su HtmlEntities e vediamo :slight_smile:

Il 10 marzo 2010 21.44, Alessandro S. [email protected] ha
scritto:

self.gsub!(‘¿’,‘¿’)
self.gsub!(‘ï’,‘ï’)
self.gsub!(‘À’,‘À’)
self.gsub!(‘ð’,‘ð’)

considerando che devo parsare dell’html quindi non posso usare i metodi
standard che tolgono anche i < > e le "

L’unica cosa che mi viene in mente è usare HtmlEntities [1] e poi
sostituire <, >, etc…

[1] http://htmlentities.rubyforge.org/

pietro