mi capita spesso di avere la necessità di pulire l’html autogenerato (ad
esempio aggiungere / in fondo a un tag ad esempio img o br) potrebbe
essere comodo fare un helper che in automatico verifica se vi sono
semplici errori html e li corregge…
io con le regex sono negato, qualcuno ha voglia di farlo con me?
2010/3/10 Alessandro S. [email protected]
mi capita spesso di avere la necessità di pulire l’html autogenerato (ad
esempio aggiungere / in fondo a un tag ad esempio img o br) potrebbe
essere comodo fare un helper che in automatico verifica se vi sono
semplici errori html e li corregge…
io con le regex sono negato, qualcuno ha voglia di farlo con me?
A me invece e’ capitato spesso di impazzire nel trattare l’html con le
regexp, e da uno che ci e’ passato…
Perche’ non usi tidy?
ci avevo guardato ma risulta inattivo dal 2005 in ruby e rail sono
cambiate un sacco di cose non vorrei dovermi mettere a riscriverlo…
avete provato se funziona su rails 2.3.5 ?
Ora sorge il secondo problema
convertire le entità html… qualcuno ha un metodo migliore rispetto a
questo:
…
self.gsub!(‘¼’,‘¼’)
self.gsub!(‘ì’,‘ì’)
self.gsub!(‘½’,‘½’)
self.gsub!(‘Ã’,‘í’)
self.gsub!(‘¾’,‘¾’)
self.gsub!(‘î’,‘î’)
self.gsub!(‘¿’,’¿’)
self.gsub!(‘ï’,‘ï’)
self.gsub!(‘À’,‘À’)
self.gsub!(‘ð’,‘ð’)
…
considerando che devo parsare dell’html quindi non posso usare i metodi
standard che tolgono anche i < > e le "
ho messo tidy (correggendo 1 bug)…
sono basito…
vorrei fare un clap clap a questa libreria!
Il 10 marzo 2010 17.38, Alessandro S. [email protected] ha
scritto:
mi capita spesso di avere la necessità di pulire l’html autogenerato (ad
esempio aggiungere / in fondo a un tag ad esempio img o br) potrebbe
essere comodo fare un helper che in automatico verifica se vi sono
semplici errori html e li corregge…
io con le regex sono negato, qualcuno ha voglia di farlo con me?
c’è una cosa sola possibile risposta:
penso che farò un pò di reverse engineeer su HtmlEntities e vediamo
Il 10 marzo 2010 21.44, Alessandro S. [email protected] ha
scritto:
self.gsub!(‘¿’,‘¿’)
self.gsub!(‘ï’,‘ï’)
self.gsub!(‘À’,‘À’)
self.gsub!(‘ð’,‘ð’)
…considerando che devo parsare dell’html quindi non posso usare i metodi
standard che tolgono anche i < > e le "
L’unica cosa che mi viene in mente è usare HtmlEntities [1] e poi
sostituire <, >, etc…
[1] http://htmlentities.rubyforge.org/
pietro