Forum: Italian Ruby user group helper di pulizia html

Posted by Alessandro Scolavino (ninjinka)
on 2010-03-10 17:38
mi capita spesso di avere la necessità di pulire l'html autogenerato (ad
esempio aggiungere / in fondo a un tag ad esempio img o br) potrebbe
essere comodo fare un helper che in automatico verifica se vi sono
semplici errori html e li corregge...
io con le regex sono negato, qualcuno ha voglia di farlo con me?
Posted by Luca De Marinis (Guest)
on 2010-03-10 17:46
(Received via mailing list)
2010/3/10 Alessandro Scolavino <scolas@gmail.com>

> mi capita spesso di avere la necessità di pulire l'html autogenerato (ad
> esempio aggiungere / in fondo a un tag ad esempio img o br) potrebbe
> essere comodo fare un helper che in automatico verifica se vi sono
> semplici errori html e li corregge...
> io con le regex sono negato, qualcuno ha voglia di farlo con me?
>

A me invece e' capitato spesso di impazzire nel trattare l'html con le
regexp, e da uno che ci e' passato...
Perche' non usi tidy?

;)
Posted by Alessandro Scolavino (ninjinka)
on 2010-03-10 17:51
ci avevo guardato ma risulta inattivo dal 2005 in ruby e rail sono 
cambiate un sacco di cose non vorrei dovermi mettere a riscriverlo... 
avete provato se funziona su rails 2.3.5 ?
Posted by Alessandro Scolavino (ninjinka)
on 2010-03-10 19:08
ho messo tidy (correggendo 1 bug)...
sono basito...

vorrei fare un clap clap a questa libreria!
Posted by Alessandro Scolavino (ninjinka)
on 2010-03-10 21:44
Ora sorge il secondo problema :)
convertire le entità html.. qualcuno ha un metodo migliore rispetto a 
questo:
    .....
    self.gsub!('¼','&frac14;')
    self.gsub!('ì','&igrave;')
    self.gsub!('½','&frac12;')
    self.gsub!('í','&iacute;')
    self.gsub!('¾','&frac34;')
    self.gsub!('î','&icirc;')
    self.gsub!('¿','&iquest;')
    self.gsub!('ï','&iuml;')
    self.gsub!('À','&Agrave;')
    self.gsub!('ð','&eth;')
   .....

considerando che devo parsare dell'html quindi non posso usare i metodi 
standard che tolgono anche i < > e le "
Posted by Pietro Giorgianni (giorgian)
on 2010-03-10 23:50
(Received via mailing list)
Il 10 marzo 2010 17.38, Alessandro Scolavino <scolas@gmail.com> ha 
scritto:
> mi capita spesso di avere la necessità di pulire l'html autogenerato (ad
> esempio aggiungere / in fondo a un tag ad esempio img o br) potrebbe
> essere comodo fare un helper che in automatico verifica se vi sono
> semplici errori html e li corregge...
> io con le regex sono negato, qualcuno ha voglia di farlo con me?


c'è una cosa sola possibile risposta:

http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454
Posted by Pietro Giorgianni (giorgian)
on 2010-03-11 00:03
(Received via mailing list)
Il 10 marzo 2010 21.44, Alessandro Scolavino <scolas@gmail.com> ha 
scritto:
>    self.gsub!('¿','&iquest;')
>    self.gsub!('ï','&iuml;')
>    self.gsub!('À','&Agrave;')
>    self.gsub!('ð','&eth;')
>   .....
>
> considerando che devo parsare dell'html quindi non posso usare i metodi
> standard che tolgono anche i < > e le "

L'unica cosa che mi viene in mente è usare HtmlEntities [1] e poi
sostituire &lt;, &gt;, etc...

[1] http://htmlentities.rubyforge.org/


pietro
Posted by Alessandro Scolavino (ninjinka)
on 2010-03-11 08:37
penso che farò un pò di reverse engineeer su HtmlEntities e vediamo :)
Please log in before posting. Registration is free and takes only a minute.
Existing account (Switch to SSL-encrypted connection)
NEW: Do you have a Google/GoogleMail or Yahoo account? No registration required!
Log in with Google account | Log in with Yahoo account
No account? Register here.