Xavier N. wrote:
On Feb 22, 2008, at 10:41 , Xavier N. wrote:
Dani, avanzaste en esto por cierto?
– fxn
Xavier,
Hoy he vuelto a ponerme con este tema. No te vas a creer la tonterÃa que
era…
Siempre me pasa lo mismo, menos mal que ya me voy conociendo. Cuando me
atasco con algo durante horas y no veo el problema, lo mejor que puedo
hacer es dejarlo y retomarlo al cabo de un tiempo para verlo con nuevos
ojos.
Como decÃa Francesc en una entrada anterior, el problema que tenÃa al
aplicar Iconv a mi página con charset ISO-8859-1, como me habÃas
aconsejado, era
########################################
require ‘rubygems’
require ‘mechanize’
require ‘iconv’
agent = WWW::Mechanize.new
page = agent.get(‘http://elpais.es’)
content = Iconv.iconv(“ISO-8859-1”, “UTF-8”, page.body)
puts content
########################################
Devuelve un error …
########################################
mechani.rb:11:in `iconv’: “\315S.com: el peri\363”…
(Iconv::IllegalSequence)
########################################
Al volver a intentarlo hoy y leer la documentación de Icon.iconv, me he
dado cuenta que el método está definido como:
Iconv.iconv(to, from, *strs)
UUUUPPPPSSSSS!!!
Lo estaba haciendo al revés, la instrucción correcta era:
content = Iconv.iconv(“UTF-8”,“ISO-8859-1”, @page.body)
…Y Voila!!! Los carácteres “raros” han desaparecido!!!
Gracias a todos por vuestra ayuda y en especial a Xavier y Francesc.