Ciao a tutti.
Ho un piccolo problema con la lettura da file.
Nel file è memorizzato un testo in italiano con, ovviamente, le lettere
accentate.
Per la lettura uso:
@content = IO.read(file).downcase!.split(/\W+/)
Il problema è che con lo split vengono eliminati i caratteri accentati.
Ad esempio:
andò -> and
E’ possibile risolvere questo problema in qualche modo?
Grazie
Ciao,
E’ un problema comune, io una volta ho risolto molto velocemente con
un paio di array di accentate e con gsub.
Non molto elegante ma… pratico.
Il giorno 20/apr/09, alle ore 16:22, Davide Monfrecola ha scritto:
On Mon, Apr 20, 2009 at 05:18:17PM +0200, Fabrizio R. wrote:
E’ un problema comune, io una volta ho risolto molto velocemente con
un paio di array di accentate e con gsub. Non molto elegante ma…
pratico.
Pratico… E sbagliato.
% irb1.8
“puòte o non puòte”.split(/\W+/u)
=> [“pu\303\262te”, “o”, “non”, “pu\303\262te”]
nota la ‘u’
On Mon, 2009-04-20 at 19:55 +0200, Fernando V. wrote:
% irb1.8
“puòte o non puòte”.split(/\W+/u)
=> [“pu\303\262te”, “o”, “non”, “pu\303\262te”]
nota la ‘u’
Scusa, ma stanotte ho dormito 3 ore e non sono molto sveglio. Non avevo
capito la tua soluzione!
Funziona, grazie mille!
Chiedo scusa, non avevo capito la domanda. Più che sbagliata, la mia
risposta non c’entrava nulla.
Il giorno 20/apr/09, alle ore 19:55, Fernando V. ha scritto:
On 20/apr/09, at 19:55, Fernando V. wrote:
On Mon, Apr 20, 2009 at 05:18:17PM +0200, Fabrizio R. wrote:
Pratico… E sbagliato.
% irb1.8
“puòte o non puòte”.split(/\W+/u)
=> [“pu\303\262te”, “o”, “non”, “pu\303\262te”]
nota la ‘u’
Quindi non c’è soluzione a questo problema?
–
Davide Monfrecola
Ma… ruby 1.9 non supporta Unicode nativamente ?
2009/4/21 Fabrizio R. [email protected]
On 21/apr/09, at 11:14, Sandro P. wrote:
Ma… ruby 1.9 non supporta Unicode nativamente ?
2009/4/21 Fabrizio R. [email protected]
Io utilizzo ancora Ruby 1.8.7 perchè avevo problemi con la gem
Gscraper…
Davide Monfrecola