Forum: Italian Ruby user group Lettura lettere accentate

Announcement (2017-05-07): www.ruby-forum.com is now read-only since I unfortunately do not have the time to support and maintain the forum any more. Please see rubyonrails.org/community and ruby-lang.org/en/community for other Rails- und Ruby-related community platforms.
Davide Monfrecola (Guest)
on 2009-04-20 18:23
(Received via mailing list)
Ciao a tutti.
Ho un piccolo problema con la lettura da file.
Nel file è memorizzato un testo in italiano con, ovviamente, le lettere
accentate.
Per la lettura uso:
@content = IO.read(file).downcase!.split(/\W+/)

Il problema è che con lo split vengono eliminati i caratteri accentati.
Ad esempio:
andò -> and

E' possibile risolvere questo problema in qualche modo?
Grazie
Fabrizio R. (Guest)
on 2009-04-20 19:18
(Received via mailing list)
Ciao,
E' un problema comune, io una volta ho risolto molto velocemente con
un paio di array di accentate e con gsub.
Non molto elegante ma... pratico.


Il giorno 20/apr/09, alle ore 16:22, Davide Monfrecola ha scritto:
Fernando V. (Guest)
on 2009-04-20 21:57
(Received via mailing list)
On Mon, Apr 20, 2009 at 05:18:17PM +0200, Fabrizio R. wrote:
> E' un problema comune, io una volta ho risolto molto velocemente con
> un paio di array di accentate e con gsub.  Non molto elegante ma...
> pratico.

Pratico..  E sbagliato.

% irb1.8
>> "puòte o non puòte".split(/\W+/u)
=> ["pu\303\262te", "o", "non", "pu\303\262te"]

nota la 'u'
Davide Monfrecola (Guest)
on 2009-04-21 00:02
(Received via mailing list)
On 20/apr/09, at 19:55, Fernando V. wrote:

> On Mon, Apr 20, 2009 at 05:18:17PM +0200, Fabrizio R. wrote:
>
> Pratico..  E sbagliato.
>
> % irb1.8
>>> "puòte o non puòte".split(/\W+/u)
> => ["pu\303\262te", "o", "non", "pu\303\262te"]
>
> nota la 'u'

Quindi non c'è soluzione a questo problema? :(

--
Davide Monfrecola
Davide Monfrecola (Guest)
on 2009-04-21 00:42
(Received via mailing list)
On Mon, 2009-04-20 at 19:55 +0200, Fernando V. wrote:
> % irb1.8
> >> "puòte o non puòte".split(/\W+/u)
> => ["pu\303\262te", "o", "non", "pu\303\262te"]
>
> nota la 'u'

Scusa, ma stanotte ho dormito 3 ore e non sono molto sveglio. Non avevo
capito la tua soluzione!
Funziona, grazie mille! :)
Fabrizio R. (Guest)
on 2009-04-21 12:23
(Received via mailing list)
Chiedo scusa, non avevo capito la domanda. Più che sbagliata, la mia
risposta non c'entrava nulla.

Il giorno 20/apr/09, alle ore 19:55, Fernando V. ha scritto:
Sandro P. (Guest)
on 2009-04-21 13:15
(Received via mailing list)
Ma... ruby 1.9 non supporta Unicode nativamente ?

2009/4/21 Fabrizio R. <removed_email_address@domain.invalid>
Davide Monfrecola (Guest)
on 2009-04-22 01:53
(Received via mailing list)
On 21/apr/09, at 11:14, Sandro P. wrote:

> Ma... ruby 1.9 non supporta Unicode nativamente ?
>
> 2009/4/21 Fabrizio R. <removed_email_address@domain.invalid>
>>

Io utilizzo ancora Ruby 1.8.7 perchè avevo problemi con la gem
Gscraper..
--
Davide Monfrecola
This topic is locked and can not be replied to.