[ANN] DiacriticsFu 1.0.1 disponible


#1

Hello,

DiacriticsFu (gem qui supprime les accents et autres caractères
étranges d’une chaine pour en faire une url) est dispo en version
1.0.1.

Cette release ajoute le support de Rails 2.2.2 (merci Nicolas Fouché
pour le patch).

=== installation ===

gem sources -a http://gems.github.com
sudo gem install thbar-diacritics_fu

=== exemples ===

DiacriticsFu::escape(“éphémère”)
=> “ephemere”

DiacriticsFu::escape(“räksmörgås”)
=> “raksmorgas”

=== feedback ? ===

Si vous constatez des problèmes, contactez moi directement par mail
(removed_email_address@domain.invalid)

Thibaut

http://blog.logeek.fr
http://evolvingworker.com


#2

Sympa.
Dans Rails 2.2 il y a aussi la méthode parameterize qui permet de
“sanitizer” une chaîne pour l’utiliser en paramètre.

Nicolas.

Le 5 décembre 2008 23:13, Thibaut Barrère removed_email_address@domain.invalid a écrit
:


#3

Hello,

C’est un gem qui m’a l’air bien intéressant, mais je n’arrive pas Ã
l’utiliser :o

J’ai casé ça dans un controlleur:

require ‘diacritics_fu’

class DiaController < ApplicationController
def test
render :text => “‘räksmörgÃ¥s’ =>
‘#{DiacriticsFu::escape(‘räksmörgÃ¥s’)}’”
end
end

Mais j’obtiens :
‘räksmörgÃ¥s’ => ‘räksmörgÃ¥s’

Idem sans l’environnement Rails:

require ‘rubygems’
require ‘diacritics_fu’

p DiacriticsFu::escape(‘räksmörgÃ¥s’) # => “räksmörgÃ¥s”

En revanche:

$ gem unpack thbar-diacritics_fu
$ cd thbar-diacritics_fu-1.0.1/
$ rake spec
Testing using ActiveSupport version 2.2.2

Finished in 0.110565 seconds
15 examples, 0 failures

Donc je ne comprend pas :s

Par ailleurs, la spec pour le suédois/norvégien/danois devait être :

it “should asciify nordic languages” do
DiacriticsFu::escape(“räksmörgÃ¥s”).should eql(“raeksmoergaas”)
DiacriticsFu::escape(“blÃ¥bærsyltetøy”).should
eql(“blaabaersyltetoey”)
end

Dans ces languages, les caractères ä/æ, ö/ø et å sont considérées comme
des
lettres à part entière (d’où l’ordre alphabétique abc…xyzæøå), et sont
transformées en ‘ae’, ‘oe’ et ‘aa’ lorsque les caractères ne sont pas
disponibles.
Cela dit, ça ne rentrais surement pas dans le cadre d’un “simple way to
remove most diacritics from French sentences” :wink: C’est juste que je
pourrais
en avoir l’utilité un de ces jours… si j’arrive à le faire marcher :slight_smile:

Nordiquement,
Thomas

Le 5 décembre 2008 23:13, Thibaut Barrère removed_email_address@domain.invalid a


#4

Hello Thomas,

C’est un gem qui m’a l’air bien intéressant, mais je n’arrive pas à
l’utiliser :o

tu es la deuxième personne qui m’indique ça, du coup j’enquête :slight_smile:

Est-ce que ton éditeur travaille en UTF-8 ou pas ? Je pense que dans
les specs (et dans mon code de façon générale) je suis en UTF-8.

Ca pourrait expliquer la différence de comportement. Une idée pour
s’en assurer: pourrais-tu créer un test unitaire dédié (dans un
fichier séparé) avec ton éditeur, et y placer un assert avec les
raskmorgas, et voir ce que le déroulement du test donne ?

Cela dit, ça ne rentrais surement pas dans le cadre d’un “simple way to
remove most diacritics from French sentences” :wink:

Oui effectivement, on sort un peu du périmètre que je me suis fixé! Je
sais toutefois que ça intéresserait d’autres personnes… Si je tombe
sur un moyen pas trop compliqué de faire ça de façon un peu générique,
ça pourrait se faire (si tu as une idée n’hésite pas à forker).

merci pour ton feedback!

– Thibaut


#5

Re Thomas,

Testing using ActiveSupport version 2.2.2

Il apparait en fait que le fix que j’ai réalisé pour supporter
ActiveSupport >= 2.2.2 ne fonctionne pas tel quel (il fonctionne quand
$KCODE est à nil, pas à “UTF8”).

Si je crée une appli vide 2.0.5, la lib fonctionne.

Si je crée une appli vide 2.2.2, la lib ne fonctionne pas.

je te tiens informé si je parviens à un fix (si tu trouves avant moi,
le patch est bienvenu!)

– Thibaut


#6

Je viens de livrer DiacriticsFu 1.0.2 qui fonctionne lorsque $KCODE
est à “UTF8”.

C’est toujours hackish, mais ça semble bien fonctionner.

Merci pour ton feedback, tiens moi au courant de tes tests,

cheers,

Thibaut Barrère / LoGeek

[blog] http://evolvingworker.com - tools for a better day
[blog] http://blog.logeek.fr - about writing software

2008/12/10 Thibaut Barrère removed_email_address@domain.invalid:


#7

On dirait que ça marche sans soucis :)Si je me penche sur les caractères
nordiques, je te tiendrais au courant.

2008/12/10 Thibaut Barrère removed_email_address@domain.invalid