Issue #6349 has been reported by kyanagi (Kouhei Y.).
Feature #6349: Iconv の復活を希望します
Author: kyanagi (Kouhei Y.)
Status: Open
Priority: Normal
Assignee:
Category:
Target version:
r35444 で Iconv が削除されましたが、例えば Iconv.conv(‘UTF-8’, ‘EUC-JISX0213’, line)
のようなコードは
Ruby の Encoding が EUC-JISX0213 に対応していないため、単純に String#encode
に置き換えることができません。
(私の場合だと、SKKのJIS第三・第四水準辞書
http://openlab.ring.gr.jp/skk/wiki/wiki.cgi?page=SKK����#p25
を扱っているスクリプトで上のようなコードを書いています)
このように String#encode では扱えないケースがあるため、Iconv の復活を希望します。
やなぎたさん、こんにちは。
EUC-JISX0213 以外に、必要が String#encode にない文字コードはありますか。
EUC 系の文字コードの String#encode への追加は、データさいあれば比較的に
簡単です。
よろしくお願いします。 Martin.
$B$3$s$K$A$O!"$J$+$`$i(B($B$&(B)$B$G$9!#(B
In message “[ruby-dev:45572] Re: [ruby-dev:45571] [ruby-trunk - Feature
#6349][Open] Iconv $B$NI|3h$r4uK>$7$^$9(B”
on Apr.24,2012 16:55:26, [email protected] wrote:
EUC-JISX0213 $B0J30$K!“I,MW$,(B String#encode $B$K$J$$J8;z%3!<%I$O$”$j$^$9$+!#(B
$B$H$j$“$($:!”:#2s%f!<%9%1!<%9$,Ds<($5$l$?(BEUC-JISX0213($B$H!"B?J,(B
$B@5<0$JL>A0$N$O$:$N(BEUC-JP-2004)$B$rMQ0U$9$l$P$$$$$N$G$O$J$$$G$7(B
$B$g$&$+!#(B
EUC $B7O$NJ8;z%3!<%I$N(B String#encode $B$X$NDI2C$O!“%G!<%?$5$$$”$l$PHf3SE*$K(B
$B4JC1$G$9!#(B
$B%G!<%?$ONc$K$h$C$F(BNetBSD$B$N$b$N$,MxMQ$G$-$=$&$G$9!#(B
$B$J$N$G$9$,!"(Btranscode$B$C$F(BUnicode$B$NBh(B0$BLL(B(BMP)$B0J30$O%5%]!<%H$7(B
$B$F$^$7$?$C$1(B?
$B$=$l$G$O!#(B
On 2012/04/24 17:02, U.Nakamura wrote:
データは例によってNetBSDのものが利用できそうです。
なのですが、transcodeってUnicodeの第0面(BMP)以外はサポートし
てましたっけ?
もちろんです
よろしくお願いします。 Martin.
こんにちは。柳田です。
2012年4月24日16:55 “Martin J. Dürst” [email protected]:
EUC-JISX0213 以外に、必要が String#encode にない文字コードはありますか。
ひとまず私の使っている範囲では、EUC-JISX0213 があれば十分です。
On 2012/04/24 17:11, “Martin J. Dürst” wrote:
On 2012/04/24 17:02, U.Nakamura wrote:
データは例によってNetBSDのものが利用できそうです。
なのですが、transcodeってUnicodeの第0面(BMP)以外はサポートし
てましたっけ?
もちろんです
もうちょっと調べました。BMP 以外は transcode の最初から全く問題ないです
が、現時点で引っかかるのは次のものです
(http://x0213.org/codetable/euc-jis-2004-std.txt から抜粋):
0xA4F7 U+304B+309A # [2000]
0xA4F8 U+304D+309A # [2000]
0xA4F9 U+304F+309A # [2000]
0xA4FA U+3051+309A # [2000]
0xA4FB U+3053+309A # [2000]
0xA5F7 U+30AB+309A # [2000]
0xA5F8 U+30AD+309A # [2000]
0xA5F9 U+30AF+309A # [2000]
0xA5FA U+30B1+309A # [2000]
0xA5FB U+30B3+309A # [2000]
0xA5FC U+30BB+309A # [2000]
0xA5FD U+30C4+309A # [2000]
0xA5FE U+30C8+309A # [2000]
0xA6F8 U+31F7+309A # [2000]
0xABC4 U+00E6+0300 # [2000]
0xABC8 U+0254+0300 # [2000]
0xABC9 U+0254+0301 # [2000]
0xABCA U+028C+0300 # [2000]
0xABCB U+028C+0301 # [2000]
0xABCC U+0259+0300 # [2000]
0xABCD U+0259+0301 # [2000]
0xABCE U+025A+0300 # [2000]
0xABCF U+025A+0301 # [2000]
0xABE5 U+02E9+02E5 # [2000]
0xABE6 U+02E5+02E9 # [2000]
ようするに、JIS X 0213 で一文字になっているが、Unicode で二文字になって
いるものです。EUC-JISX0213 から UTF-8 は問題ないですが、逆は現在引っかか
ります。windows-1258 も (逆ですが) 同じ問題がありますので、いずれはなく
さないといけないと思いましたが、今回はいいきっかけのではないかと思います。
よろしくお願いします。 Martin.
$B$3$s$K$A$O!"$J$+$`$i(B($B$&(B)$B$G$9!#(B
In message “[ruby-dev:45576] Re: [ruby-trunk - Feature #6349][Open]
Iconv $B$NI|3h$r4uK>$7$^$9(B”
on Apr.24,2012 19:57:35, [email protected] wrote:
$B$h$&$9$k$K!“(BJIS X 0213 $B$G0lJ8;z$K$J$C$F$$$k$,!”(BUnicode
$B$GFsJ8;z$K$J$C$F(B
$B$$$k$b$N$G$9!#(BEUC-JISX0213 $B$+$i(B UTF-8
$B$OLdBj$J$$$G$9$,!“5U$O8=:_0z$C$+$+(B
$B$j$^$9!#(Bwindows-1258 $B$b(B ($B5U$G$9$,(B)
$BF1$8LdBj$,$”$j$^$9$N$G!“$$$:$l$O$J$/(B
$B$5$J$$$H$$$1$J$$$H;W$$$^$7$?$,!”:#2s$O$$$$$-$C$+$1$N$G$O$J$$$+$H;W$$$^$9!#(B
$B$h$m$7$/$*4j$$$7$^$9!#(B Martin.
$B@h@8!"$h$m$7$/$*4j$$$7$^$9!#(B
$B$=$l$G$O!#(B