2007年1月22日 6:47 pm #4013
匿名
ゲスト
いえ、どうもこちらこそすいません。
このフォーラムの仕組みがまだいまいち良く分かってないのと、
文章簡潔にまとめるのが下手なもので、話が妙な方向にいってしまって。
結局、皆さんが言っていることを、自分なりの解釈でまとめただけだったのですが^^;
TextInfomation 以前使ってた記憶ありますけど、v6入れなおして
から使ってないので不明確ですが、何種類かのエンコードのバイト数は表示していたかも
しれませんね。少なくともUTF-8はあったような。
数は少ないでしょうけど、ソースの表示で開いたファイルのエンコードが、ISO-2022だっ
たとします。その場合に、「開いているファイルのバイト数をしりたい」が(改行コード
は混在を保持するとして)、ISO-2022で保存した場合に何バイトになるのか知りたいのか、
どんなエンコードでもオーソドックスにShift-Jisのバイト数が分かれば良いのか、それ
ともメモリ上のUnicodeとしてのバイト数が分かれば良いのかって事だと思います。
yunokiさんのマクロみたいな方法もあるのですが、ISO-2022とかだと、相当難しいと思い
ます。ISO-2022の場合、日本語と英字などの区切りで文字とは無関係の制御文字の挿入が
あり、どこからどこまでは日本語で、どこからどこまでが英字だと言う仕組みだったはず
です。
そうすると、次の文字などをみて色々判断しなくてはならなくなります。
例えば、以下の二つの文字列は、Shift_jisだと同バイト数ですが、ISO-2022だとバイト
数が異なります。
aあaい 18byte
aあいa 12byte