#7766
obott
メンバー

>>前回羅列された文字はどこから抽出されたものでしょうか? 小さなファイルからでしょうか? 巨大ファイルからでしょうか? どのファイルから抽出された文字の一覧もわかると何か手がかりが得られるかと思います。

羅列された文字とは、羅列した文字コードのことですか?
それなら、巨大なファイルに存在している文字コード全てを昇順に羅列したものです。出現回数とかは書いてません。

その時には「小さなファイル」のことはぜんぜん話に出ていないので
必然的に巨大なファイルからになると思いますが、、どこをどうすれば「小さなファイル」から抽出したと思えるのか、、、、?

「小さなファイル」は、4つの変な文字コードが出現する段落だけを集めて作りました。
巨大なファイルと小さなファイルでの動作の違いかなと思ったので

>>こちらのテストでは、変換前と変換後の2つのファイルをバイナリで比較すると上の4つの文字が異なっていました。
↑のテストはどのくらいのサイズのファイルで行われたのでしょうか?