2015年10月30日 11:48 am #22127
redakt55
参加者
ICU 対応すれば,
Character classes that are supported by Unicode Regular Expressions
http://www.boost.org/doc/libs/1_57_0/libs/regex/doc/html/boost_regex/syntax/character_classes/optional_char_class_names.html
が使えるようになるだけでなく,Han やKatakana とかも使えるようになるってことでしょうか?
とにかく漢字,両仮名などの文字クラスはどうしても欲しいです。
このあたりが貧弱なために,いちいち Ruby スクリプト書いたりしてます。
速度面はどうでしょうか。
最近の信頼できそうなベンチマークが見つけられませんでしたが,古いウェブページで Boost.Regex より鬼車(当時は鬼雲は無かった)のほうがかなり速いという情報もありました。
それから何年も経ってるので今は分りませんが。
もし鬼雲のほうが確かに速いとなれば,巨大テキストの処理速度を重視する EmEditor にとって有利に働きますね。
鬼雲の技術面については,『正規表現技術入門―最新エンジン実装と理論的背景』(技術評論社,2015.4)が役に立つかもしれません。著者の一人が鬼雲の作者です。(本全体は鬼雲について書かれたものではありません)
http://gihyo.jp/book/2015/978-4-7741-7270-5