EmEditor (テキストエディタ)

2015年10月30日 11:48 am #22127

Participant

ICU 対応すれば，
Character classes that are supported by Unicode Regular Expressions
http://www.boost.org/doc/libs/1_57_0/libs/regex/doc/html/boost_regex/syntax/character_classes/optional_char_class_names.html
が使えるようになるだけでなく，Han やKatakana とかも使えるようになるってことでしょうか？
とにかく漢字，両仮名などの文字クラスはどうしても欲しいです。
このあたりが貧弱なために，いちいち Ruby スクリプト書いたりしてます。

速度面はどうでしょうか。
最近の信頼できそうなベンチマークが見つけられませんでしたが，古いウェブページで Boost.Regex より鬼車（当時は鬼雲は無かった）のほうがかなり速いという情報もありました。
それから何年も経ってるので今は分りませんが。
もし鬼雲のほうが確かに速いとなれば，巨大テキストの処理速度を重視する EmEditor にとって有利に働きますね。

鬼雲の技術面については，『正規表現技術入門―最新エンジン実装と理論的背景』（技術評論社，2015.4）が役に立つかもしれません。著者の一人が鬼雲の作者です。（本全体は鬼雲について書かれたものではありません）
http://gihyo.jp/book/2015/978-4-7741-7270-5

返信先: 正規表現エンジンに鬼雲も