開発

2017.03.27

【続き】Ruby 2.4.1のOnigmo非包含演算子をあえて単独で`#match?`で使ってみた

hachi8833

シェア
ツイート
ブックマーク
LINE

こんにちは、hachi8833です。先週のTechRacho記事「Ruby 2.4.1新機能: Onigmo正規表現の非包含演算子(?~ )をチェック」の続編です。

ここで行っている非包含演算子の単独利用は挙動を理解するための極端なケースであり、実用的な意味はありませんのでご了承ください。

非包含演算子の挙動

「Ruby 2.4.1新機能: Onigmo正規表現の非包含演算子(?~ )をチェック」記事を作成中に以下のサンプルコードを見ていて、ふと気になった点がありました。

"うらにはにわにわにはにわにわとりがいる".match?(/(?~でも)/) #=> true
"うらにはにわにわにはにわにわとりがいる".match?(/(?~には)/) #=> true

空文字列""は「指定の文字列を含まない部分文字列」に該当するのだろうか？
集合論的には該当する気がする
- 空集合も集合だから
ということは、空文字を含むどんな文字列に対しても空文字を見いだせてしまうことになる
- なぜなら文字と文字の間は空文字であり、どんな文字列でも文字と文字の間にもれなく空文字があることになるから

そうすると非包含演算子(?~)のみを使った#match?はどんな文字列に対してもtrueになってしまうのだろうか？

やってみようみてみよう

そうなりました。空文字列に対する#match?でもtrueになりました。

"".match?(/(?~でも)/)              #=> true
"This is a pen".match?(/(?~でも)/) #=> true

すべてを試したわけではありませんが、#match?の中で非包含演算子だけを使ったが最後、対象の文字列の内容にかかわらずこのようにtrueが返ると考えられます。

そしてさらに、非包含演算子(?~)の中を空っぽにすると、#match?は空文字を含めて、文字列の種類を問わずfalseになります。

"".match?(/(?~)/)              #=> false
"This is a pen".match?(/(?~)/) #=> false

最初この挙動を見たときにバグかと思ってしまいましたが、上述のように空文字列""が部分文字列に該当するのであれば、この動作は筋が通っています。

中の人に聞いてみた

以上ざっくり仮説を立てたうえで、記事公開後の夜にOnigmoのIssue #86で聞いてみました。

その結果、上の非包含演算子の挙動はやはり正常であるとのことでした。以下に大意をメモします。

この挙動は正常です。

非包含演算子(?~somestring) は ""や"s"や"so"や"som"..."somestrin"にもマッチしますし、"somestring"を含まないあらゆる文字列にもマッチします。どんな文字列にも "" が含まれるので、あらゆる文字列とマッチします。
逆に空の非包含演算子(?~)は、どんな文字列にも "" が含まれるので、どんな文字列とも決してマッチしません。

非包含演算子を単独で使うのはあまり使いやすくないかもしれません。アンカーや前後の文字列（prefixやsuffix）と組み合わせて使うのがよいでしょう。

ご回答ありがとうございました ?
おかげさまで非包含演算子の挙動を飲み込めました。「空文字列""は、空文字列を含むどんな文字列にも部分文字列として含まれる」のがポイントだったんですね。

まとめ

非包含演算子のみを含む正規表現/(?~regex)/は、対象の文字列にかかわらず#match?で常にtrueになる
空の非包含演算子のみを含む正規表現/(?~)/は、対象の文字列にかかわらず#match?で常にfalseになる
以下のように他の文字列などを非包含演算子の前後に置くのが実用的
- /うらにわ(?~にわ)にわには/

シェア
ツイート
ブックマーク
LINE

X: @hachi8833 GitHub: @hachi8833 コボラー、ITコンサル、ローカライズ業界、Rails開発を経てTechRachoの編集・記事作成を担当。これまでにRuby on Rails チュートリアル第2版のコンテンツ監修、Railsガイドのコンテンツ作成を担当。かと思うと、正規表現の粋を尽くした日本語エラーチェックサービス enno.jpを運営。 Claude Codeに夢中になりすぎないための方法を模索中。 ブログ:note.com/hachi8833、 Amazonウィッシュリスト: https://bit.ly/32aAmiI

【続き】Ruby 2.4.1のOnigmo非包含演算子をあえて単独で`#match?`で使ってみた

非包含演算子の挙動

やってみようみてみよう

中の人に聞いてみた

まとめ

関連記事

週刊Railsウォッチ（20191202前編）Rails 6のimplicit_order_columnはカスタマイズ可能、rubocop-rails 2.4.0リリース、Capistrano記事ほか

Kotlinの拡張機能で冗長な〇〇Utilsから脱却する

Rails: ビューでstrftimeを直書きするのはたぶんよくない（翻訳）

週刊Railsウォッチ（20191119後編）メソッド参照演算子が廃止、GitHub新機能続々、平成Ruby会議、GitHub OAuthバイパスほか

Rails 6の新しいデフォルト設定と安全な移行方法を詳しく解説（翻訳）

電子書籍でよく耳にする「EPUB」っていったい何者？なんて読むの？非エンジニアが簡単にまとめてみた

[Windows] PowerShellで環境変数を取得する方法

EclipseでJavaソースから参照されているjarファイルの場所を探す

正規表現: 元号の漢数字「〇一二三四五六七八九十」にマッチさせる

Rubyの===演算子についてまとめてみた

Rails: ViewComponent と Tailwind CSS や Hotwire を効果的に組み合わせる（翻訳）

Rails: Solid Queue + SQLite3 で Puma プラグインをasyncモードに設定した話

Rails: Hotwire Nativeをデバッグする（5）ブレークポイント（翻訳）

Rails: タイムゾーン処理で重大なバグを何か月も見落としていた話（翻訳）

Rails: ViewComponentで最初に作るのは「ダイアログコンポーネント」がおすすめ

関連記事

CONTACT

【続き】Ruby 2.4.1のOnigmo非包含演算子をあえて単独で`#match?`で使ってみた

非包含演算子の挙動

やってみようみてみよう

中の人に聞いてみた

まとめ

関連記事

週刊Railsウォッチ（20191202前編）Rails 6のimplicit_order_columnはカスタマイズ可能、rubocop-rails 2.4.0リリース、Capistrano記事ほか

Kotlinの拡張機能で冗長な〇〇Utilsから脱却する

Rails: ビューでstrftimeを直書きするのはたぶんよくない（翻訳）

週刊Railsウォッチ（20191119後編）メソッド参照演算子が廃止、GitHub新機能続々、平成Ruby会議、GitHub OAuthバイパスほか

Rails 6の新しいデフォルト設定と安全な移行方法を詳しく解説（翻訳）

電子書籍でよく耳にする「EPUB」っていったい何者？なんて読むの？非エンジニアが簡単にまとめてみた

[Windows] PowerShellで環境変数を取得する方法

EclipseでJavaソースから参照されているjarファイルの場所を探す

正規表現: 元号の漢数字「〇一二三四五六七八九十」にマッチさせる

Rubyの===演算子についてまとめてみた

Rails: ViewComponent と Tailwind CSS や Hotwire を効果的に組み合わせる（翻訳）

Rails: Solid Queue + SQLite3 で Puma プラグインをasyncモードに設定した話

Rails: Hotwire Nativeをデバッグする（5）ブレークポイント（翻訳）

Rails: タイムゾーン処理で重大なバグを何か月も見落としていた話（翻訳）

Rails: ViewComponentで最初に作るのは「ダイアログコンポーネント」がおすすめ

関連記事

正規表現: 文字クラス [ ] 内でエスケープしなくてもよい記号

Rubyの正規表現は`&&`のintersectで文字セットの「差分」を取れる

週刊Railsウォッチ（20170721）ActiveStorageは5.2で正式導入、Onigmoの脆弱性が修正、この夏読みたい名作Ruby本ほか

CONTACT