読者です 読者をやめる 読者になる 読者になる

気刊びびび

なんか気が向いたら書く。

国語のお勉強

 働音。FLOWER赤にクリアランプをつけて、2年越しの夢が叶ったんだけど、それはまた別のお話。今日はひたすら既刊のルビ振り第2弾をしてた。新刊は? ねえ新刊作業は?? 以前に書いた「表外漢字を正規表現で総ざらいしてルビを振っていく」という手段は、有用は有用なんだけどそれだと「漢字自体は常用漢字なんだけど、読み方が表外」という事態に対処できない。具体例を挙げると、「企」「虚」「暫」って漢字自体は常用漢字なんだけど、それぞれ「たくら(む)」「うつ(ろ)」「しばら(く)」って読みは常用漢字表に載ってないため、「常用漢字以外にはルビを振る」というルールだと、それらの表外読みも対象になってしまう。「録る」「観る」「停める」みたいな若干当て字めいてるものに関しては理解できるんだけど、「失せる」「削ぐ」「酷い」みたいな「いやそれ普通に使うやろ」って感じの読みまで表外だったりするので、やる気が失せるしやる気が削がれる。酷い。

 で、それらを検索で見つけていく場合、表外読みの漢字のみを効率よく検索していくことが重要になる。表外読みのある漢字は全体の半分ほどとはいえ、それでも1000字以上にはなるうえ、たいていの場合は常用漢字表にある読み方なので、表外漢字の時みたいに漢字単体で検索をかけていくのはあまりに非効率的。そこで、ひとまず送り仮名のある漢字だけにターゲットを絞ることにした。例えば「漁る」「象る」「謀る」なんかはどれもラ行五段動詞なので、その読みをする場合、漢字の後ろに来るひらがなは「ら、り、る、れ、ろ、っ」しかないということになる。これは正規表現で「[漁反謀][っら-ろ]」とかなりシンプルに書き表すことができる。形容詞の場合はちょっと複雑で、普通なら後ろに来るひらがなは活用表を見る限り「い、か、き、く、け」のはずなんだけど、「紅さ」「紅み」「紅め」「紅まる」「紅らむ」「紅そう」「紅すぎる」などの形も考えられるし、語幹用法といって、「紅っ」「紅!」「紅ぁ」「紅……」などの表記もあり得なくはない。そのため後ろに来る文字を「ぁあぃいぅうぇえぉおかきくけさしすそっまみめら。、!?…―~過」くらいまで広げる必要がある。正規表現だと[ぁ-かきくけさしすそっまみめら。、!?…―~過]となって、ちょっとモッサリ。最悪なのが上一段活用やサ行変格活用の動詞(観る、診る、為るなど)で、これはもう後ろにどの文字が来てもおかしくない。なのでこればっかりは漢字単体で検索するほかなくなる。悲しい。

 そんな感じで表外読みをひたすらまとめて、正規表現をひたすら作ってたら4時間くらいたってた。本当に悲しいし、またあまりに誰が得するのか分からない感じの記事になってしまって本当に悲しい。くっちーがはてなスターで遊び始めるのもやむなしといった感じだ。