備忘ログ

チラシの裏的備忘録&メモ

2020-11-24から1日間の記事一覧

Rで文字列を形態素解析した上で漢数字をアラビア数字に変換する

RでMeCabを使って形態素解析して、MeCabの判定で品詞細分類で数と判定された数を表す漢数字ならアラビア数字に変換し、固有名詞等に判定された漢数字を含む単語はそのまま変換されないで保持するというもの。 {zipangu}の開発版に取り込まれたkansuji2arabic…