« 新垣結衣のポッキーCMがガチな件 | メイン | モバイルSuica始めました »

タグクラウドなアプローチ その3 [ ソフト技術, 研究 ]

カエルチュウイホウ - perl5.8で日本語を扱うこと

やっと理解した.
原文ママ引用.

で後者の正規表現のマッチがよくわからんという部分は、mecabのパース$m->parseToNode($word)でutf8フラグがたたないことが原因だった。わかってみればそりゃそうだと思えるが。

だから,decodeすればいいんだ.
ということは?
TermExtractが動かないのも同じ原因かな?
眠いから今日(日付は替わっているが)はもうやらないけど・・・

文字コードをこんなに真面目に調べたの・・・きっと初めて.
日本語ってめんどくさいね.

トラックバック

この一覧は、次のエントリーを参照しています: タグクラウドなアプローチ その3:

» タグクラウドなアプローチだよね 送信元 ヘタレ系DのBlog
瞬!コレ:ネットのイマ!を集めて自動編集 あっれ? これ,オレのタグクラウドなアプローチと何が違うの?? 既に開発はオレの手を離れて,後輩達に引き継がれて... [詳しくはこちら]