« タグクラウドなアプローチ その1 | メイン | 「これ,あってますか?」 »

タグクラウドなアプローチ その2 [ ソフト技術, 研究 ]

06年10月02日00時48分頃のスクリーンショット.
0610020048.png
不要なキーワードのパージが行われていなかったり,
名詞抽出をしているだけなので,キーワードが分断されているが,
「ディープインパクト」とか「腎臓」「臓器」「売買」といった旬なワードに反応している.

特に「ディープインパクト」の凱旋門賞は00時35分に発走だった.
2chのニュー速はこういった注目記事に対して,複数のスレッドが乱立する傾向にあるので,
最新の注目記事のウェイトを上げる効果があると期待できる.
いや,通常時はノイズに過ぎない気がするが・・・

というわけで,ちょっと実験的なデータが採取できたと思います.

やるべきこと!
・不要なキーワードのパージ
・単純な名詞抽出をやめて,もっと賢く!
・RSS毎にウェイト設定と更新間隔の調整
・もっと色んなニュース系RSSを探す

トラックバック

この一覧は、次のエントリーを参照しています: タグクラウドなアプローチ その2:

» タグクラウドなアプローチだよね 送信元 ヘタレ系DのBlog
瞬!コレ:ネットのイマ!を集めて自動編集 あっれ? これ,オレのタグクラウドなアプローチと何が違うの?? 既に開発はオレの手を離れて,後輩達に引き継がれて... [詳しくはこちら]