自分のつぶやき解析してみた

今年の1月くらいから自分のTwitter全部Elasticsearchに流していて、丁度触る機会があったので単語の出現回数を引っこ抜いてみた。一応形態素解析をかけているので、活用形や送り仮名などある程度吸収しています。クエリの実行結果なんとなく眺めてるとへー俺こんな言葉良く使うんだほえーみたいなのがちょこちょこあったので感想を書きました。仕事中ちょこちょこTwitterに投稿していたのは、解析用にデータを貯めるためであって、決してさぼっていたわけではありません。うそつきました。

覚えたことに対して忘れた事が多い

どうも”覚える”が登録されている数に対して”忘れる”の数が2倍以上あって、一歩進んで二歩下がる状態ってこういうことかって思いました。都合の悪いことをすぐ忘れるので毎日幸せなんですが、なんかたぶんこれは忘れちゃいけないことも忘れてますね。

謝るよりも感謝そして感謝

“ごめんなさい”とか”すみません”よりも、”ありがとう”の方が微妙に多かったです。微妙ってどのくらいかというと、2件なんですが、すぐ謝るよねってたまに言われるけどすぐに感謝もするようです。軽さに定評のある男に俺はなる。

考えるよりも作ろう

“考える”よりも”作る”と言うことの方が多かったみたいです。実際には作りたいとか作ろうかな〜とか言ってやってない可能性があるんですが、そういえばどっちかっていうとやりはじめてから説明書読むタイプでした。その割にアウトプットが少ないけど。

生きるか死ぬか

自分では結構ポジティブなツイートしてるつもりだったんですが、”生きる”よりも”死ぬ”の方が微妙に登録数が多かった。いや、微妙にだからね。多くの場合生きてるから。

これから

除外対象の品詞判別が甘かったせいか”する”とか”なる”とかの単体で意味のない単語が多すぎてつらかったのと、日本語が不自由なせいで上手く形態素解析できていないケースが多かった。この辺はでもきりがないのでやっぱりこれ系は目視検閲が必要だなって思いました。おしまい。