表題の課題を解決するためには、そもそもタグ揺れ、つまりは表記揺れというものを定義する必要があります。
表記揺れの定義というのを、ぼくは正直よくわかっていなくて、語句のハミング距離を取ればいいのかなーとか思っていたんですけど、これこそは自然言語処理の出番なのではないかということで、とりいそぎ、自然言語処理といえばこれだろという本を買いました。
ISBN:978-4-87311-470-5:detail
しかしですね、この本は基本 Python がサンプルに使われていて、おれがあまり詳しく知らない言語で説明が続くのはストレスです。ストレスはよくない。ストレスをためると寿命が短かくなるし、昨日散髪後のマッサージしてくれたおにいさんに、あーあなた頭皮が固くなってますね、このままだと将来マズいですね、ストレスもよくないですよハッハー! みたいなことを言われました。そもそも言われたことがストレスだし、PTSD になったみたいな いちゃもんをつけて訴えてやりたい。
そういうわけで、ぼくはストレスをためないために Python を勉強する必要がありますから、ついでにこの本を買った。
ISBN:978-4-87311-393-7:detail
Python チュートリアルは既に買って読んでたんだけど、これだけじゃまだよく分からないですね。
ISBN:978-4-87311-442-2:detail
以上より、ぼくは長い長い旅にでます。さがさないでください。あと、周り道とか言わないでください。ストレスです。