サーバレス練習帳

着眼大局着手小局

javascriptで形態素解析

http://chasen.org/~taku/software/TinySegmenter/

これは凄い!

読んでいて分かった。
多分、アルファベット、数字、ひらなが、カタカナ、漢字、記号・・・に分けている感じだよね。
「TinySegmenterは機械学習のみを使って分かち書きを行います。」と書かれていて、
どうやら機械学習を使っているらしいのですが、どこら辺の要素が機械学習なのかな?
まだ読み解けないけど、興味あるので、がんばってみます。