NLP

言語処理100本ノックを敢えてRubyで (3)

20. JSONデータの読み込みrequire 'json' uk = File.foreach("jawiki-country.json"). map(&JSON.method(:parse)). find {|article| article['title'] == 'イギリス' } raise "no article about イギリス" unless uk puts uk['text'] 感覚的なものだけど、こ…

言語処理100本ノックを敢えてRubyで (2)

10. 行数のカウントp $<.count !sh wc hightemp.txt $<の仕様はまさにこういう処理を書くために考えられている。 が、今回に関しては普通ならわざわざ書かずにwcを使う。11. タブをスペースに置換$<.each_line do |line| puts line.gsub(/\t/, ' ') end !sh …

言語処理100本ノックを敢えてRubyで (1)

言語処理100本ノックを(飽きるまで)やってみるにあたり、敢えてRubyで書いてみる。基本的にはPythonを想定しているらしいし、そもそもNLPライブラリの充実度から言ってもPythonを使うのが極めて妥当な選択といえるだろう。そこを敢えてRubyで。00. 文字列の…