「入門 自然言語処理」の12章を書き下ろしていただいた萩原さんのご厚意と、原著者をはじめとするNLP関連のコミュニティの皆さんのご協力により、12章の「Python による日本語自然言語処理」を下記で公開しています。
Python による日本語自然言語処理
原書では主に英語を対象とした自然言語処理を取り扱っています。内容や考え方の多くは言語に依存しないものではありますが、単語の分かち書きをしない点や統語構造等の違いから、日本語を対象とする場合、いくつか気をつけなければいけない点があります。日本語を扱う場合にも応用できるように、訳者のひとりである萩原正人さんが、日本向けに原書にはない12章を書き下ろしました。ここでは、日本語をどのように処理するかという点に加えて、さらに学ぶために、日本語の処理に関する、もしくは日本語で書かれた参考文献を幅広く紹介しています。
また、本書の訳者でもあり、12章を書き下ろされた萩原さんから下記のようなコメントをいただきました。
今回、『入門 自然言語処理』の書き下ろしである12章「Pythonによる自然言語処理」をウェブ上にフリーで公開いたしました。本書で主に取り上げられている Natural Language Toolkit(NLTK)は、オープンなコミュニティの有志によって開発が続けられており、そこへの還元という想いを込めました。
自然言語処理については、基礎理論に重点を置いた教科書などは多数出版されていますが、本書『入門 自然言語処理』を通じて、自然言語処理は非常に身近な存在であり、またPython というプログラミング言語とNLTKというツールキットを通じて簡単に試すことができるということを実感していただけるのではと期待しています。
12章では、日本語処理特有の面白さを味うとともに、「学問としての自然言語処理」から「使える自然言語処理」の間の橋渡しとして少しでも貢献できれば、訳者としてこの上ない喜びです。
奥深く興味の尽きない自然言語処理の世界に、ぜひ触れてみてください!