薬剤師のプログラミング学習日記

プログラミングやコンピュータに関する記事を書いていきます

2020-07-07から1日間の記事一覧

Wikipediaの特定カテゴリの記事のみを取得する

自然言語処理に関する機械学習の手法を試す際には大量のテキストデータが必要になることがあります。そこで、手軽に使えるテキストデータとしてWikipediaの記事データを使うことにしたのですが、全データを対象にしてアルゴリズムを学習させるのは時間がかか…