Web
Analytics

【無料】テキストマイニングはユーザローカルにお任せ

本記事は「案件」ではありません。*1

こんにちは。

最近は色々な企業で、「機械学習で仕事をなんとか効率化せよ」といった趣旨の指示がされるようになりました。

でも、機械学習の数学的背景を丁寧に学んでモデルを実装するのは中々辛いです。そこで今回は「コードを書かずに機械学習を実践できるツール」を実際に使った私が紹介します。

無料の機械学習ツールの種類

最近はノーコードで動かせる機械学習のツールも増えてきました。

画像の分類であればGoogleのTeachableMachine、テキストマイニングであれば今回紹介するユーザローカル社の各種ツール。

画像やテキストを登録すれば、あとは自動でモデル生成と分類をしてくれます。

ユーザローカルのメリット

無料・登録不要である

最大のメリットです。基本的に機械学習におけるモデル生成(トレーニング)はAWSなどのクラウド環境で行うのが最近のトレンドです。しかし、これらは原則として従量課金です。

無料かつ登録不要なため、業務への導入も比較的容易です。

ブラウザで実行可能

  • OSに依存しない
  • APIを使わずにツールに組み込める
  • 会社のインストール制限に引っかからない

これらのメリットがあります。

特にAPIなしで動かせることは拡張性の面で有利です。RPAなどでブラウザ操作を自動化するフローにユーザローカル社のテキストマイニングを容易に組み込めます。自分以外に使わせたい人がアプリをインストールしているかといった心配も不要です。

前処理なしでも何とかなる

無料のテキストマイニングは他にもありますが、そういったサービスでは「前処理は各自でやってください」となっています。

前処理の重要性とその作業はこちらの記事に詳しいですが、前処理としてモデルのトレーニング前に以下のことが本来必要です。

  • データのクリーニング
  • データの正規化*2
  • ストップワードの除去

これらの前処理をしないと、モデルの精度が低下するとされています。しかし、この前処理が面倒かつ難しい。前処理大全という本が売られるくらいには面倒です。*3

しかしユーザローカル社のサービスでは、この前処理の大部分を勝手にやってくれます。また、ストップワードや単語の正規化は各々のユーザの意向でカスタマイズすることも可能です。

注意

カスタマイズの為には会員登録(無料)が必要になります。

独自辞書や個人情報保護が無料

テキストマイニングを効率的に行うためには「独自辞書」や個人情報の秘匿処理などが必要。しかし、データの取得方法によっては明確な規則がなく、収集後に苦労して処理しなければならないことも…しかしAIテキストマイニングであればそのような問題はありません。

私自身仕事で使ったのですが、とにかくラク…!

利用制限が緩い

このような無料の機械学習ツールの多くは「商用利用不可」「公開禁止」などの利用制限があります。

ですがユーザローカル社のAIテキストマイニングはそのような制限が緩いです。まずは学術論文への利用。引用に載せればOK。もちろんデータの秘密は無料版でも保護されます。

続いて新聞掲載などの一般的な業務利用。こちらも事前申請をすれば可能です。

まとめ-無料からテキストマイニングを始めよう-

今回紹介したユーザローカル社のテキストマイニング、これだけ便利な無料版に比べさらに便利なビジネス版もあります。

今回紹介したユーザローカル社以外にもGoogleのTeachable Machine(画像分類)など無料で使える機械学習ツールは多数あります。まずはこのようなサービスから手軽に機械学習をしてみると面白いですよ。

*1:本記事で用いている画像はユーザローカル社「AIテキストマイニング」より引用しています。

*2:テキストマイニングの文脈においては、「東京」「Tokyo」「トウキョウ」といった同じ意味の単語の表記を統一するなどの処理を指します。

*3:データサイエンスの領域では、「前処理が8割」「Garbage in Garbage Out」など前処理の重要性を示す格言が多くあります。