読者です 読者をやめる 読者になる 読者になる

面白きこともなき世を面白く

夫の視点で毎日の妻の様子、夫としての心構えなど、つらつらとつづっていきたいと思います。

素人がテキストマイニングすることになったときの便利なツール(備忘録)

業務上、テキストマイニングを行う必要がでてきた!でも僕/私素人なんですけど?って人(主に筆者)が覚えておくべき書籍・サービスを備忘のため書き記します。

どんな人を対象にした記事か

プログラミング言語でバリバリクローラー?作るなんてとてもできないけれど、WEBサービスならなんとかわかるかな、みたいな人。

書籍

データを集める技術 最速で作るスクレイピングクローラー
http://amzn.asia/a6gfu7c

どういうときに使うか

「そもそも分析対象のデータがありません」「データ収集の作業からお願いしたいんですよね」ってとき。SNSデータから顧客の口コミ分析しようにも、そもそもSNSからデータ引っ張ってくる必要あるよね?でも買ってくるだけのお金ないですよ、って言われたとき。*1

何が書いてあるか

主にWEB上のデータを対象とした収集方法や、できる限り簡単に自動化させるためのエッセンス。扱っているツールもMicrosoft ExcelGoogleスプレッドシート、WEB完結するASPサービスなど、とにかく手軽に完結できる手法を記載してくれている。

サービス

IFTTT
ifttt.com
名前の由来は "IF That Then That" の頭文字からとられたみたい。

どんなことができるか

異なるサービス同士を連携させたいとき。テキストマイニングにおいては、たとえば「TwitterGoogle等のデータソースから、特定キーワードが含まれる文章をGoogleスプレッドシートへ保存する」ときの太字部分の機能を提供するハブ。

続く。

最終更新 2017.1.12

*1:筆者経験