「データ分析をやってみたい。でも、どこから始めればいいかわからない」
私自身、そんな状態からスタートしました。
仕事で介護施設の入所相談記録データを使って分析に挑戦したのですが、最初に立てた計画は途中で崩れ、方針転換を余儀なくされました。
この記事では、その失敗と方針転換の経緯、そして最終的にテキストマイニングで得られた分析結果まで、一気にお伝えします。「データ分析って実際どんな感じ?」という方に、リアルな体験として読んでもらえれば嬉しいです。
最初の目標:入所者を増やすための分析
分析のテーマは「介護施設の入所相談記録から、入居につながるパターンを見つける」こと。
ChatGPTに相談しながら、以下の7ステップで進める計画を立てました。
- ゴールの明確化
- データの中身を理解する
- データの準備(前処理)
- 分析の設計
- Excelでの実践
- 仮説から改善提案へ
- 継続的な分析
順調に進むはず…でした。
壁にぶつかった:データが「使えない」状態だった
Step2「データの中身を理解する」の段階で、想定外の問題が出てきました。
・空欄が多すぎる
相談記録の重要な項目(介護度、問合せ方法など)に空欄が大量にありました。集計しようにも、母数が揃わないため比較できません。
・入力値が統一されていない
「電話」「TEL」「tel」「お電話」など、同じ意味の値が複数の表記で入力されていました。このままでは正しく集計できません。
データを整えるだけで相当な時間がかかる上、整えたとしても分析に耐えられるデータ量が残るか不明でした。
そこで方針を転換することにしました。
方針転換:テキストマイニングへ
空欄が多い数値データではなく、備考欄のテキストデータに着目しました。
備考欄には担当者が自由記述で書いた相談内容が入っており、こちらは比較的データが埋まっていました。
分析の方針を「テキストマイニングで、入所が決定した相談に共通する言葉を探す」に変更しました。
使用ツールはUser Local(無料のテキストマイニングツール)。2つの軸で分析しました。
- 出現頻度順:よく出てくる単語を抽出
- スコア順(TF-IDF):他と比べて特徴的な単語を抽出
分析結果①:出現頻度順(全体傾向)
入所が決定した方の備考欄で、頻繁に登場した単語はこちらです。
【頻出ワード】連絡、入居、施設、希望、予定、見学、本人、申込、説明、依頼

考察
- 「希望」「予定」など、意思・ニーズが明確な言葉が多い
- 「見学」「申込」「説明」など、入所までの具体的なプロセスを示す言葉が揃っている
- 入所につながる相談は、漠然とした問い合わせではなく「次の行動が決まっている相談」が中心
分析結果②:スコア順(特徴的傾向)
入所決定グループに特に特徴的だった単語はこちらです。
【特徴的ワード】来所、名張、伊賀、市立病院、MSW、ケアマネ、情報提供、申込

考察
- 「来所」が突出して大きい → 実際に施設に来てもらうことが決定打
- 「ケアマネ」「MSW」「市立病院」が特徴的 → 専門職・医療機関経由の相談が入所に直結しやすい
- 「名張」「伊賀」という地名が目立つ → 特定エリアからの流入が多い
総合的な考察:入所につながる相談の共通点
2つの分析を合わせると、入所が決定した相談には以下の共通パターンが見えてきました。
- 希望・意思が明確:「希望」「予定」など、ニーズがはっきりしている
- 具体的な行動がある:来所・見学・申込といったアクションが伴っている
- 専門職・医療機関経由:ケアマネやMSW、病院からの紹介は入所率が高い
- 特定エリアからの流入:名張・伊賀エリアとの連携が成果につながっている
分析結果から導いた提案
- 「見学」「申込」など次の一歩を具体的に提案できる相談対応を強化する
- 医療機関・ケアマネ・MSWとの地域連携をさらに深める
- 希望があいまいな相談には入所プロセスを丁寧に案内する
やってみてわかったこと
最初に立てた計画通りに進まないのが、実際のデータ分析です。
データの空欄や表記ゆれという「現実の壁」にぶつかったことで、より扱いやすいテキストデータへの方針転換ができました。
ChatGPTは計画立案の相談相手として非常に役立ちましたが、実際のデータを見て判断するのは自分自身でした。ツールに頼りすぎず、目の前のデータと向き合うことが大切だと感じました。
初めてのデータ分析で「うまくいかなかった」と感じている方へ。計画通りに進まないのは当たり前です。方針転換しながら前に進むことが、データ分析の実態です。
あなたが実際のデータ分析で「壁にぶつかった」経験があれば、ぜひコメントで教えてください。

コメント