おひさまブログ解析

テキストアナリティクスってかっこいい響き!!と思って並んでいた本を買ってしまったので、自分で手を動かしてやってみます。

で、歴代首相の所信表明演説とか分析しても正直つまらんので、最近ドンはまりした日向坂46のブログを使わせてもらいました。

目次

  1. データ集め
  2. クリーニング
  3. 形態素解析
  4. BoW(Bag of Words)へ整形
  5. 平均投稿語数を見てみる

データ集め

めんどいので省略します。メンバー全員+ポカの23人につき直近10記事ずつ、全230記事を公式サイトからなんやかんやして集めました。

正確な日付は記録してませんでしたが、ひな誕祭の後、コロナの集団感染がプレスリリースされたあたりです。
ひな誕祭、渡邉美穂卒業、コロナ、7thシングルといろいろあったので、話題的には割とまとまりがあるような気がします。知らんけど。


ブログトップページ下部にある「メンバー別ブログ」のとこ、各メンバーの写真がリンクになっててメンバー別のブログページに飛べるようになってるんですが、リンク末尾についてる通し番号の1,3が欠番になってました。
たぶん五十音順で井口と柿崎がいた場所だったんでしょうね。

クリーニング

とりあえず集めたデータを眺めてみます。

import pandas as pd
df = pd.read_csv('blog.csv',encoding='utf-8-sig')
df
member blog
0 潮紗理菜 \n\n\n\n\n\n\n先ほど発表がありました通り、先日PCR検査を受けたところ陽性との...
1 潮紗理菜 \n\n\n\n\n\n\n\n\nこんばんは。 \n\n\n\n\n東京ドーム公演から少し...
2 潮紗理菜 \n \n\n\n\n\n\n\n\nこんにちは...
3 潮紗理菜 \n\n\n\n\n\nこんばんは。\n\n\nみほの卒業が発表されました。\n\n\n\n...
4 潮紗理菜 \n\n\n\n\n\nこんばんは。\n\n\n3月27日の今日で日向坂46、3歳になりまし...
... ... ...
225 ポカ \n きょうはとってもこころがポカポカ  22にん...
226 ポカ \n この写真が大・中・小 どれかわかったら立派な...
227 ポカ \n はっぴバースデー  にぶちゃん〜  ども。ポ...
228 ポカ \n いつかやってみたい、 ライブ終盤で、 グッズ...
229 ポカ \n いつかインスタをはじめたら 「本物です」って...

230 rows × 2 columns

print(df['member'].unique())
print(df['member'].nunique())
['潮紗理菜' '影山優佳' '加藤史帆' '齊藤京子' '佐々木久美' '佐々木美玲' '高瀬愛奈' '高本彩花' '東村芽依' '金村美玖'
 '河田陽菜' '小坂菜緒' '富田鈴花' '丹生明里' '濱岸ひより' '松田好花' '宮田愛萌' '渡邉美穂' '上村ひなの' '髙橋未来虹'
 '森本茉莉' '山口陽世' 'ポカ']
23

ちゃんと全メンバー分集まってそうです。
ブログを1記事抽出してみます。

df['blog'][10]
'\n\nカムカムエヴリバディおわってもうた〜〜〜!!\n\u3000\n怒涛の伏線回収に頭追いつかんから脳が幸せで満ち足りてるよ〜〜!!\n\u3000\n\u3000\n\u3000\n\u3000\n\u3000\n\u3000\n今日も幸せいっぱい 詰め込んで頑張る!\n\u3000\n\u3000\nこの幸せをお裾分けして行くような気持ちでね🌸🍡\n\u3000\n\u3000\n\u3000\n\u3000\n\u3000\nこんちゃ!\n影山優佳です!\n\u3000\n\u3000\n最近の日課はみなさんに メンバーの写真をお裾分けすることです😚\n\u3000\n#かげふいるむ\n\u3000\n\u3000\n\u3000\n\u3000\n\u3000\n\u3000\n\n私この日天職から天職に転職しようかと思いました😊 \n\xa0\n\xa0\n\xa0\n\xa0\n\xa0\n\xa0\n\n👶すぎきゃわ\n\xa0\n\xa0\n\xa0\n\xa0\n\xa0\n\xa0\n\xa0\n本日はお知らせが二つ!\n\xa0\nDAZN『内田篤人フットボールタイム#76』内のコーナー「プレイヤーズラ ボ」に出演しております⚽️\n\xa0\n\xa0\n\xa0\n実技企画の第3回!✨\n\xa0\n今回はサイドバックの攻撃参加!詳細な練習メニューとそのやり方を実践とともに学んでまいりました!🏃\u200d♀️💨\n\xa0\n影山も 練習にまぜていただき、\n無駄走りしておりますのでぜひ!笑\n\xa0\n\xa0\n\xa0\n\xa0\n\xa0\nまた、スタジオトークでは\nひな誕祭を観にきてくださった内田篤人さん野村明弘さん佐藤寿人さんの感想をお聞かせ いただいてます✨\n\xa0\nありがとうございます😭😭\n優しすぎます😭😭\n\xa0\n\xa0\n来週は私もスタジオにお邪魔する予定ですので、\nその話もできたら嬉しいなと思ってます😆 \n\xa0\n\xa0\n\xa0\n\u3000\n視聴はこちらからっ💁\u200d♀️↓\nhttps://www.dazn.com/ja-jp/home/ArticleId:12rlx3azppj891lz4swhhgzcj8? share_origin=ios&share_page=tile_bottom_drawer&event_id=ArticleId:12rlx3azppj891lz4swhhgzcj8\n\xa0\n\xa0\n\xa0\n\n\xa0\n\xa0\n\xa0\n\xa0\n\xa0\n\xa0\n\xa0\nそして本日11:30〜\nTokyo FM『ローソン presents \xa0日向坂46のほっとひといき!』が放送されます!📻⚡️\n\xa0\n\xa0\n第二回にして重大発表あります!はやいわ!笑\n\xa0\n今回もてんやわんやほっと息つく暇があるのかは謎ですが、\nぜひみなさ んだけは落ち着いて聞いていただければと思います🤷\u200d♀️🤣\n\xa0\n\xa0\n\u3000\n\xa0\nハッシュタグは「#ほっとひといき」でよろしくお願いします!!!\nみなさんと一緒にたくさん楽しんでくりょ〜〜 🌸\n\xa0\n\xa0\nradiko番組ページはこちら💁\u200d♀️↓\nhttps://www.radiko.jp/share/?sid=FMT&t=20220408113000\n\xa0\n\xa0\nほっとひといき公式Twitterはこちら💁 \u200d♀️↓\nhttps://twitter.com/hot_hitoiki46?s=21&t=4ftMF6s3rauaROkUSyjMKg\n\xa0\n\xa0\n\xa0\n\n\n🍞⚽️🍒\n\u3000\n\u3000\n\u3000\n\u3000\nそれじゃまた!\nsee you soon...♡\n影山優佳\n\n\n\n'

カゲのブログです。
メタ文字でばっかりで読めたもんじゃないです。 これをmecabにつっこんで形態素解析できる形にしていきます。
とりあえずやるべきなのは、

・URL、絵文字の削除
・文ごとに分割


このへん?
URLは正規表現で落とします。

import re
tmp = re.sub(r'(https?|ftp)(:\/\/[-_\.!~*\'()a-zA-Z0-9;\/?:\@&=\+\$,%#]+)','',df['blog'][10])
tmp
'\n\nカムカムエヴリバディおわってもうた〜〜〜!!\n\u3000\n怒涛の伏線回収に頭追いつかんから脳が幸せで満ち足りてるよ〜〜!!\n\u3000\n\u3000\n\u3000\n\u3000\n\u3000\n\u3000\n今日も幸せいっぱい詰め込んで頑張る!\n\u3000\n\u3000\nこの幸せをお裾分けして行くような気持ちでね🌸🍡\n\u3000\n\u3000\n\u3000\n\u3000\n\u3000\nこんちゃ!\n影山優佳です!\n\u3000\n\u3000\n最近の日課はみなさんにメンバーの写真をお裾分けすることです😚\n\u3000\n#かげふいるむ\n\u3000\n\u3000\n\u3000\n\u3000\n\u3000\n\u3000\n\n私この日天職から天職に転職しようかと思いました😊\n\xa0\n\xa0\n\xa0\n\xa0\n\xa0\n\xa0\n\n👶すぎきゃわ\n\xa0\n\xa0\n\xa0\n\xa0\n\xa0\n\xa0\n\xa0\n本日はお知らせが二つ!\n\xa0\nDAZN『内田篤人フットボールタイム#76』内のコーナー「プレイヤーズラボ」に出演しております⚽️\n\xa0\n\xa0\n\xa0\n実技企画の第3回!✨\n\xa0\n今回はサイドバックの攻撃参加!詳細な練習メニューとそのやり方を実践とともに学んでまいりました!🏃\u200d♀️💨\n\xa0\n影山も練習にまぜていただき、\n無駄走りしておりますのでぜひ!笑\n\xa0\n\xa0\n\xa0\n\xa0\n\xa0\nまた、スタジオトークでは\nひな誕祭を観にきてくださった内田篤人さん野村明弘さん佐藤寿人さんの感想をお聞かせいただいてます✨\n\xa0\nありがとうございます😭😭\n優しすぎます😭😭\n\xa0\n\xa0\n来週は私もスタジオにお邪魔する予定ですので、\nその話もできたら嬉しいなと思ってます😆\n\xa0\n\xa0\n\xa0\n\u3000\n視聴はこちらからっ💁\u200d♀️↓\n\n\xa0\n\xa0\n\xa0\n\n\xa0\n\xa0\n\xa0\n\xa0\n\xa0\n\xa0\n\xa0\nそして本日11:30〜\nTokyo FM『ローソン presents \xa0日向坂46のほっとひといき!』が放送されます!📻⚡️\n\xa0\n\xa0\n第二回にして重大発表あります!はやいわ!笑\n\xa0\n今回もてんやわんやほっと息つく暇があるのかは謎ですが、\nぜひみなさんだけは落ち着いて聞いていただければと思います🤷\u200d♀️🤣\n\xa0\n\xa0\n\u3000\n\xa0\nハッシュタグは「#ほっとひといき」でよろしくお願いします!!!\nみなさんと一緒にたくさん楽しんでくりょ〜〜🌸\n\xa0\n\xa0\nradiko番組ページはこちら💁\u200d♀️↓\n\n\xa0\n\xa0\nほっとひといき公式Twitterはこちら💁\u200d♀️↓\n\n\xa0\n\xa0\n\xa0\n\n\n🍞⚽️🍒\n\u3000\n\u3000\n\u3000\n\u3000\nそれじゃまた!\nsee you soon...♡\n影山優佳\n\n\n\n'

見づらいですが、落ちました。

次、絵文字はemojiモジュールを使って落とします。

このサイトを参考に、そのままでは使えないのでちょびっと変更します。

import emoji

def remove_emoji(text):
    key = list(emoji.UNICODE_EMOJI.keys())#言語をキーとして保存されている
    allchars = [str for str in text]
    emoji_list = [c for c in allchars if c in emoji.UNICODE_EMOJI[key[0]]]#0は英語
    clean_text = ''.join([str for str in text if not any(i in str for i in emoji_list)])
    return clean_text
tmp = remove_emoji(tmp)
tmp
'\n\nカムカムエヴリバディおわってもうた〜〜〜!!\n\u3000\n怒涛の伏線回収に頭追いつかんから脳が幸せで満ち足りてるよ〜〜!!\n\u3000\n\u3000\n\u3000\n\u3000\n\u3000\n\u3000\n今日も幸せいっぱい詰め込んで頑張る!\n\u3000\n\u3000\nこの幸せをお裾分けして行くような気持ちでね\n\u3000\n\u3000\n\u3000\n\u3000\n\u3000\nこんちゃ!\n影山優佳です!\n\u3000\n\u3000\n最近の日課はみなさんにメンバーの写真をお裾分けすることです\n\u3000\n#かげふいるむ\n\u3000\n\u3000\n\u3000\n\u3000\n\u3000\n\u3000\n\n私この日天職から天職に転職しようかと思いました\n\xa0\n\xa0\n\xa0\n\xa0\n\xa0\n\xa0\n\nすぎきゃわ\n\xa0\n\xa0\n\xa0\n\xa0\n\xa0\n\xa0\n\xa0\n本日はお知らせが二つ!\n\xa0\nDAZN『内田篤人フットボールタイム#76』内のコーナー「プレイヤーズラボ」に出演しております️\n\xa0\n\xa0\n\xa0\n実技企画の第3回!\n\xa0\n今回はサイドバックの攻撃参加!詳細な練習メニューとそのやり方を実践とともに学んでまいりました!\u200d️\n\xa0\n影山も練習にまぜていただき、\n無駄走りしておりますのでぜひ!笑\n\xa0\n\xa0\n\xa0\n\xa0\n\xa0\nまた、スタジオトークでは\nひな誕祭を観にきてくださった内田篤人さん野村明弘さん佐藤寿人さんの感想をお聞かせいただいてます\n\xa0\nありがとうございます\n優しすぎます\n\xa0\n\xa0\n来週は私もスタジオにお邪魔する予定ですので、\nその話もできたら嬉しいなと思ってます\n\xa0\n\xa0\n\xa0\n\u3000\n視聴はこちらからっ\u200d️↓\n\n\xa0\n\xa0\n\xa0\n\n\xa0\n\xa0\n\xa0\n\xa0\n\xa0\n\xa0\n\xa0\nそして本日11:30〜\nTokyo FM『ローソン presents \xa0日向坂46のほっとひといき!』が放送されます!️\n\xa0\n\xa0\n第二回にして重大発表あります!はやいわ!笑\n\xa0\n今回もてんやわんやほっと息つく暇があるのかは謎ですが、\nぜひみなさんだけは落ち着いて聞いていただければと思います\u200d️\n\xa0\n\xa0\n\u3000\n\xa0\nハッシュタグは「#ほっとひといき」でよろしくお願いします!!!\nみなさんと一緒にたくさん楽しんでくりょ〜〜\n\xa0\n\xa0\nradiko番組ページはこちら\u200d️↓\n\n\xa0\n\xa0\nほっとひといき公式Twitterはこちら\u200d️↓\n\n\xa0\n\xa0\n\xa0\n\n\n️\n\u3000\n\u3000\n\u3000\n\u3000\nそれじゃまた!\nsee you soon...♡\n影山優佳\n\n\n\n'

♡など一部残ってるのもありますが、まあいいや。

最後に、これを文ごとに分割します。
分割は議事録みたいに文末に句点が打ってあれば簡単ですが、現役バリバリのアイドルですからそんなことはしてません。
妥協案として、改行を文の終わりとすることにします。改行が必ずしも文末ではないですが、やむなし。

改行が繰り返されている空白行を除いて、リストに格納します。

tmp = re.split('[\n,\u3000,\xa0,。]',tmp)
sentences  = [s for s in tmp if s != '']
sentences
['カムカムエヴリバディおわってもうた〜〜〜!!', '怒涛の伏線回収に頭追いつかんから脳が幸せで満ち足りてるよ〜〜!!', '今日も幸せいっぱい詰め込んで頑張る!', 'この幸せをお裾分けして行くような気持ちでね', 'こんちゃ!', '影山優佳です!', '最近の日課はみなさんにメンバーの写真をお裾分けすることです', '#かげふいるむ', '私この日天職から天職に転職しようかと思いました', 'すぎきゃわ', '本日はお知らせが二つ!', 'DAZN内田篤人フットボールタイム#76』内のコーナー「プレイヤーズラボ」に出演しております️', '実技企画の第3回!', '今回はサイドバックの攻撃参加!詳細な練習メニューとそのやり方を実践とともに学んでまいりました!\u200d️', '影山も練習にまぜていただき、', '無駄走りしておりますのでぜひ!笑', 'また、スタジオトークでは', 'ひな誕祭を観にきてくださった内田篤人さん野村明弘さん佐藤寿人さんの感想をお聞かせいただいてます', 'ありがとうございます', '優しすぎます', '来週は私もスタジオにお邪魔する予定ですので、', 'その話もできたら嬉しいなと思ってます', '視聴はこちらからっ\u200d️↓', 'そして本日11:30〜', 'Tokyo FM『ローソン presents ', '日向坂46のほっとひといき!』が放送されます!️', '第二回にして重大発表あります!はやいわ!笑', '今回もてんやわんやほっと息つく暇があるのかは謎ですが、', 'ぜひみなさんだけは落ち着いて聞いていただければと思います\u200d️', 'ハッシュタグは「#ほっとひといき」でよろしくお願いします!!!', 'みなさんと一緒にたくさん楽しんでくりょ〜〜', 'radiko番組ページはこちら\u200d️↓', 'ほっとひといき公式Twitterはこちら\u200d️↓', '️', 'それじゃまた!', 'see you soon...♡', '影山優佳']

なるほど~~まあとりあえず使えそう。

ところで絵文字にならずに残ってる'\u200d'て何者?と思って調べたら、「Zero Width Joiner」という名前があったみたいで、複数の絵文字をくっつけて一つの絵文字にする接着剤らしい。へえ。

こいつもあとで正規表現で落とします。
とりあえずこれを形態素解析器にぶっ込んでみましょう。

形態素解析

import MeCab

m = MeCab.Tagger('-Ochasen')
words = []
for i in range(len(sentences)):
    nodes = m.parseToNode(sentences[i])
    while nodes:
        print(nodes.surface,' ',nodes.feature)
        nodes = nodes.next
BOS/EOS,*,*,*,*,*,*,*,* カムカムエヴリバディ 名詞,固有名詞,一般,*,*,*,カムカムエヴリバディ,カムカムエヴリバディ,カムカムエヴリバディ おわっ 動詞,自立,*,*,五段・ラ行,連用タ接続,おわる,オワッ,オワッ て 助詞,接続助詞,*,*,*,*,て,テ,テ も 助詞,係助詞,*,*,*,*,も,モ,モ うた 名詞,一般,*,*,*,*,うた,ウタ,ウタ 〜 記号,一般,*,*,*,*,〜,〜,〜 〜 記号,一般,*,*,*,*,〜,〜,〜 〜 記号,一般,*,*,*,*,〜,〜,〜 ! 記号,一般,*,*,*,*,!,!,! ! 記号,一般,*,*,*,*,!,!,! BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* 怒涛 名詞,一般,*,*,*,*,怒涛,ドトウ,ドトー の 助詞,連体化,*,*,*,*,の,ノ,ノ 伏線 名詞,一般,*,*,*,*,伏線,フクセン,フクセン 回収 名詞,サ変接続,*,*,*,*,回収,カイシュウ,カイシュー に 助詞,格助詞,一般,*,*,*,に,ニ,ニ 頭 名詞,一般,*,*,*,*,頭,アタマ,アタマ 追いつか 動詞,自立,*,*,五段・カ行イ音便,未然形,追いつく,オイツカ,オイツカ ん 助動詞,*,*,*,不変化型,基本形,ん,ン,ン から 助詞,接続助詞,*,*,*,*,から,カラ,カラ 脳 名詞,一般,*,*,*,*,脳,ノウ,ノー が 助詞,格助詞,一般,*,*,*,が,ガ,ガ 幸せ 名詞,形容動詞語幹,*,*,*,*,幸せ,シアワセ,シアワセ で 助動詞,*,*,*,特殊・ダ,連用形,だ,デ,デ 満ち足り 動詞,自立,*,*,一段,連用形,満ち足りる,ミチタリ,ミチタリ てる 動詞,非自立,*,*,一段,基本形,てる,テル,テル よ 助詞,終助詞,*,*,*,*,よ,ヨ,ヨ 〜 記号,一般,*,*,*,*,〜,〜,〜 〜 記号,一般,*,*,*,*,〜,〜,〜 ! 記号,一般,*,*,*,*,!,!,! ! 記号,一般,*,*,*,*,!,!,! BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* 今日 名詞,副詞可能,*,*,*,*,今日,キョウ,キョー も 助詞,係助詞,*,*,*,*,も,モ,モ 幸せいっぱい 名詞,固有名詞,一般,*,*,*,幸せいっぱい,シアワセイッパイ,シアワセイッパイ 詰め込ん 動詞,自立,*,*,五段・マ行,連用タ接続,詰め込む,ツメコン,ツメコン で 助詞,接続助詞,*,*,*,*,で,デ,デ 頑張る 動詞,自立,*,*,五段・ラ行,基本形,頑張る,ガンバル,ガンバル ! 記号,一般,*,*,*,*,!,!,! BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* この 連体詞,*,*,*,*,*,この,コノ,コノ 幸せ 名詞,形容動詞語幹,*,*,*,*,幸せ,シアワセ,シアワセ を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ お裾分け 名詞,一般,*,*,*,*,お裾分け,オスソワケ,オスソワケ し 動詞,自立,*,*,サ変・スル,連用形,する,シ,シ て 助詞,接続助詞,*,*,*,*,て,テ,テ 行く 動詞,非自立,*,*,五段・カ行促音便,基本形,行く,イク,イク よう 名詞,非自立,助動詞語幹,*,*,*,よう,ヨウ,ヨー な 助動詞,*,*,*,特殊・ダ,体言接続,だ,ナ,ナ 気持ち 名詞,一般,*,*,*,*,気持ち,キモチ,キモチ で 助動詞,*,*,*,特殊・ダ,連用形,だ,デ,デ ね 助詞,終助詞,*,*,*,*,ね,ネ,ネ BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* こん 動詞,自立,*,*,五段・マ行,連用タ接続,こむ,コン,コン ちゃ 助詞,接続助詞,*,*,*,*,ちゃ,チャ,チャ ! 記号,一般,*,*,*,*,!,!,! BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* 影山優佳 名詞,固有名詞,一般,*,*,*,影山優佳,カゲヤマユウカ,カゲヤマユーカ です 助動詞,*,*,*,特殊・デス,基本形,です,デス,デス ! 記号,一般,*,*,*,*,!,!,! BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* 最近 名詞,副詞可能,*,*,*,*,最近,サイキン,サイキン の 助詞,連体化,*,*,*,*,の,ノ,ノ 日課 名詞,一般,*,*,*,*,日課,ニッカ,ニッカ は 助詞,係助詞,*,*,*,*,は,ハ,ワ みなさん 名詞,代名詞,一般,*,*,*,みなさん,ミナサン,ミナサン に 助詞,格助詞,一般,*,*,*,に,ニ,ニ メンバー 名詞,一般,*,*,*,*,メンバー,メンバー,メンバー の 助詞,連体化,*,*,*,*,の,ノ,ノ 写真 名詞,一般,*,*,*,*,写真,シャシン,シャシン を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ お裾分け 名詞,一般,*,*,*,*,お裾分け,オスソワケ,オスソワケ する 動詞,自立,*,*,サ変・スル,基本形,する,スル,スル こと 名詞,非自立,一般,*,*,*,こと,コト,コト です 助動詞,*,*,*,特殊・デス,基本形,です,デス,デス BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* # 名詞,サ変接続,*,*,*,*,* かげ 名詞,接尾,一般,*,*,*,かげ,カゲ,カゲ ふい 動詞,自立,*,*,五段・ワ行促音便,連用形,ふう,フイ,フイ る 動詞,非自立,*,*,一段,基本形,る,ル,ル む 名詞,一般,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* 私 名詞,代名詞,一般,*,*,*,私,ワタシ,ワタシ この 連体詞,*,*,*,*,*,この,コノ,コノ 日 名詞,非自立,副詞可能,*,*,*,日,ヒ,ヒ 天職 名詞,一般,*,*,*,*,天職,テンショク,テンショク から 助詞,格助詞,一般,*,*,*,から,カラ,カラ 天職 名詞,一般,*,*,*,*,天職,テンショク,テンショク に 助詞,格助詞,一般,*,*,*,に,ニ,ニ 転職 名詞,サ変接続,*,*,*,*,転職,テンショク,テンショク しよ 動詞,自立,*,*,サ変・スル,未然ウ接続,する,シヨ,シヨ う 助動詞,*,*,*,不変化型,基本形,う,ウ,ウ か 助詞,副助詞/並立助詞/終助詞,*,*,*,*,か,カ,カ と 助詞,格助詞,引用,*,*,*,と,ト,ト 思い 動詞,自立,*,*,五段・ワ行促音便,連用形,思う,オモイ,オモイ まし 助動詞,*,*,*,特殊・マス,連用形,ます,マシ,マシ た 助動詞,*,*,*,特殊・タ,基本形,た,タ,タ BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* す 接頭詞,名詞接続,*,*,*,*,す,ス,ス ぎきゃわ 名詞,一般,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* 本日 名詞,副詞可能,*,*,*,*,本日,ホンジツ,ホンジツ は 助詞,係助詞,*,*,*,*,は,ハ,ワ お知らせ 名詞,サ変接続,*,*,*,*,お知らせ,オシラセ,オシラセ が 助詞,格助詞,一般,*,*,*,が,ガ,ガ 二つ 名詞,一般,*,*,*,*,二つ,フタツ,フタツ ! 記号,一般,*,*,*,*,!,!,! BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* DAZN 名詞,固有名詞,組織,*,*,*,DAZN,ダゾーン,ダゾーン 『 記号,括弧開,*,*,*,*,『,『,『 内田篤人 名詞,固有名詞,人名,一般,*,*,内田篤人,ウチダアツト,ウチダアツト の 助詞,連体化,*,*,*,*,の,ノ,ノ フットボール 名詞,一般,*,*,*,*,フットボール,フットボール,フットボール タイム 名詞,一般,*,*,*,*,タイム,タイム,タイム # 名詞,サ変接続,*,*,*,*,* 76 名詞,数,*,*,*,*,* 』 記号,括弧閉,*,*,*,*,』,』,』 内 名詞,接尾,一般,*,*,*,内,ナイ,ナイ の 助詞,連体化,*,*,*,*,の,ノ,ノ コーナー 名詞,一般,*,*,*,*,コーナー,コーナー,コーナー 「 記号,括弧開,*,*,*,*,「,「,「 プレイヤーズ 名詞,固有名詞,一般,*,*,*,Players,プレイヤーズ,プレイヤーズ ラボ 名詞,一般,*,*,*,*,ラボ,ラボ,ラボ 」 記号,括弧閉,*,*,*,*,」,」,」 に 助詞,格助詞,一般,*,*,*,に,ニ,ニ 出演 名詞,サ変接続,*,*,*,*,出演,シュツエン,シュツエン し 動詞,自立,*,*,サ変・スル,連用形,する,シ,シ て 助詞,接続助詞,*,*,*,*,て,テ,テ おり 動詞,非自立,*,*,五段・ラ行,連用形,おる,オリ,オリ ます 助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス ️ 記号,一般,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* 実技 名詞,一般,*,*,*,*,実技,ジツギ,ジツギ 企画 名詞,サ変接続,*,*,*,*,企画,キカク,キカク の 助詞,連体化,*,*,*,*,の,ノ,ノ 第 接頭詞,数接続,*,*,*,*,第,ダイ,ダイ 3回 名詞,固有名詞,一般,*,*,*,3回,サンカイ,サンカイ ! 記号,一般,*,*,*,*,!,!,! BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* 今回 名詞,副詞可能,*,*,*,*,今回,コンカイ,コンカイ は 助詞,係助詞,*,*,*,*,は,ハ,ワ サイドバック 名詞,一般,*,*,*,*,サイドバック,サイドバック,サイドバック の 助詞,連体化,*,*,*,*,の,ノ,ノ 攻撃参加 名詞,固有名詞,一般,*,*,*,攻撃参加,コウゲキサンカ,コーゲキサンカ ! 記号,一般,*,*,*,*,!,!,! 詳細 名詞,形容動詞語幹,*,*,*,*,詳細,ショウサイ,ショーサイ な 助動詞,*,*,*,特殊・ダ,体言接続,だ,ナ,ナ 練習メニュー 名詞,固有名詞,一般,*,*,*,練習メニュー,レンシュウメニュー,レンシューメニュー と 助詞,格助詞,一般,*,*,*,と,ト,ト その 連体詞,*,*,*,*,*,その,ソノ,ソノ やり方 名詞,一般,*,*,*,*,やり方,ヤリカタ,ヤリカタ を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ 実践 名詞,サ変接続,*,*,*,*,実践,ジッセン,ジッセン とともに 助詞,格助詞,連語,*,*,*,とともに,トトモニ,トトモニ 学ん 動詞,自立,*,*,五段・バ行,連用タ接続,学ぶ,マナン,マナン で 助詞,接続助詞,*,*,*,*,で,デ,デ まいり 動詞,非自立,*,*,五段・ラ行,連用形,まいる,マイリ,マイリ まし 助動詞,*,*,*,特殊・マス,連用形,ます,マシ,マシ た 助動詞,*,*,*,特殊・タ,基本形,た,タ,タ !‍ 名詞,サ変接続,*,*,*,*,* ️ 記号,一般,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* 影山 名詞,固有名詞,人名,姓,*,*,影山,カゲヤマ,カゲヤマ も 助詞,係助詞,*,*,*,*,も,モ,モ 練習 名詞,サ変接続,*,*,*,*,練習,レンシュウ,レンシュー に 助詞,格助詞,一般,*,*,*,に,ニ,ニ まぜ 動詞,自立,*,*,一段,連用形,まぜる,マゼ,マゼ て 助詞,接続助詞,*,*,*,*,て,テ,テ いただき 動詞,非自立,*,*,五段・カ行イ音便,連用形,いただく,イタダキ,イタダキ 、 記号,読点,*,*,*,*,、,、,、 BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* 無駄 名詞,形容動詞語幹,*,*,*,*,無駄,ムダ,ムダ 走り 動詞,自立,*,*,五段・ラ行,連用形,走る,ハシリ,ハシリ し 動詞,自立,*,*,サ変・スル,連用形,する,シ,シ て 助詞,接続助詞,*,*,*,*,て,テ,テ おり 動詞,非自立,*,*,五段・ラ行,連用形,おる,オリ,オリ ます 助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス ので 助詞,接続助詞,*,*,*,*,ので,ノデ,ノデ ぜひ 副詞,一般,*,*,*,*,ぜひ,ゼヒ,ゼヒ ! 記号,一般,*,*,*,*,!,!,! 笑 名詞,固有名詞,人名,名,*,*,笑,エミ,エミ BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* また 接続詞,*,*,*,*,*,また,マタ,マタ 、 記号,読点,*,*,*,*,、,、,、 スタジオ 名詞,一般,*,*,*,*,スタジオ,スタジオ,スタジオ トーク 名詞,一般,*,*,*,*,トーク,トーク,トーク で 助詞,格助詞,一般,*,*,*,で,デ,デ は 助詞,係助詞,*,*,*,*,は,ハ,ワ BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* ひな 名詞,一般,*,*,*,*,ひな,ヒナ,ヒナ 誕祭 名詞,一般,*,*,*,*,* を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ 観 名詞,一般,*,*,*,*,観,カン,カン に 助詞,格助詞,一般,*,*,*,に,ニ,ニ き 動詞,自立,*,*,カ変・クル,連用形,くる,キ,キ て 助詞,接続助詞,*,*,*,*,て,テ,テ くださっ 動詞,非自立,*,*,五段・ラ行特殊,連用タ接続,くださる,クダサッ,クダサッ た 助動詞,*,*,*,特殊・タ,基本形,た,タ,タ 内田篤人 名詞,固有名詞,人名,一般,*,*,内田篤人,ウチダアツト,ウチダアツト さん 名詞,接尾,人名,*,*,*,さん,サン,サン 野村明弘 名詞,固有名詞,人名,一般,*,*,野村明弘,ノムラアキヒロ,ノムラアキヒロ さん 名詞,接尾,人名,*,*,*,さん,サン,サン 佐藤寿人 名詞,固有名詞,人名,一般,*,*,佐藤寿人,サトウヒサト,サトーヒサト さん 名詞,接尾,人名,*,*,*,さん,サン,サン の 助詞,連体化,*,*,*,*,の,ノ,ノ 感想 名詞,一般,*,*,*,*,感想,カンソウ,カンソー を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ お 接頭詞,名詞接続,*,*,*,*,お,オ,オ 聞か 動詞,自立,*,*,五段・カ行イ音便,未然形,聞く,キカ,キカ せ 動詞,接尾,*,*,一段,連用形,せる,セ,セ いただい 動詞,非自立,*,*,五段・カ行イ音便,連用タ接続,いただく,イタダイ,イタダイ て 助詞,接続助詞,*,*,*,*,て,テ,テ ます 助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* ありがとう 感動詞,*,*,*,*,*,ありがとう,アリガトウ,アリガトー ござい 助動詞,*,*,*,五段・ラ行特殊,連用形,ござる,ゴザイ,ゴザイ ます 助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* 優し 形容詞,自立,*,*,形容詞・イ段,ガル接続,優しい,ヤサシ,ヤサシ すぎ 動詞,非自立,*,*,一段,連用形,すぎる,スギ,スギ ます 助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* 来週 名詞,副詞可能,*,*,*,*,来週,ライシュウ,ライシュー は 助詞,係助詞,*,*,*,*,は,ハ,ワ 私 名詞,代名詞,一般,*,*,*,私,ワタシ,ワタシ も 助詞,係助詞,*,*,*,*,も,モ,モ スタジオ 名詞,一般,*,*,*,*,スタジオ,スタジオ,スタジオ に 助詞,格助詞,一般,*,*,*,に,ニ,ニ お 接頭詞,名詞接続,*,*,*,*,お,オ,オ 邪魔 名詞,サ変接続,*,*,*,*,邪魔,ジャマ,ジャマ する 動詞,自立,*,*,サ変・スル,基本形,する,スル,スル 予定 名詞,サ変接続,*,*,*,*,予定,ヨテイ,ヨテイ です 助動詞,*,*,*,特殊・デス,基本形,です,デス,デス ので 助詞,接続助詞,*,*,*,*,ので,ノデ,ノデ 、 記号,読点,*,*,*,*,、,、,、 BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* その 連体詞,*,*,*,*,*,その,ソノ,ソノ 話 名詞,サ変接続,*,*,*,*,話,ハナシ,ハナシ も 助詞,係助詞,*,*,*,*,も,モ,モ でき 動詞,自立,*,*,一段,連用形,できる,デキ,デキ たら 助動詞,*,*,*,特殊・タ,仮定形,た,タラ,タラ 嬉しい 形容詞,自立,*,*,形容詞・イ段,基本形,嬉しい,ウレシイ,ウレシイ な 助詞,終助詞,*,*,*,*,な,ナ,ナ と 助詞,格助詞,引用,*,*,*,と,ト,ト 思っ 動詞,自立,*,*,五段・ワ行促音便,連用タ接続,思う,オモッ,オモッ て 助詞,接続助詞,*,*,*,*,て,テ,テ ます 助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* 視聴 名詞,サ変接続,*,*,*,*,視聴,シチョウ,シチョー は 助詞,係助詞,*,*,*,*,は,ハ,ワ こちら 名詞,代名詞,一般,*,*,*,こちら,コチラ,コチラ から 助詞,格助詞,一般,*,*,*,から,カラ,カラ っ 動詞,非自立,*,*,五段・カ行促音便,連用タ接続,く,ッ,ッ ‍ 名詞,サ変接続,*,*,*,*,* ️ 記号,一般,*,*,*,*,* ↓ 記号,一般,*,*,*,*,↓,↓,↓ BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* そして 接続詞,*,*,*,*,*,そして,ソシテ,ソシテ 本日 名詞,副詞可能,*,*,*,*,本日,ホンジツ,ホンジツ 11 名詞,数,*,*,*,*,* : 名詞,サ変接続,*,*,*,*,* 30 名詞,数,*,*,*,*,* 〜 記号,一般,*,*,*,*,〜,〜,〜 BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* Tokyo 名詞,固有名詞,人名,一般,*,*,TOKYO,トウキョウ,トウキョー FM 名詞,固有名詞,一般,*,*,*,FM,エフエム,エフエム 『 記号,括弧開,*,*,*,*,『,『,『 ローソン 名詞,固有名詞,人名,姓,*,*,ローソン,ローソン,ローソン presents 名詞,固有名詞,組織,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* 日向坂46 名詞,固有名詞,人名,一般,*,*,日向坂46,ヒナタザカフォーティーシックス,ヒナタザカフォーティーシックス の 助詞,連体化,*,*,*,*,の,ノ,ノ ほっと 副詞,一般,*,*,*,*,ほっと,ホット,ホット ひと 接頭詞,名詞接続,*,*,*,*,ひと,ヒト,ヒト いき 名詞,一般,*,*,*,*,いき,イキ,イキ ! 記号,一般,*,*,*,*,!,!,! 』 記号,括弧閉,*,*,*,*,』,』,』 が 助詞,格助詞,一般,*,*,*,が,ガ,ガ 放送 名詞,サ変接続,*,*,*,*,放送,ホウソウ,ホーソー さ 動詞,自立,*,*,サ変・スル,未然レル接続,する,サ,サ れ 動詞,接尾,*,*,一段,連用形,れる,レ,レ ます 助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス ! 記号,一般,*,*,*,*,!,!,! ️ 記号,一般,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* 第 接頭詞,数接続,*,*,*,*,第,ダイ,ダイ 二 名詞,数,*,*,*,*,二,ニ,ニ 回 名詞,接尾,助数詞,*,*,*,回,カイ,カイ に 助詞,格助詞,一般,*,*,*,に,ニ,ニ し 動詞,自立,*,*,サ変・スル,連用形,する,シ,シ て 助詞,接続助詞,*,*,*,*,て,テ,テ 重大発表 名詞,固有名詞,一般,*,*,*,重大発表,ジュウダイハッピョウ,ジューダイハッピョー あり 動詞,自立,*,*,五段・ラ行,連用形,ある,アリ,アリ ます 助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス ! 記号,一般,*,*,*,*,!,!,! はやい 形容詞,自立,*,*,形容詞・アウオ段,基本形,はやい,ハヤイ,ハヤイ わ 助詞,終助詞,*,*,*,*,わ,ワ,ワ ! 記号,一般,*,*,*,*,!,!,! 笑 名詞,固有名詞,人名,名,*,*,笑,エミ,エミ BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* 今回 名詞,副詞可能,*,*,*,*,今回,コンカイ,コンカイ も 助詞,係助詞,*,*,*,*,も,モ,モ てんやわんや 副詞,助詞類接続,*,*,*,*,てんやわんや,テンヤワンヤ,テンヤワンヤ ほっと 副詞,一般,*,*,*,*,ほっと,ホット,ホット 息 名詞,サ変接続,*,*,*,*,息,イキ,イキ つく 動詞,自立,*,*,五段・カ行イ音便,基本形,つく,ツク,ツク 暇 名詞,一般,*,*,*,*,暇,ヒマ,ヒマ が 助詞,格助詞,一般,*,*,*,が,ガ,ガ ある 動詞,自立,*,*,五段・ラ行,基本形,ある,アル,アル の 名詞,非自立,一般,*,*,*,の,ノ,ノ か 助詞,副助詞/並立助詞/終助詞,*,*,*,*,か,カ,カ は 助詞,係助詞,*,*,*,*,は,ハ,ワ 謎 名詞,一般,*,*,*,*,謎,ナゾ,ナゾ です 助動詞,*,*,*,特殊・デス,基本形,です,デス,デス が 助詞,接続助詞,*,*,*,*,が,ガ,ガ 、 記号,読点,*,*,*,*,、,、,、 BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* ぜひ 副詞,一般,*,*,*,*,ぜひ,ゼヒ,ゼヒ みなさん 名詞,代名詞,一般,*,*,*,みなさん,ミナサン,ミナサン だけ 助詞,副助詞,*,*,*,*,だけ,ダケ,ダケ は 助詞,係助詞,*,*,*,*,は,ハ,ワ 落ち着い 動詞,自立,*,*,五段・カ行イ音便,連用タ接続,落ち着く,オチツイ,オチツイ て 助詞,接続助詞,*,*,*,*,て,テ,テ 聞い 動詞,自立,*,*,五段・カ行イ音便,連用タ接続,聞く,キイ,キイ て 助詞,接続助詞,*,*,*,*,て,テ,テ いただけれ 動詞,自立,*,*,一段,仮定形,いただける,イタダケレ,イタダケレ ば 助詞,接続助詞,*,*,*,*,ば,バ,バ と 助詞,格助詞,引用,*,*,*,と,ト,ト 思い 動詞,自立,*,*,五段・ワ行促音便,連用形,思う,オモイ,オモイ ます 助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス ‍ 名詞,サ変接続,*,*,*,*,* ️ 記号,一般,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* ハッシュタグ 名詞,固有名詞,人名,一般,*,*,#ハッシュタグ,ハッシュタグ,ハッシュタグ は 助詞,係助詞,*,*,*,*,は,ハ,ワ 「 記号,括弧開,*,*,*,*,「,「,「 # 名詞,サ変接続,*,*,*,*,* ほっと 副詞,一般,*,*,*,*,ほっと,ホット,ホット ひと 接頭詞,名詞接続,*,*,*,*,ひと,ヒト,ヒト いき 名詞,一般,*,*,*,*,いき,イキ,イキ 」 記号,括弧閉,*,*,*,*,」,」,」 で 助詞,格助詞,一般,*,*,*,で,デ,デ よろしくお願いします 名詞,固有名詞,一般,*,*,*,よろしくお願いします,ヨロシクオネガイシマス,ヨロシクオネガイシマス ! 記号,一般,*,*,*,*,!,!,! ! 記号,一般,*,*,*,*,!,!,! ! 記号,一般,*,*,*,*,!,!,! BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* みなさん 名詞,代名詞,一般,*,*,*,みなさん,ミナサン,ミナサン と 助詞,格助詞,一般,*,*,*,と,ト,ト 一緒 名詞,サ変接続,*,*,*,*,一緒,イッショ,イッショ に 助詞,格助詞,一般,*,*,*,に,ニ,ニ たくさん 名詞,副詞可能,*,*,*,*,たくさん,タクサン,タクサン 楽しん 動詞,自立,*,*,五段・マ行,連用タ接続,楽しむ,タノシン,タノシン で 助詞,接続助詞,*,*,*,*,で,デ,デ くり 名詞,一般,*,*,*,*,くり,クリ,クリ ょ 名詞,一般,*,*,*,*,* 〜 記号,一般,*,*,*,*,〜,〜,〜 〜 記号,一般,*,*,*,*,〜,〜,〜 BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* radiko 名詞,固有名詞,一般,*,*,*,radiko,ラジコ,ラジコ 番組 名詞,一般,*,*,*,*,番組,バングミ,バングミ ページ 名詞,一般,*,*,*,*,ページ,ページ,ページ は 助詞,係助詞,*,*,*,*,は,ハ,ワ こちら 名詞,代名詞,一般,*,*,*,こちら,コチラ,コチラ ‍ 名詞,サ変接続,*,*,*,*,* ️ 記号,一般,*,*,*,*,* ↓ 記号,一般,*,*,*,*,↓,↓,↓ BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* ほっと 副詞,一般,*,*,*,*,ほっと,ホット,ホット ひと 接頭詞,名詞接続,*,*,*,*,ひと,ヒト,ヒト いき 名詞,一般,*,*,*,*,いき,イキ,イキ 公式Twitter 名詞,固有名詞,一般,*,*,*,公式Twitter,コウシキツイッター,コーシキツイッター は 助詞,係助詞,*,*,*,*,は,ハ,ワ こちら 名詞,代名詞,一般,*,*,*,こちら,コチラ,コチラ ‍ 名詞,サ変接続,*,*,*,*,* ️ 記号,一般,*,*,*,*,* ↓ 記号,一般,*,*,*,*,↓,↓,↓ BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* ️ 記号,一般,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* それ 名詞,代名詞,一般,*,*,*,それ,ソレ,ソレ じゃ 助詞,副助詞,*,*,*,*,じゃ,ジャ,ジャ また 接続詞,*,*,*,*,*,また,マタ,マタ ! 記号,一般,*,*,*,*,!,!,! BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* see 名詞,固有名詞,組織,*,*,*,* you 名詞,固有名詞,一般,*,*,*,YOU,ユウ,ユー soon 名詞,一般,*,*,*,*,* ...♡ 名詞,サ変接続,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* BOS/EOS,*,*,*,*,*,*,*,* 影山優佳 名詞,固有名詞,一般,*,*,*,影山優佳,カゲヤマユウカ,カゲヤマユーカ BOS/EOS,*,*,*,*,*,*,*,*

NEologdをwindowsに導入するのめちゃくちゃ苦戦しましたが、よく分からないうちに使えるようになりました。動けばとりあえずいいや。
「カムカムエブリバディ」とか「radiko」とかもちゃんと固有名詞として認識されてますね。

でもこのNEologd諸刃の剣っぽくて、例えば「幸せいっぱい」が正しくは「幸せ:名詞」と「いっぱい:副詞」に分けるべきところを、まるっと1つの名詞にしてます(そういう歌があるらしい)。厳密にやろうとするとこのへんめちゃくちゃしんどくないですか…?

あと、造語って言うか、例えば「こんちゃ!」とか、「ばいころまる~」とか、辞書にない言葉をどうする問題もあります。が、いちいち辞書に登録したくないので、無視します。

とりあえず形になりそうなので、全部のブログをこの方法で形態素解析し、単語の出現頻度をまとめたBoWにします。

BoW

from collections import Counter

m = MeCab.Tagger('-Ochasen')
for i in range(len(df)):
    #print('\n','===='+str(i)+'====')
    
    #===クリーニング===
    tmp = re.sub(r'(https?|ftp)(:\/\/[-_\.!~*\'()a-zA-Z0-9;\/?:\@&=\+\$,%#]+)','',df['blog'][i])
    tmp = re.sub(r'(\u200d)','',tmp)
    tmp = remove_emoji(tmp)
    tmp = re.split('[\n,\u3000,\xa0,。]',tmp)
    sentences  = [s for s in tmp if s != '']
    
    #===形態素解析===
    words = []
    for j in range(len(sentences)):
        nodes = m.parseToNode(sentences[j])
        while nodes:
            f = nodes.feature.split(',')
            if f[6]=='*':
                nodes = nodes.next#削除しきれなかった絵文字など、原型が登録されていないものは意味を持たない単語と見なし飛ばす
            else:
                words.append(f[6]+'-'+f[0])
                nodes = nodes.next
    
    #===BoWにする===
    words_col = Counter(words)
    word_df = pd.DataFrame(words_col,index=[i])
    if i == 0:
        word_df_all = word_df
    else:
        word_df_all = pd.concat([word_df_all,word_df])

word_df_all.fillna(0,inplace=True)
word_df_all = pd.concat([df['member'],word_df_all],axis=1)
word_df_all.to_csv('data.csv',index=False)
print('done')
done
bow = pd.read_csv('data.csv')
bow
member 先ほど-名詞 発表-名詞 が-助詞 ある-動詞 ます-助動詞 た-助動詞 通り-名詞 、-記号 先日-名詞 ... いわえる-動詞 かみしめる-動詞 なんぼ-副詞 祝う-動詞 ド-接頭詞 てんし-名詞 祝い-名詞 なおす-動詞 ふく-動詞 ためし-名詞
0 潮紗理菜 1.0 1.0 9.0 3.0 9.0 5.0 1.0 4.0 1.0 ... 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
1 潮紗理菜 0.0 0.0 20.0 8.0 23.0 52.0 0.0 16.0 0.0 ... 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
2 潮紗理菜 0.0 0.0 18.0 3.0 18.0 19.0 0.0 13.0 0.0 ... 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
3 潮紗理菜 0.0 1.0 15.0 6.0 19.0 17.0 0.0 20.0 0.0 ... 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
4 潮紗理菜 0.0 0.0 5.0 2.0 8.0 12.0 0.0 7.0 0.0 ... 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
225 ポカ 0.0 0.0 1.0 0.0 0.0 0.0 0.0 1.0 0.0 ... 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
226 ポカ 0.0 0.0 3.0 0.0 2.0 5.0 0.0 2.0 0.0 ... 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
227 ポカ 0.0 0.0 1.0 0.0 1.0 3.0 0.0 1.0 0.0 ... 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
228 ポカ 0.0 0.0 0.0 1.0 2.0 3.0 0.0 9.0 0.0 ... 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
229 ポカ 0.0 0.0 1.0 0.0 0.0 4.0 0.0 1.0 0.0 ... 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0

230 rows × 5671 columns

それっぽい形になりました。
あとはこれを煮るなり焼くなりして遊びます。

平均投稿語数

形になったので、ためしにメンバーごとの平均投稿語数を見てみます。

import matplotlib.pyplot as plt
import seaborn as sns
sns.set()

bow['総語数'] = bow.sum(axis=1)
total_words = bow.groupby('member').mean()['総語数'].sort_values(ascending=False)
plt.rcParams['font.family'] = "Yu Gothic"
sns.barplot(x=total_words,y=total_words.index)
<matplotlib.axes._subplots.AxesSubplot at 0x21495d9b780>

どんだけこさかなのブログが長文かっちゅうことです。
そのぶん投稿頻度は他に比べて低いので、月あたり語数とか見てみてもおもしろいかも。

みーぱんファミリーはブログ短めのようです。