【Python】MeCabを使って文章を解析して名詞だけ取得する方法

【Python】MeCabを使って文章を解析して名詞だけ取得する方法です。

サンプルコードは以下の通りです。

※事前にMeCabとmecab-python3?をインストールする必要があります。

import MeCab
mecab = MeCab.Tagger("mecabrc")
# MeCabを使って形態素解析をします。
def ma_parse(sentence, fileter="名詞"):
node = mecab.parseToNode(sentence)
while node:
if node.feature.startswith(filter):
yield node.surface
node = node.next
if __name__ == "__main__":
sentence = """山崎まさよしは、日本のシンガーソングライター、俳優。愛称は「まさやん」。
身長176cm、体重64kg、A型、滋賀県大津市出身、山口県防府市育ち。
ライブでの基本はギター。レコーディングではマルチプレイヤーであり、作品(楽曲『未完成』など)によっては全ての楽器をこなしている。既婚
"""
words = [word for word in ma_parse(sentence)]
print(words)

コメントする

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

This site uses Akismet to reduce spam. Learn how your comment data is processed.