本文目錄一覽:
如何用Python做詞雲
推薦使用jieba模塊來實現分詞,WordCloud來繪製詞雲。
# -*- coding: utf-8 -*-
from PIL import Image
import numpy as np
import matplotlib.pyplot as plt
import jieba
from wordcloud import WordCloud, STOPWORDS
# Read the whole text.
text = open(‘內容.txt’, ‘r’).read()
text = ” “.join(jieba.cut(text, cut_all=False))
# 愛心.png表示你繪圖模板,就是最後圖片的形狀
alice_mask = np.array(Image.open(‘愛心.png’))
# 中文需要設置字體,songti.ttf代表宋體
wc = WordCloud(font_path=’songti.ttf’, background_color=”white”, mask=alice_mask,
max_words=2000)
# generate word cloud
wc.generate(text)
# store to file
wc.to_file(‘result.png’)
# show
plt.imshow(wc)
plt.axis(“off”)
# plt.figure()
# plt.imshow(alice_mask, cmap=plt.cm.gray)
# plt.axis(“off”)
plt.show()
python如何自定義詞雲
推薦使用jieba模塊來實現分詞,WordCloud來繪製詞雲。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
# -*- coding: utf-8 -*-
from PIL import Image
import numpy as np
import matplotlib.pyplot as plt
import jieba
from wordcloud import WordCloud, STOPWORDS
# Read the whole text.
text = open(‘內容.txt’, ‘r’).read()
text = ” “.join(jieba.cut(text, cut_all=False))
# 愛心.png表示你繪圖模板,就是最後圖片的形狀
alice_mask = np.array(Image.open(‘愛心.png’))
# 中文需要設置字體,songti.ttf代表宋體
wc = WordCloud(font_path=’songti.ttf’, background_color=”white”, mask=alice_mask,
max_words=2000)
# generate word cloud
wc.generate(text)
# store to file
wc.to_file(‘result.png’)
# show
plt.imshow(wc)
plt.axis(“off”)
# plt.figure()
# plt.imshow(alice_mask, cmap=plt.cm.gray)
# plt.axis(“off”)
plt.show()
python如何做詞雲 一步一步教你如何做
如果你之前沒有編程基礎,沒關係。希望你不要限於瀏覽,而是親自動手嘗試一番。到完成的那一步,你不僅可以做出第一張詞雲圖,而且這還將是你的第一個有用的編程作品。
1、請確保你的python環境沒有問題,用的開發工具是VsCode,首先你要在Python擴展中安裝python開發環境(當然,這不是為你的windows安裝python)。
2、那麼你還需要安裝所需要的第三方庫,那麼在VSCode中並沒有PyCharm那麼專業,這裡需要獲得你自己的Python腳本位置。
3、我們可以發現裡面有一個名為pip.exe文件,這個文件就是python官方給我們去安裝python第三方庫的一個程序,那麼我們可以在VsCode的終端中就可以去通過它,這也是我們為什麼要獲取python安裝位置的根本原因。
4、python做詞雲呢,需要導入的包有wordcloud和PIL,其中PIL(Python Image Library)是python平台圖像處理標準庫,功能是真的強大。首先需要讀取文件 。
5、如果python引入無誤,並代碼無誤,那麼會彈出你生成的圖片,該圖片會儲存在你的系統。
python中對已經排好序的詞語怎麼做詞雲
期末複習比較忙過段時間來專門寫scrapy框架使用,今天介紹如何用python生成詞雲,雖然網上有很多詞雲生成工具,不過自己用python來寫是不是更有成就感。
今天要生成的是勵志歌曲的詞雲,百度文庫裡面找了20來首,如《倔強》,海闊天空是,什麼的大家熟悉的。
所要用到的python庫有 jieba(一個中文分詞庫)、wordcould 、matplotlib、PIL、numpy。
首先我們要做的是讀取歌詞。我將歌詞存在了文件目錄下勵志歌曲文本中。
現在來讀取他
12345
#encoding=gbklyric= ”f=open(‘./勵志歌曲歌詞.txt’,’r’)for i in f: lyric+=f.read()
加入#encoding=gbk是為了防止後面操作報錯SyntaxError: Non-UTF-8 code starting with ‘\xc0’
然後我們用jieba分詞來對歌曲做分詞提取出詞頻高的詞
123456
import jieba.analyseresult=jieba.analyse.textrank(lyric,topK=50,withWeight=True)keywords = dict()for i in result: keywords[i[0]]=i[1]print(keywords)
得到結果:
然後我們就可以通過wrodcloud等庫來生成詞雲了
首先先自己找一張圖片來作為生成詞雲的形狀的圖
12345678910111213
from PIL import Image,ImageSequenceimport numpy as npimport matplotlib.pyplot as pltfrom wordcloud import WordCloud,ImageColorGeneratorimage= Image.open(‘./tim.jpg’)graph = np.array(image)wc = WordCloud(font_path=’./fonts/simhei.ttf’,background_color=’White’,max_words=50,mask=graph)wc.generate_from_frequencies(keywords)image_color = ImageColorGenerator(graph)plt.imshow(wc)plt.imshow(wc.recolor(color_func=image_color))plt.axis(“off”)plt.show()
保存生成圖片
1
wc.to_file(‘dream.png’)
完整代碼:
1234567891011121314151617181920212223242526272829
#encoding=gbkimport jieba.analysefrom PIL import Image,ImageSequenceimport numpy as npimport matplotlib.pyplot as pltfrom wordcloud import WordCloud,ImageColorGeneratorlyric= ”f=open(‘./勵志歌曲歌詞.txt’,’r’)for i in f: lyric+=f.read() result=jieba.analyse.textrank(lyric,topK=50,withWeight=True)keywords = dict()for i in result: keywords[i[0]]=i[1]print(keywords) image= Image.open(‘./tim.jpg’)graph = np.array(image)wc = WordCloud(font_path=’./fonts/simhei.ttf’,background_color=’White’,max_words=50,mask=graph)wc.generate_from_frequencies(keywords)image_color = ImageColorGenerator(graph)plt.imshow(wc)plt.imshow(wc.recolor(color_func=image_color))plt.axis(“off”)plt.show()wc.to_file(‘dream.png’)
以上這篇python生成詞雲的實現方法(推薦)就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/291199.html