本文目錄一覽:
- 1、Python的pypinyin模塊怎麼添加
- 2、pypinyin顯示音調數字
- 3、python腳本,將一個文本中所有開頭髮音相同的詞歸到同一行
- 4、關於“商業敏感性”和“執行力”的故事
- 5、python3.x 如何獲取一個漢子的全拼
Python的pypinyin模塊怎麼添加
win+R 回車打開cmd窗口,輸入pip install pypinyin即可下載,python中模塊的下載都是用命令pip install 模塊名,導入庫用import 模塊名
pypinyin顯示音調數字
這需要用到python中拼音庫的用法。
Python中提供了漢字轉拼音的庫,名字叫做PyPinyin,可以用於漢字注音,排序,檢索等等場合,是基於hotto或pinyin這個庫開發的。
它有這麼幾個特性。1.根據詞組智能匹配最正確的拼音2.支持多音字,3.簡單的繁體支持,注音支持,4.支持多種不同拼音或注音風格。
python腳本,將一個文本中所有開頭髮音相同的詞歸到同一行
解決方案如下:
使用pip安裝程序所依賴的漢字轉拼音庫pypinyin:
pip install pypinyin
2. 代碼如下:
from pypinyin import lazy_pinyin
table = {}
with open(‘in.txt’,’r’, encoding=’utf-8′) as f:
for line in f:
line = line.strip()
key = lazy_pinyin(line[0])[0]
if table.get(key):
table[key].append(line)
else :
table[key] = [line]
with open(‘result.txt’,’w’,encoding=’utf-8′) as f:
for key in table:
f.write(key)
for v in table[key]:
f.write(‘ ‘ + v)
f.write(‘\n’)
注意:
根據需要將代碼中的in.txt修改為你要導入的文件名
要導入的文件編碼需要先轉換為utf-8格式
輸出文件名為result.txt,編碼格式為utf-8
關於“商業敏感性”和“執行力”的故事
關於後面的帖子,老土覺得主人公的“商業敏感性”非常值得學習。中國有嘻哈累計播放量30億次,看過這個節目的有技術背景的人實在不是小數。這個哥們可以敏銳的發現這個商機雖然有偶然性,但是也有必然性。而要如何具備這種商業敏銳性才是老土認為值得思考的。而在老土所在的職業技術學院對學生這方面的培養並不被重視。而老土也就只能是儘可能讓自己的學生可以儘早的接觸一些商業思維,希望對他們日後有所助益。
在“商業敏感性”之外,下文主人公的“執行力”也是他可以達成這個商機的核心原因。這裡老土要格外強調一下“執行力”。可能有的看官在看了這個帖子之後,會覺得主人公可以搞出來“押韻靈感”的原因是他手頭恰好有一些現成的資源(比如說現成的語料庫),但老土認為成就這個哥們的是他的執行力。如果讓老土說心目中的第一美德,那麼“執行力”絕對是妥妥的第一名。這個世界上敏銳的人很多,有能力的人也很多,但做成事情的人並沒有那麼多。這其中的差異主要是“執行力”導致的。
我看了很多期中國有嘻哈,印象尤其深刻的是,某一次淘汰賽,每個小組要在24小時內完成一首歌。眾所周知,一首歌既有歌詞又有調調,一天內完成絕不是一件容易的事,選手們為此絞盡腦汁,前期花了很多時間在創作上,後面留給背歌詞的時間就少了很多,這直接導致了後來演唱忘詞的事情發生。
那個時候我就在想,如果有什麼工具,能夠輔助他們進行歌詞的創作,那就牛逼了。但這個時候我也僅僅是想想而已,畢竟看完節目就一兩點了,困得不行。
幾天之後,有一個哥們兒加我微信,他知道我以前爬了很多歌詞數據,問我能不能讓他按照韻腳來查詢,並且願意為此付費。這一瞬間我腦袋靈光一閃,覺得這個需求可能還真的存在,回復了他一句,我研究一下,同時開始研究起來。
我首先注意到了國外的相關產品,Google 一搜 rhyme ,就能看到大堆的產品,其中排名第一的 rhymezone,網站全球排名7000多名,流量達到了可怕的1100多萬:
反觀國內,搜索「押韻」或者「韻腳」,得到的都是一堆幾年前的舊東西,以文本內容為主,比如這樣的:
老實說,這東西的可讀性幾乎為0。不過也不是所有的結果都這樣,也有一些網站,提供了押韻的查詢,但是基本只是單個字的押韻,沒有詞語,沒有句子,在押韻的方法上也不支持歌詞中常見的「雙押」,「三押」等查詢。
別人做的爛,這就有可能是機會。於是,我開始着手做一個更強大的押韻工具。
這事兒說難不難,說簡單也不簡單,首先我需要搜集很多的歌詞和詞語,然後把他們每個字的韻腳都找出來,如此一來,當有人輸入一個詞的時候,我就可以根據他這個詞的韻腳,來找到與之押韻的詞語了。
在具體的技術處理上,我用 python 的開源庫 pypinyin 來取得漢字的拼音,然後寫了一個程序,可以按照韻腳不同自動歸類。接着我把公司內部一個語料庫的30萬個詞語都跑了一遍,獲得了這些詞語的韻腳。在這之後我又把之前的歌詞數據都跑了一遍,把歌詞的韻腳也拿到了。
數據有了之後,做個殼套上去就非常容易了,我花了一番功夫,把它做的像那麼回事兒。
在使用上,這個工具支持歌詞押韻查詢(帶有語義相似識別,指定歌手,指定字數押韻查詢),押韻詞語查詢,包含雙押,三押,多押等等。
另外我直接嵌入了微信支付接口,把這個做成一個徹頭徹尾的付費產品。為什麼要做成付費產品呢?原因很簡單,因為這又不是做公益,對吧,收點錢當作補貼公司的服務器支出了。
我把這個產品命名為「押韻靈感」,希望給人帶來創作時候的靈感。上線之後,流量增長的很快
8月16號上線,上線之後很快上漲到最高日600UV左右的流量,然後穩定在500左右,並慢慢穩定增長。
與此同時,付費數據也比較穩定。
在Growth Hacker上面,我做了如下的設定:
很多創作歌手通過這個工具加了我的微信,成了我的朋友,他們也非常感謝我提供了這樣一個工具,幫助他們切實提高了創作效率。當然,不得不提的是其中一個付費用戶,具體是誰我就不說了,你們可以猜猜
我大概花了2個小時處理數據,4個小時搭建網站,一共花了三天,每天兩個小時。雖然我現在不再花時間在這個項目上,但它還在運行,然而國內押韻的市場確實太小眾了,目前的押韻靈感的用戶已經基本上處於飽和狀態,收入也比較穩定。這筆收入通過微信支付會直接進入公司賬戶,並自動支付服務器費用,通過這個項目,我可以很高興的假裝我們的服務器是不要錢的。
這個經驗告訴了我們什麼呢?時至今日,發掘新需求是一項了不起的本事,即使再小眾的需求,只要是一部分人的剛需,那也是有價值的。當然,後面的執行也要跟上,不然,一個好需求白白浪費掉,這真是一件讓人心痛的事情。
希望我的經歷可以讓你珍惜每個曾經在你的腦子裡閃過光的瞬間,哪怕萬中無一,但也許,它可以變成美好的東西,給世界帶來一些價值。
python3.x 如何獲取一個漢子的全拼
用pip 安裝 :
pip install pypinyin
例子:
from pypinyin import pinyin, lazy_pinyin
import pypinyin
print(lazy_pinyin(‘中心’))
輸出:
[‘zhong’, ‘xin’]
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/151796.html