宋詞高頻辭彙

92 32 28

簡介

宋詞高頻辭彙,來源於某知名社交網站上一個曾經石沉大海的帖子“文科生終於可以被消滅了”,不僅再次浮出水面,並且憑藉內容中的技術含量成功征服了微博網友。網友“yixuan”曾發帖將《全宋詞》中的高頻詞統計出來,算出了100個常用辭彙排行榜。

作者解釋

。“yixuan”曾解釋:“因為突然想看看宋詞裡面什麼樣的意象是最常見的,比如可以做個頻率分析什麼的。當然文本挖掘需要分詞,我沒法在其中花太多時間,於是想出了一個土辦法。宋詞的句子都很短,如果窮舉可能的字的組合的話並不是太多,況且最常見的詞語一般是兩三個字,這樣可能的組合就更少了。”“比如‘猶解嫁東風’這句話,可能的二字組合是‘猶解’、‘解嫁’、‘嫁東’、‘東風’,三字組合是‘猶解嫁’、‘解嫁東’、‘嫁東風’,詞的字數越多,可能的組合就越少。如果把每句話可能的字的組合都列舉出來,就可以整體統計頻率了。”

來源

根據抗訴思路,“yixuan”用R語言(主要用於統計分析、繪圖的語言和操作環境)編出一個程式,由此,100個在宋詞中高頻出現的辭彙被他統計出來,排在前十位的是1485、東風(1382)、何處(1230)、人間(1202)、風流(857)、歸去(812)、春風(802)、西風(779)、歸來(771)、江南(765)。“yixuan”解釋說:“排在第一的是無效字元,這跟數據源有關。裡面會有很多無意義字的組合,不過這類‘詞語’本身的出現就是一個偶然,所以可以預期的是它們整體的頻數會很低,是入不了‘大雅之堂’的。”

內容

1485、
東風(1382)
何處(1230)
人間(1202)
風流(857)
歸去(812)
春風(802)
西風(779)
歸來(771)
江南(765)

網友評論

@Fans冬粉:技術宅的力量無窮呀。
@天狐令主:完了,文科生被斃得滿地找牙。
@winky詩:倒是覺得用來做暗語加密很好的……
@你可曾聽過風:神帖,消滅文科生的利器。不過,話說回來,理科宅男可真閒得蛋疼
@波恩的農民:跪求高考作文高頻詞模板。
@陳一芬Elena:理科生們你們忽略了【平仄】君的存在了嗎?這就想寫詩?弱爆了!→_→
@溧陽移動:高人,能不能把平仄也加上。如果平仄太困難,至少考慮一下詞尾押韻如何?韻腳也就十來個,每個都分配一個數值,然後每隔一行,末尾的詞就只從一個值下選。這樣會增加仿真度啊!
@鄭博KW:宋詞你就當是宋朝的流行歌吧,你去統計一下現在的歌詞,馬上就可以消滅所有作詞家咯!
@霸蠻好了BBT:真是學好數理化,走遍天下都不怕哈!連吟詩作詞都能這樣玩,讓文藝青年情何以堪?

其他代表作

清平樂・圓周率
作者:“達文西的雞蛋”
回首明月(一看就是抒情詩)
14 15
悠悠心事空(果然,貌似失戀了)
92 65
西湖何事寂寞中(觸景生情)
35 89 79
風吹斜陽匆匆(回憶那天下午的艷遇)
32 38 46
芳草平生斜陽(平生見過最美的太陽和芳草,都是因為那裡有你的身影)
26 43 38
風吹寂寞今日(到現在就剩我自己)
32 79 50
一枝富貴年年(好花美麗年年開,好景宜人不常在)
28 84 19
斷腸長安不知(我的思念遠方的你可知道?)
71 69 39
如夢令・根號二
作者:“達文西的雞蛋”
深處時節千里(過了許多年,男豬腳來到了很遙遠的地方)
41 42 13
訊息當年鴛鴦(這……找老相好去了?)
56 23 73
歸來今日(妹子,我胡漢三回來啦)
09 50
一點無情多少(你還知道來看我啊!)
48 80 16
今夜,今夜(要出問題了……)
88 88
而今時節歸來(仿佛重回當年,男豬腳依然那么堅挺)
72 42 09

相關詞條

熱門詞條

聯絡我們