詞頻統計工具可以統計word文檔、網頁文件、文本以及PDF文件中所有的中英問單詞出現的頻率以及總次數,並把統計的數據輸分為word和excel的形式。支持全量統計和指定統計的方式,還可以選擇中文或是英文等。
全量統計方式,即統計給定多個文檔中的所有詞彙的出現詞頻;
指定統計方式,隻統計指定的某些特殊詞彙的出現詞頻。
可以選擇隻統中文詞彙、英語詞彙或標點符號。
問:詞頻分析結果是什麼樣的?比如我想把一篇文檔進行分詞,統計出高頻詞彙,這樣能做到嗎?分詞是單個字,還是一個詞語?
答:把一篇文檔進行分詞,統計出高頻詞彙,這就是這個軟件的功能。分詞是按語言學上的詞語,比如“中化人民共和國”算一個詞語。而且,對於一些新詞,或特殊定義的詞彙,如“新浪微博”這類新產生的詞彙,軟件提供了“自定義詞彙表”功能,您隻要把它添加到自定義的詞彙表中,就可以作為一個詞來進行統計。
修複了舊版中會導致統計錯誤的BUG
140.5M / 09-05
76.4M / 03-25
55M / 06-05
237.9M / 04-13
900.9M / 03-02
96.2M / 07-06
311.2M / 07-06
335M / 07-06
200M / 07-06
413.8M / 07-06
768.9M / 08-19
484.7M / 09-27
165.4M / 09-05
131.8M / 04-13
195.6M / 03-03
45.6M / 09-08
665.2M / 07-06
2.84G / 07-06
93M / 07-06
338.3M / 07-06
892.4M / 08-18
312M / 07-30
1.38G / 07-26
109.8M / 06-03
142M / 01-08
1.2M / 11-23
548.8M / 04-13
1.6M / 04-13
1.48G / 03-18
646.6M / 03-03
404M / 08-18
110.5M / 09-05
33.4M / 09-05
60M / 04-29
254M / 04-25
659M / 04-23
1M / 12-26
253.4M / 12-08
253M / 12-08
1.19G / 11-16
115.9M / 08-19
488.3M / 06-04
369M / 09-22
181.5M / 09-22
201.2M / 09-05
248.9M / 12-08
248.9M / 12-08
100.6M / 03-06
148.9M / 03-06
1.12G / 07-06
126.7M / 02-04
1.76G / 09-22
1.92G / 04-17
201.5M / 04-13
7.31G / 07-01
94.3M / 07-06
2.48G / 07-06
7.63G / 07-06
1M / 07-06
778.1M / 07-06
1.30G / 08-19
72M / 07-06
548.7M / 07-06
1.00G / 07-06
9.13G / 07-06
126.2M / 07-06
72M / 07-06
105.1M / 07-06
132M / 07-06
132M / 07-06