首页 > 其他 > 详细

201671010432词频统计软件项目报告

时间:2019-03-20 01:00:29      阅读:88      评论:0      收藏:0      [点我收藏+]

标签:git   技术分享   href   完成   github   关系   则表达式   分词   token   

Github仓库链接地址

1.需求分析


读入任意一个英文文本,统计其单词出现的频率并输出。

2.功能设计


用最简单的代码实现,可以自动读入英文文本文件,具有单词词频统计的功能,

3.设计实现


定义一个主函数,用HashMap存放<单词:词频>这样一个映射关系,用正则表达式来过滤字符串中的所有标点符号,使用StringTokenizer来分词,遍历HashMap,输出结果。

4.测试运行


技术分享图片

5.代码片段


技术分享图片

6.总结

    看似一个简单的实验,对于我来说却是个挑战,在完成这次作业的过程中查阅了书籍也上网查找了相关的内容。由于Java编程中很多自己都没有学到的知识,复杂的代码都看不懂,通过上网来一步步去了解去认识。就那么几个知识点自己始终出错,对每个类方法的运用不灵活,基础太弱。没有达到任务的要求,是自己能力的问题。通过这个小程序使我对Java有了以前没有的兴趣,在以后的课下时间一定要挤出时间来学习这个有趣的语言。功能只实现最简单的,统计出了词频,但是交上的都是我理解的。希望随着我的学习,后期逐渐对这个程序优化,使之成为一个比较成熟的小程序。

7.PSP

技术分享图片

201671010432词频统计软件项目报告

标签:git   技术分享   href   完成   github   关系   则表达式   分词   token   

原文:https://www.cnblogs.com/wulanlan8882/p/10559127.html

(0)
(0)
   
举报
评论 一句话评论(0
0条  
登录后才能评论!
© 2014 designnerd.net 版权所有 鲁ICP备09046678号-4
打开技术之扣,分享程序人生!
             

鲁公网安备 37021202000002号