2020寒假学习进度报告2

mawangwang mawangwang     2023-04-22     143

关键词:

  今日完成内容:学习了scala中的语法,主要知识点包括:变量的定义,数值类型,运算符,流程控制,for循环,while循环, do ... while循环,(不建议使用while和do...while,因为函数引入了外部变量),函数尤其是递归,之前学习其他语言时强调尽量少用递归操作,但是在scala中对于递归做了底层优化,所以scala中会用到大量的递归操作。

  明日学习任务:学习scala中函数的使用,面向对象编程和函数式编程

2020/2/13寒假自学——学习进度报告16(代码片段)

  电脑修好了,但之前落下的几天博客确实没啥补的劲头,今天先写一份报告吧。  实验内容和要求安装Flume 安装成功。使用Avro数据源测试Flume配置文件  启动flumeagenta1创建指定的日志文件客户端传输传输完成&nbs... 查看详情

2020/2/1寒假自学——学习进度报告8(代码片段)

  开始尝试sparkSQL的尝试编程。  SparkSQL总体来说就是spark中的hive,但麻烦的一点是spark官网下载的并不自带对hive的支持,所以不能使用外部的hive。之后解决。  所以这次主要关注dataframe的编程。  首先创建了一个json文... 查看详情

2020寒假学习进度报告6(代码片段)

  1.计算级数  请用脚本的方式编程计算并输出下列级数的前n项之和Sn,直到Sn刚好大于或等于q为止,其中q为大于0的整数,其值通过键盘输入。   例如,若q的值为50.0,则输出应为:Sn=50.416695。请将源文件保存为exerci... 查看详情

2020/2/2寒假自学——学习进度报告9

  因为想要通过hive作为数据库来保存爬取后和处理完成的数据,需要添加spark的hive支持,这方面还没编译完,所以今天暂时没有这方面的进度,所以写写SparkSteaming。  数据的价值随着时间的流逝而减少  这也正是MapReduce... 查看详情

2020/1/24寒假自学——学习进度报告5

  接下来要写4篇的进度报告,准备把RDD编程和SparkSQL放在这几天一起弄掉(没回老家的大年三十稍微有些无聊)。  这一篇我想先笼统一下各方面的知识,省的有不理解的地方。  首先是RDD。  作为一个分布式的数据构... 查看详情

2020/1/18寒假自学——学习进度报告2

  写博客是时隔两天,但学习并没有停止。  这一篇博客还是写一下关于Spark基础知识的,上次只是总体名词的理解。Spark的核心是建立在统一的抽象RDD之上,使得Spark的各个组件可以无缝进行集成,在同一个应用程序中完成... 查看详情

2020年寒假第7次学习进度记录

当日学习内容:视频学习jQuery基础,熟悉使用AndroidStudio1.视频学习近况   继续学习jQuery基础2.AndroidStudio的使用情况   在上次安装之后,发现AndroidSDK版本没有下载完,所以今天又对其进行的完善。 查看详情

2020/1/18寒假自学——学习进度报告3(代码片段)

  紧接上一次。  这次是对于spark安装的总结。  首先便是下载spark。   从官网上可以找到用户提供Hadoop环境的安装包,另外值得一提的是用户也可以无需自己安装hadoop而是选择原装包括了hadoop的安装包。   ... 查看详情

2020/1/25寒假自学——学习进度报告6(代码片段)

  这篇准备尝试RDD的编程操作。  spark运行用户从文件系统中加载数据、通过并行集合(数组)创建RDD,两种都是很方便的操作方式。  应对实验,我在创建了一个文本文件。内容包括——     之后就是尝... 查看详情

2020/1/18寒假自学——学习进度报告4(代码片段)

  上次是安装完成了,这次就来试试Spark的基本操作。  首先是运行Spark自带的实例SparkPi。    在配置好环境变量的时候可以直接运行,但可以看到虽然运行成功但信息太过复杂,所以检索之后——   &n... 查看详情

2020/1/27寒假自学——学习进度报告7(代码片段)

  今天想记录下如何在windows环境下远程提交代码到spark集群上面运行。  spark集群搭建环境使Linux系统,但说实在,Linux系统因为是虚拟机的缘故运行IDE并不是很舒服,想要对python进行舒适的编程操作还不是一件容易事,所以... 查看详情

寒假学习进度报告1

  因为电脑装了太多软件,卡顿对操作十分不便,我决定利用假期自己装系统。  每次装系统都要花钱找电脑店,这让我一个学计算机的学生很羞耻,都不好意思说自己是软件工程的学生。  早就准备好了启动盘,用微pe... 查看详情

寒假学习进度06

日期:2020.01.26博客期:134星期日    1、Python爬取任务已经完成,包括制作网页可视化,详情请看博客:https://www.cnblogs.com/onepersonwholive/p/12229362.html!  2、开始着手于“热词分析”方面的爬取(现在对于热词从哪里... 查看详情

2020年寒假学习进度第十天

 今天主要学习了实验7Spark机器学习库MLlib编程实践,主要代码:importorg.apache.spark.ml.feature.PCAimportorg.apache.spark.sql.Rowimportorg.apache.spark.ml.linalg.Vector,Vectorsimportorg.apache.spark.ml.evaluation.MulticlassClassificationEvaluatorimportorg.apache.spark.ml.P... 查看详情

2020年寒假学习进度第十五天

python使用正则抓取数据  今天主要学习了python使用正则抓取网页数据。 首先这是正则的几个步骤:1、用importre导入正则表达式模块;2、用re.compile()函数创建一个Regex对象;3、用Regex对象的search()或findall()方法,传入想... 查看详情

2020年寒假学习进度

...sp;  由于下学期就要进行毕业设计答辩,打算这个寒假在家先继续巩固知识和学习新的技术要点,然后着力进行毕业设计的开发。    今天主要复习了一些关于javaweb的内容,总结如下:(1)WEB,也就是网页... 查看详情

2020年寒假第5次学习进度记录

当日学习内容:阅读《梦断代码》、视频学习前台技术(HTML(JSP)+CSS)1.《梦断代码》阅读近况   今天,我阅读了第9章“方法”和第10章“工程师和艺术家”。      在第9章“方法&rd... 查看详情

2020年寒假学习进度第七天

今天主要学习了spark实验四的内容,实验四主要为RDD编程,本实验的重点为两个编程题 1.编写独立应用程序实现数据去重对于两个输入文件A和B,编写Spark独立应用程序,对两个文件进行合并,并剔除其中重复的内容,得到一... 查看详情