您现在的位置是:主页 > news > 锟鹏建设招聘网站/seo引擎优化培训

锟鹏建设招聘网站/seo引擎优化培训

admin2025/5/25 9:02:44news

简介锟鹏建设招聘网站,seo引擎优化培训,宜章泰鑫建设有限公司网站,excel连接网站 做数据分析最近,笔者在研究一个有关“自然语言处理”的项目,在这个项目中,需要我们用Spark进行编程。而Spark内核是由Scala语言开发的,所以在使用Spark之前,我们必须配置好Scala,而Scala又是运行在JVM上的&#xff0c…

锟鹏建设招聘网站,seo引擎优化培训,宜章泰鑫建设有限公司网站,excel连接网站 做数据分析最近,笔者在研究一个有关“自然语言处理”的项目,在这个项目中,需要我们用Spark进行编程。而Spark内核是由Scala语言开发的,所以在使用Spark之前,我们必须配置好Scala,而Scala又是运行在JVM上的&#xff0c…

最近,笔者在研究一个有关“自然语言处理”的项目,在这个项目中,需要我们用Spark进行编程。而Spark内核是由Scala语言开发的,所以在使用Spark之前,我们必须配置好Scala,而Scala又是运行在JVM上的,所以在配置Scala之前,先要配置好JDK。下面是我个人的一些总结。

我是在Win7系统下开的虚拟机,虚拟机的系统是CentOS7,在创建虚拟机完成后,它会自带一个OpenJDK,我的版本是这样的:

2e5fd18880799c89fd18b5b753ac374f.png

但是因为最开始不了解这个情况,所以我从官网上下载了jdk-8u73-linux-x64.tar.gz,并解压在/Downloads目录下。进入/etc/profile.d目录下,新建path.sh脚本文件,打开并配置环境变量如下图:

b7f82ccec6795bf6725b548e4e6e38b0.png

在/etc/profile.d目录下,键入source path.sh命令,使配置生效。

然而配置成功后,在控制台中键入java -version,依然会得到第一张图中的信息,后来发现在配置JDK之前,需要卸载系统自带的JDK。

在控制台中键入java,会出现如下图所示的内容:

c51d8854929a138f133f519c4b52273f.png

但是不知道这些,只知道Java开发环境已经配置完毕,所以便开始找对应版本的Scala,我下载的是scala-2.10.5.tgz,并解压在/Downloads目录下。进入/etc/profile.d目录下,打开path.sh文件,配置Scala环境变量,如下图所示:

8d738cee2e9b703af11af808a1cf6f76.png

在/etc/profile.d目录下,键入source path.sh命令,使配置生效。

在控制台中键入scala -version和scala,会分别得到如下两张图中的内容:

41d850d49d8208d7f27763d461ec0446.png

f9b585e131f04422484a491f9cc6fbd0.png

在各种项目中,我们常常需要用到文件操作,笔者在近期的项目中遇到了一个与文件操作相关的问题。

在代码实现的过程中,笔者首先定义了一个文件路径:def PATH = "/a/b/c.txt"

之后开始使用文件操作:val source1 = Source.fromFile(PATH)

在for循环中,逐行读取文件、处理文件:for(line1

在这一轮对文件的各行处理之后,笔者希望再次对处理后的结果进行下一轮处理,所以再次使用了for循环:for(line1

但是,结果显示,第二轮操作并没有真正实现。

经过研究发现,在利用source对象读取完一遍文件后,它便指向了文件的尾部,再次调用for循环时,实际上没有进行任何操作,因为没有读入任何数据。

解决方法是,重新实例化一个source2:val source2 = Source.fromFile(PATH)

再次调用for循环:for(line2

这样就可以实现再次对文件进行操作了。