请选择 进入手机版 | 继续访问电脑版

好程序员-千锋教育旗下高端IT职业教育品牌

400-811-9990
我的账户
好程序员

专注高端IT职业培训

亲爱的猿猿,欢迎!

已有账号,请

如尚未注册?

[BigData] 好程序员大数据教程分享Scala系列之文件以及正则表达式

[复制链接]
叶子老师 发表于 2019-10-17 15:53:39 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
好程序员大数据教程分享Scala系列之文件以及正则表达式1 读取行
导入scala.io.Source后,即可引用Source中的方法读取文件信息。
import scala.io.Source
object FileDemo extends App{
  val source = Source.fromFile("C:/Users/admin/res.txt")
    //返回一个迭代器
  val lines = source.getLines()
  for(i <- lines)
    println(i)
     //内容也可以放到数组中
//  val arr = source.getLines().toArray
//  for(elem <- arr)
//    println(elem)
     //文件内容直接转换成一个字符串
//  val contents = source.mkString
//  println(contents)
}
2 读取字符
按字符读取文件中的内容
import scala.io.Source
object FileDemo extends App{
  val source = Source.fromFile("C:/Users/admin/res.txt")
  for(c <- source)
    println(c)
}
3 读取单词
把文件中的内容,转换成一个单词的数组
import scala.io.Source
object FileDemo extends App{
  val source = Source.fromFile("C:/Users/admin/res.txt")
  val contents = source.mkString.split(" ")
  for(word <- contents)
  println(word)
}
4 读取网络文件
Source可以直接读取来自URL等非文件源的内容
import scala.io.Source
object FileDemo extends App{
  val source = Source.fromURL("http://www.baidu.com")
  val lines = source.getLines()
  for(i <- lines)
    println(i)
}
5 写文件
scala 没有内建的对写入文件的支持,要写入文件,使用Java.io.PrintWriter
val out = new PrintWriter("numbers.txt")
for(i <- 1 to 100) out.println(i)
out.close
6 正则表达式
构造一个Regex对象,用String类的r方法或者使用new Regex(" ")
如果正则表达式中包含反斜杠或者引号的化,可以使用""" """
object RegexDemo extends App{
    //构建一个正则表达式
  val numPattern ="[0-9]+".r
    //val numPattern = new Regex("abl[ae]\\d+")
    //构建一个字符串
  val matchStr ="98 bottles,99bottles"
    //使用findAllIn方法返回所有匹配项的迭代器
  for (matchStr <- numPattern.findAllIn(matchStr))
    println(matchStr)//98 99
    //使用""" """"构造含有特殊字符的正则表达式
  val wsnumPattern ="""\s+[0-9]+\s+"""
    //调用findFirstIn方法返回首个匹配项
  val first = numPattern.findFirstIn(matchStr)
  println(first) //Some(98)
    //调用findPrefixOf方法返回字符串的开始部分是否能匹配
  val ifStartMatch = numPattern.findPrefixOf(matchStr)
  println(ifStartMatch)//Some(98)
    //调用replaceFirstIn使用特定的字符串替换首个匹配项
  val res1 = numPattern.replaceFirstIn(matchStr,"xx")
  println(res1)//xx bottles,99bottles
     //调用replaceAllIn使用特定的字符串替换所有的匹配项
  val res2 = numPattern.replaceAllIn(matchStr,"xx")
  println(res2)//xx bottles,xxbottles
}
6 正则表达式组
分组可以让我们方便地获取正则表达式的子表达式。在你想要提取的子表达式两侧加上圆括号
object RegexDemo extends App{
  //数字和字母的组合正则表达式
  val numitemPattern="""([0-9]+) ([a-z]+)""".r
  val line="666 spark"
  for(numitemPattern(num,item) <- numitemPattern.findAllIn(line)){
    println(num+"\t"+item)
  }
  line match{
    case numitemPattern(num,item)=> println(num+"\t"+item)
    case _=>println("Nothing matched")
  }
}
好程序员大数据教程http://www.goodprogrammer.org/bigdata.shtml

精彩内容,一键分享给更多人!
回复

使用道具 举报

您需要登录后才可以回帖

本版积分规则

关注我们
好程序员
千锋好程序员

北京校区(总部):北京市海淀区宝盛北里西区28号中关村智诚科创大厦

深圳西部硅谷校区:深圳市宝安区宝安大道5010号深圳西部硅谷B座A区605-619

杭州龙驰智慧谷校区:浙江省杭州市下沙经济技术开发区元成路199号龙驰智慧谷B座7层

郑州校区:郑州市二七区航海中路60号海为科技园C区10层、12层

Copyright 2007-2019 北京千锋互联科技有限公司 .All Right

京ICP备12003911号-5 京公安网11010802011455号

请您保持通讯畅通1对1咨询马上开启