spark 函数split 处理特殊字符 点号 星号 斜线 竖线

sparkscala语言处理时间问题时是有固定的处理方式。同样的它在处理字符串数据时,经常会对一行数据按照某个特定的字符分割,如果是逗号、井号或者其它比较明显或者没有特殊含义的字符,直接在split函数中传入该字符即可。但是如果是特殊字符在用split的时候需要做转义。

例如以下特殊字符的分割方式:

关于 按点分割 用string.split(“[.]”) 解决。
关于 按竖线分割 用 string.split(“\|”)解决。
关于 按星号分割 用 string.split(“\*”)解决。
关于 按斜线分割 用 sring.split(“\\”)解决。
关于 按中括号分割 用 sring.split(“\[\]”)解决。

此外还有一些其它需要注意的符号,这些在作为分隔符时都是需要做转移处理的

split 分割转义

发表回复