[英]How to avoid \r\n in Spark SQL Jobs using python?
我有数百个 yaml 文件和 Hive 查询,我正在使用我编写的 python 脚本迁移到SparkSQL
。 我的目标是让SprkSQL
查询格式正确,因此我在SparkSQL
查询中保留了制表符( \t
)、空格和新行( \n
)字符。
问题是当我提交此代码时,我收到以下错误(图片)。 我可以通过用空格替换\r\n
来解决这个问题,但这会影响格式,因为整个代码将在单行中。 我正在寻找一些可靠的方法来处理我的代码中的\r\n
而不会影响格式。
我的解决方法:
\r\n
字符时,它工作正常,但没有格式化。tr -d '\r' < input > output
然后得到如下错误 \nParsing Error [line 5]: '(\n' [line 46]: ')\n'
我花费大量时间手动调试每个文件并寻找一些可以自动化我的过程的想法。
使用 \ 在下一行显示文本的延续
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.