繁体 English 中英

如何在使用 python 的 Spark SQL 作业中避免 \r\n？

[英]How to avoid \r\n in Spark SQL Jobs using python?

原文 2020-06-11 23:16:04 7 1 python/ python-3.x/ automation/ apache-spark-sql

我有数百个 yaml 文件和 Hive 查询，我正在使用我编写的 python 脚本迁移到SparkSQL 。 我的目标是让SprkSQL查询格式正确，因此我在SparkSQL查询中保留了制表符（ \t ）、空格和新行（ \n ）字符。

问题是当我提交此代码时，我收到以下错误（图片）。 我可以通过用空格替换\r\n来解决这个问题，但这会影响格式，因为整个代码将在单行中。 我正在寻找一些可靠的方法来处理我的代码中的\r\n而不会影响格式。

我的解决方法：

当我用空格替换\r\n字符时，它工作正常，但没有格式化。
当我使用tr -d '\r' < input > output然后得到如下错误 \n

 Parsing Error [line 5]: '(\n' [line 46]: ')\n'

我花费大量时间手动调试每个文件并寻找一些可以自动化我的过程的想法。

1 个解决方案

使用 \ 在下一行显示文本的延续

如何避免在火花（python）中使用for循环

[英]how to avoid using for loop in spark (python)

如何使用scala或python在apache spark中运行多线程作业？

[英]How to run Multi threaded jobs in apache spark using scala or python?

如何使用python在spark中执行.sql文件

[英]How to execute .sql file in spark using python

如何使用 python 在 spark SQL 中传递变量？

[英]How to pass variables in spark SQL, using python?

如何使用 Python 和 joblib 并行提交多个 Spark 作业？

[英]How do I submit multiple Spark jobs in parallel using Python and joblib?

Python vs Scala（适用于Spark作业）

[英]Python vs Scala (for Spark jobs)

如何使用python摆脱字符串中的\\ n和\\ r

[英]How to get rid of \n and \r in a string using python

Python如何不打印\\ r和\\ n

[英]Python how to not print \r and \n

如何在python中通过\\ r \\ n进行正则表达式

[英]how to regex by \r\n in python

如何使用 cron 作业运行 python 文件

[英]How to run a python file using cron jobs

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 如何避免在火花（python）中使用for循环如何使用scala或python在apache spark中运行多线程作业？如何使用python在spark中执行.sql文件如何使用 python 在 spark SQL 中传递变量？如何使用 Python 和 joblib 并行提交多个 Spark 作业？ Python vs Scala（适用于Spark作业）如何使用python摆脱字符串中的\\ n和\\ r Python如何不打印\\ r和\\ n 如何在python中通过\\ r \\ n进行正则表达式如何使用 cron 作业运行 python 文件

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM