简体   繁体   English

在 teradata 的 parquet 文件中导出数据

[英]Export data in parquet file in teradata

I cannot figure out a solution for exporting data from the Teradata database in a parquet format.我无法找出以镶木地板格式从 Teradata 数据库导出数据的解决方案。 I am using tdload and tbuild method which required tpt script to be generated.我正在使用需要生成 tpt 脚本的 tdload 和 tbuild 方法。

What should be the solution to export file in parquet files from the Teradata database?从 Teradata 数据库导出镶木地板文件的解决方案应该是什么?

tdload cmd - tdload 命令 -

tdload --SourceTdpid 192.168.xx.xx --SourceUserName dbc --SourceUserPassword dbc --SourceTable AdventureDW.FactProductInventory --TargetTextDelimiter "|" tdload --SourceTdpid 192.168.xx.xx --SourceUserName dbc --SourceUserPassword dbc --SourceTable AdventureDW.FactProductInventory --TargetTextDelimiter "|" --FileWriterFileSizeMax 30G --TargetFilename F:\Data\data.parquet My_Unload_Job --FileWriterFileSizeMax 30G --TargetFilename F:\Data\data.parquet My_Unload_Job

What changes should I do the command to get output in parquet format?我应该对命令进行哪些更改以获取镶木地板格式的输出?

I was able to convert the data from csv to parquet format via dask framework.我能够通过 dask 框架将数据从 csv 转换为 parquet 格式。 Here post the extraction, using pyarrow engine I was able to convert the large csv datasets into inbuilt parquet function via dask framework在这里发布提取,使用 pyarrow 引擎我能够通过 dask 框架将大型 csv 数据集转换为内置 parquet 函数

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 将数据增量地写入镶木地板文件 - Write data incrementally to a parquet file 将数据导出到python文件中 - export data into file in python spark-未定义架构,在以下位置未找到Parquet数据文件或摘要文件 - spark - No schema defined, and no Parquet data file or summary file found under 使用 Dask read parquet 读取具有不同数据类型(如十进制)的镶木地板文件时出现问题 - Issue while reading a parquet file with different data types like decimal using Dask read parquet 在保留数据类型的同时导出熊猫数据框的格式是什么? 不是 CSV; Sqlite? 镶木地板? - What format to export pandas dataframe while retaining data types? Not CSV; Sqlite? Parquet? 字符串数据中的镶木地板文件的大小是否大于 csv? - Has parquet file the size greater csv in string data? 如何减少 Python 代码将数据写入镶木地板文件所花费的时间? - how to decrease time taken by the Python code to write data to parquet file? 如何读取 python 中的 data.parquet.gz 文件? - How to read data.parquet.gz file in python? 如何使用镶木地板文件中的 python 将数据写入雪花 - How to write data to snowflake with python from parquet file 上传到 Azure Data Lake gen 2 后 Parquet 文件不可读(Python) - Parquet file after upload to Azure Data Lake gen 2 not readable (Python)
 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM