繁体   English   中英

数据总是在SAS Proc Import(CSV)中被截断

[英]Data always gets truncated in SAS Proc Import (CSV)

我想读一堆CSV文件。 例如,这个(movies_user.cleaned.csv)包含2个变量:uid(用户id)和movie_name。 因为SAS只读取前20行来猜测字符串的长度,所以我的数据会被截断。 (“哈利波特”经常改为“哈利波特”等等。)

我知道我可以在我的代码中使用guessingrows = 32767(32767是可以使用的最大值)让SAS检查第一个32767行,但我认为这不足以确保没有截断。 我的一些CSV比这更重要。

这是我使用的代码:

proc import datafile="H:\FBDATA_CLEANED\facebookdata2\movies_user.cleaned.csv"
 out=thesis.activities2
 dbms=csv
 replace;
 getnames=yes;

run;

你们能帮我一点吗? 谢谢!

手动运行PROC IMPORT 在日志中,您将看到它生成的DATA STEP代码。

复制该代码。

用该DATA STEP替换PROC IMPORT

编辑INFORMATFORMAT语句的大小,使字段足够大。

使用DATA STEP代码。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM