[英]Google Cloud DLP - CSV inspection
我正在尝试检查一个 CSV 文件,但没有返回任何结果(我使用的是 EMAIL_ADDRESS 信息类型,我使用的地址在这里出现了积极的结果: https://cloud.google.com/ dlp/演示/#!/ )。 我将 CSV 文件发送到带有inspect_content
的byte_item
中,如下所示:
byte_item: {
type: :CSV,
data: File.open('/xxxxx/dlptest.csv', 'r').read
}
在查看受支持的文件类型时,看起来 CSV/TSV 文件是通过结构化解析检查的。
对于 CSV/TSV,这是否意味着不能只在文件中发送,并且需要根据https://cloud.google.com/dlp/docs/inspecting-structured-text使用table
属性而不是byte_item
?
例如 XSLX 文件呢? 它们是未指定的文件类型,所以我尝试使用这样的配置,但它仍然没有返回任何结果:
byte_item: {
type: :BYTES_TYPE_UNSPECIFIED,
data: File.open('/xxxxx/dlptest.xlsx', 'rb').read
}
我能够很好地检查和编辑图像和文本,但对其他文件类型有点问题。 欢迎任何想法/建议! 谢谢!
编辑:有问题的 CSV 的内容:
$ cat ~/Downloads/dlptest.csv
dylans@gmail.com,anotehu,steve@example.com
blah blah,anoteuh,
aonteuh,
$ file ~/Downloads/dlptest.csv
~/Downloads/dlptest.csv: ASCII text, with CRLF line terminators
完整要求:
parent = "projects/xxxxxxxx/global"
inspect_config = {
info_types: [{name: "EMAIL_ADDRESS"}],
min_likelihood: :POSSIBLE,
limits: { max_findings_per_request: 0 },
include_quote: true
}
request = {
parent: parent,
inspect_config: inspect_config,
item: {
byte_item: {
type: :CSV,
data: File.open('/xxxxx/dlptest.csv', 'r').read
}
}
}
dlp = Google::Cloud::Dlp.dlp_service
response = dlp.inspect_content(request)
我正在测试的 CSV 文件是我使用 Google 表格创建并导出为 CSV 的文件,但是,该文件在本地显示为“text/plain;charset=us-ascii”。 我从 inte.net 下载了一个 CSV,它有一个 mime 的“text/csv; charset=utf-8”。 这是行之有效的方法。 所以看起来我的问题特别是由于文件是不正确的 mime 类型。
尚不支持 xlsx。 快来了。 (也许这部分问题应该从 CSV 调试问题中分离出来。)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.