繁体   English   中英

谷歌云 DLP-CSV 检查

[英]Google Cloud DLP - CSV inspection

我正在尝试检查一个 CSV 文件,但没有返回任何结果(我使用的是 EMAIL_ADDRESS 信息类型,我使用的地址在这里出现了积极的结果: https://cloud.google.com/ dlp/演示/#!/ )。 我将 CSV 文件发送到带有inspect_contentbyte_item中,如下所示:

byte_item: {
  type: :CSV,
  data: File.open('/xxxxx/dlptest.csv', 'r').read
}

在查看受支持的文件类型时,看起来 CSV/TSV 文件是通过结构化解析检查的。

  • 对于 CSV/TSV,这是否意味着不能只在文件中发送,并且需要根据https://cloud.google.com/dlp/docs/inspecting-structured-text使用table属性而不是byte_item

  • 例如 XSLX 文件呢? 它们是未指定的文件类型,所以我尝试使用这样的配置,但它仍然没有返回任何结果:

byte_item: {
  type: :BYTES_TYPE_UNSPECIFIED,
  data: File.open('/xxxxx/dlptest.xlsx', 'rb').read
}

我能够很好地检查和编辑图像和文本,但对其他文件类型有点问题。 欢迎任何想法/建议! 谢谢!

编辑:有问题的 CSV 的内容:

$ cat ~/Downloads/dlptest.csv 
dylans@gmail.com,anotehu,steve@example.com
blah blah,anoteuh,
aonteuh,

$ file ~/Downloads/dlptest.csv 
~/Downloads/dlptest.csv: ASCII text, with CRLF line terminators

完整要求:

parent = "projects/xxxxxxxx/global"
inspect_config = {
  info_types: [{name: "EMAIL_ADDRESS"}],
  min_likelihood: :POSSIBLE,
  limits: { max_findings_per_request: 0 },
  include_quote: true
}
request = {
  parent: parent,
  inspect_config: inspect_config,
  item: {
    byte_item: {
      type: :CSV,
      data: File.open('/xxxxx/dlptest.csv', 'r').read
    }
  }
}
dlp = Google::Cloud::Dlp.dlp_service
response = dlp.inspect_content(request)

我正在测试的 CSV 文件是我使用 Google 表格创建并导出为 CSV 的文件,但是,该文件在本地显示为“text/plain;charset=us-ascii”。 我从 inte.net 下载了一个 CSV,它有一个 mime 的“text/csv; charset=utf-8”。 这是行之有效的方法。 所以看起来我的问题特别是由于文件是不正确的 mime 类型。

尚不支持 xlsx。 快来了。 (也许这部分问题应该从 CSV 调试问题中分离出来。)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM