使用 python cassandra 驱动程序选择和解码 blob

Question

我正在尝试查询属于 Jaeger 架构一部分的跟踪 Cassandra 表。 如您所见， refs 字段是一个列表：

cqlsh:jaeger_v1_dc1> describe traces

CREATE TABLE jaeger_v1_dc1.traces (
    trace_id blob,
    span_id bigint,
    span_hash bigint,
    duration bigint,
    flags int,
    logs list<frozen<log>>,
    operation_name text,
    parent_id bigint,
    process frozen<process>,
    refs list<frozen<span_ref>>,
    start_time bigint,
    tags list<frozen<keyvalue>>,
    PRIMARY KEY (trace_id, span_id, span_hash)
)

来自python代码：

traces = session.execute('SELECT span_id,refs from traces')

for t in traces:
    if t.refs is not None:
        parentTrace=t['refs'][0].trace_id

我的第一个问题是否可以直接选择父跟踪而不遍历结果？ 有没有办法可以获取列表中的第一个元素，然后从 select 语句中获取元素？
从使用 cqlsh 的终端，我得到这个结果： trace_id: 0x00000000000000003917678c73006f57 。 但是，从 python cassandra 客户端我得到了这个trace_id=b'\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x009\\x17g\\x8cs\\x00oW'知道它发生了什么转变吗？ 由于我想再次用于查询表，因此如何对其进行解码。

Answer 1

据我所知，没有简单的方法，因为不能保证跨度以特定顺序存储。 但值得注意的是，如果parentTrace是指跟踪的根跨度（第一个跨度），那么您可以搜索refs为null跨度，因为根跨度没有父跨度。 另查明根跨度方式是，如果trace_id == span_id 。
trace_id存储为二进制 blob。 您从 cassandra 客户端看到的是一个 16 字节的数组，每个八位字节元素表示为两个十六进制值。 要将其转换为您在 cqlsh 中看到的十六进制字符串，您需要将整个数组转换为单个十六进制字符串。 请参阅以下执行此操作的 python 示例：

from cassandra.cluster import Cluster

cluster = Cluster(['127.0.0.1'])
session = cluster.connect()
rows = session.execute("select * from jaeger_v1_test.traces")
trace = rows[0]
hexstr = ''.join('{:02x}'.format(x) for x in trace.trace_id)
print("hex=%s, byte_arr=%s, len(byte_arr)=%d" % (hexstr, trace.trace_id, len(trace.trace_id)))
cluster.shutdown()

使用 python cassandra 驱动程序选择和解码 blob

问题描述

1 个解决方案

解决方案1
2 已采纳 2020-11-08 23:00:09

使用 python cassandra 驱动程序选择和解码 blob

问题描述

1 个解决方案

解决方案1 2 已采纳 2020-11-08 23:00:09

解决方案1
2 已采纳 2020-11-08 23:00:09