繁体   English   中英

使用 Python 反序列化 Java org.apache.kafka.common.serialization 序列化对象

[英]Deserializing Java org.apache.kafka.common.serialization serialized objects with Python

我有一个 Java Kafka 生产者,它使用org.apache.kafka.common.serialization.LongSerializer作为关键序列化程序,我正在尝试使用 Python Kafka 消费者来消费来自主题的消息。

我认为由于LongSerializerorg.apache.kafka一部分,因此所有其他语言的官方 Kafka 客户端都可以使用等效的序列化器和反序列化器,以促进互操作性。 但是,我找不到它。

那么,人们是否应该仅将org.apache.kafka.common.serialization用于纯 JVM 的项目,还是有其他方法可以使用 Python 反序列化这些对象?

我觉得我错过了一些东西,因为我发现很难相信 Kafka 提供了开箱即用的序列化器和反序列化器,它们不会促进用不同语言编写的进程之间的通信......

如果有人在被问到一年后仍然需要答案,您可以在 Python 中重新实现 Java 的 LongSerializer:

    def long_deserializer(data: bytes):
      if not data:
        return None
      if len(data) != 8:
        raise Exception(f"Size of data received by long_deserializer is not 8. Received {len(data)}")

      # 0xF...FFFFFFFF is always -1
      if data == b'\xff\xff\xff\xff\xff\xff\xff\xff':
        return -1

      value = 0
      for b in data:
        value <<= 8
        value |= b & 0xFF

      return value

示例用法如下:

  • 输入:

b'\\x00\\x00\\x00\\x00\\x00\\x00\\x04\\xd2

  • 解码部分:

x04\\xd2

  • 解码为二进制:

0x04=100, d=1010 , 2=0010

  • 结果:

10010100010

  • 转换为 int(返回值):

10010100010 = 1234

此外,如果您想要更“pythonic”的方式,您可以使用内置函数:

int('0x' + data.hex().lstrip('0'), 0)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM