[英]How does a Hadoop or Spark connector for distributed data stores function?
Spark具有用于各种数据库和数据存储的连接器。
但是,为您自己的自定义分布式数据库创建连接器将需要什么。 据我了解,Spark使用Hadoop连接器从分布式数据存储中获取数据。 我找不到很好的资源来了解Hadoop连接器如何工作以及如何制作。
我希望了解Hadoop连接器的语义,以便能够为我的自定义数据库创建一个。
您必须使用Java和Hadoop API来实现Record Reader
然后Spark就能使用它
我的建议是从阅读汤姆·怀特的书开始
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.