1
2
根据我使用Flink Cassandra连接器编写数据Cassandra的经验,我认为最好的方法是使用Flink内置连接器。自从弗林克
|
2
2
我使用java连接到Flink中的HBase。只需在中创建HBase连接对象
我想你也可以在Scala做类似的事情。 |
3
1
我想这取决于你所说的“推荐”是什么意思。 自己动手做鳗鱼如果您只想从Scala应用程序访问HBase上的数据,您可能需要看一下 Eel ,其中包括可与存储系统中的多种存储格式和系统进行交互的库 大数据 风景画,是用Scala书写的。
您很可能对使用
风筝另一种选择可能是 Kite ,它也有 a quite extensive set of examples 你可以从中获得灵感(包括HBase),但它看起来不像Eel那么活跃。 大数据 框架如果你想要一个框架来帮助你,而不是用库来酝酿你自己的解决方案。当然,你必须考虑一些学习曲线。 火花Spark是一个相当成熟的项目,HBase项目本身为Spark 2.1.1构建了一个连接器( Scaladocs 这里)。 Here 这是一个可以帮助你的介绍性演讲。 总体思路是,您可以按照中的建议使用此自定义数据源 this example :
允许您通过Spark SQL API访问HBase数据。这里是一个简短的摘录 from the same example :
撇开性能考虑不谈,正如您可能看到的那样,这种语言对于数据操作来说非常自然。 弗林克弗林克已经回答了两个问题,所以我不会再补充更多,除了 a link to an example 从撰写本文时的最新稳定版本(1.4.2)开始,您可能有兴趣查看。 |
Bala · 在HBase中获取特定版本的行 6 年前 |
Surabhi Mundra · 如何在HBase中更改表的命名空间 6 年前 |
user8846809 · 无法删除HDFS损坏的文件 7 年前 |