Я получаю kafka в потоке искры и обрабатываю свои данные для создания фрейма данных, который выглядит следующим образом:
+---+-------------------------+--------------------------------------------------------------------------------------------------------------------------------------------------------------+
|id |sen |attributes |
+---+-------------------------+--------------------------------------------------------------------------------------------------------------------------------------------------------------+
|1 |Stanford is good college.|[[Stanford,ORGANIZATION,NNP], [is,O,VBZ], [good,O,JJ], [college,O,NN], [.,O,.], [Stanford,ORGANIZATION,NNP], [is,O,VBZ], [good,O,JJ], [college,O,NN], [.,O,.]]|
+---+-------------------------+--------------------------------------------------------------------------------------------------------------------------------------------------------------+
У меня есть таблица hbase "kafkaStreaming" с идентификатором столбца и атрибутом. Я хочу, чтобы эти данные были сохранены в hbase с «ID» в качестве ключа строки и атрибутов, например [[Stanford, ORGANIZATION, NNP], [is, O, VBZ], [good, O, JJ]] в att.
Я хочу динамически добавлять семейства столбцов всякий раз, когда приходят эти данные. Пожалуйста помоги.