Добавление определенного текста в каскадный поток Hadoop

В каскадном потоке Hadoop у меня есть несколько кортежей, которые обрабатываются, и, наконец, я погрузился в пункт назначения.

Теперь мое требование: потопить кортежи в файле назначения с определенными постоянными строковыми значениями в начале и в конце.

Например: у меня есть следующие входные кортежи

10|11|12|13|14|15|16|17|18|19|20
20|21|22|23|24|25|26|27|28|29|30
1|2|3|4|5|6|7|8|9|10

Теперь мне нужно иметь как этот выход:

Certain data before those data
10|11|12|13|14|15|16|17|18|19|20
20|21|22|23|24|25|26|27|28|29|30
1|2|3|4|5|6|7|8|9|10
Certain data after those data

Немного я искал репозитория class DelimitedParser и его методы, такие как joinLine , joinFirstLine, но из-за плохой документации я не могу получить точную точку его.

1 ответ

  1. Это может зависеть от того, что означает «определенные данные до этих данных»?
    Если вы используете TextDelimited, то вы можете сбросить значения заголовка в приемник. По умолчанию значения заголовка не записываются в соответствии с документацией, поэтому вам нужно будет включить его. Также следует помнить, что значения заголовков представляют выходные поля.

    — Amit