pyspark: объект типа ‘ Row ‘не имеет атрибута ‘fromSeq’

У меня есть следующий код:

from pyspark.sql import Row
z1=["001",1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,30,41,42,43]
print z1
r1 = Row.fromSeq(z1)
print (r1)

Затем я получил ошибку:

AttributeError                            Traceback (most recent call last)
<ipython-input-6-fa5cf7d26ed0> in <module>()
      2 z1=["001",1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,30,41,42,43]
      3 print z1
----> 4 r1 = Row.fromSeq(z1)
      5 
      6 print (r1)

AttributeError: type object 'Row' has no attribute 'fromSeq'

Кто-нибудь знает, что я пропустил? Спасибо!

1 ответ

  1. Если вы не предоставляете имена, просто используйте tuple:

    tuple(z1)
    

    Это все, что необходимо для построения правильного фрейма данных