преобразование строки в числовую операцию PySpark в файле json

Я изучаю PySpark, и я столкнулся с проблемой преобразования столбца «string» в числовой. Я искал вокруг, но не смог найти решение. Пожалуйста помочь.

Я смог выполнить следующие 2 команды:

people=sqlContext.читать.json(«C:wdchentxtPeople2.формат JSON»)
люди.выберите (‘name’, people.возраст+1).показывать()

но я получил ошибку для следующего, потому что «возраст» «не числовой столбец».
Как свести столбец age из string к numerical?

люди.groupBy («пол»).sum (‘age’).показывать()

Особенно меня смущали люди.возраст + 1 был успешным. Спасибо!

2 ответа