Создание функции прогнозирования в регрессии Пуассона

У меня есть набор данных, в котором я должен выполнить пуассоновский регрессионный анализ того, как количество посещений врача в двухнедельный период варьируется в зависимости от возрастной группы (т. е.<30, между 30 и 50 и >50), пола и болезни. Удержание пола и количества заболеваний постоянными при их средних значениях.

Вот пример моих данных:

 visits gender age illness
     1 female  19       1
     1 female  19       1
     1   male  19       3
     1   male  19       1
     1   male  19       2
     1 female  19       5
     1 female  19       4
     1 female  19       3
     1 female  19       2
     1   male  19       1

Однако, я не знаю, как это сделать, так как я не знаю, как правильно ввести эти группы. Так же мне необходимо выяснить прогнозируемые показатели визитов к врачу за двухнедельный период для разных возрастных групп.

Я знаю, как ввести начальное уравнение:
glm (посещения ~ возраст + пол + болезнь, данные=DoctorVisits, семья=Пуассон)

Но я не знаю, как я буду создавать функцию прогнозирования.

1 ответ

  1. Скажем, вы хотите предсказать для мужчины 21 год и болезнь = 3

    predict(your_glm, 
    newdata = data.frame(gender = "male", age = 21, illness = 3),
    type = "response")
    

    Здесь вы в основном создаете фрейм данных с obseravations, для которых вы хотите прогнозы внутри функции. Если у вас есть несколько наблюдений, для которых вы хотите получить прогноз, то может быть более разумно сначала создать фрейм данных отдельно, а затем передать его для предсказания функции, просто переключитесь "newdata="на "data=".

    type = "response" даст вам прогноз в том же формате, что и в glm, иначе это будет log ods.