Как рассчитать эту статистику?

Я пишу приложение, чтобы помочь облегчить некоторые исследования, и часть этого включает в себя некоторые статистические расчеты. Сейчас исследователи используют программу SPSS . Часть выходных данных, о которых они заботятся, выглядит так:

[Часть вывода SPSS

На самом деле их волнуют только FSig.ценности. Моя проблема в том, что у меня нет опыта в статистике, и я не могу понять, как называются тесты, или как их вычислить.

Я думалF, что значение может быть результатом F-теста, но после выполнения шагов, приведенных в Википедии, я получил результат, который отличался от того, что SPSSдает.

6 ответов

  1. Этот сайт может помочь вам немного больше. И этот тоже .

    Я работаю с довольно ржавой памяти курса статистики, но здесь ничего не идет:

    Когда вы делаете дисперсионный анализ (ANOVA), вы фактически вычисляете статистику F как отношение от среднеквадратических дисперсий «между группами» и среднеквадратических дисперсий «внутри групп». Вторая ссылка выше кажется довольно хорошей для этого расчета.

    Это позволяет статистике F точно измерить мощность модели, потому что дисперсия » между группами «является объяснительной силой, а дисперсия» внутри групп » — случайной ошибкой. High F подразумевает весьма значимую модель.

    Как и во многих статистических операциях, вы определяете Sig. использование статистики F. Вот где ваша информация Википедии немного пригодится. Что вы хотите сделать, так это — используя степени свободы, данные вам SPSS-найти правильное значение P, при котором таблица F даст вам статистику F, которую вы вычисляли. Значение P, где это происходит [F(table) = F(calculated)], является значением.

    Концептуально, более низкое значение значимости показывает очень сильную способность отвергнуть нулевую гипотезу (которая для этих целей означает, что ваша модель имеет объяснительную силу).

    Извините любой математике людей, если что-то из этого неправильно. Я буду проверять, чтобы сделать правки!

    Удачи вам. Статистика-это весело, просто, возможно, не эта часть. =)

  2. Статистика жесткая : -). После года чтения и перечитывания книг и бумаг могу только с уверенностью сказать, что понимаю самые основы этого.

    Вы можете изучить готовые библиотеки для любого языка программирования, который вы используете, потому что они являются многими gotcha’s в математике в целом и статистике в частности (ошибки округления являются очевидным примером).

    В качестве примера вы можете взглянуть на проект R , который является одновременно интерактивной средой и библиотекой, которую можно использовать из кода C++, распространяемого под GPL (т. е. если вы используете его только внутри и публикуете только результаты, вам не нужно открывать код).

  3. Короче говоря: не делайте этого вручную, связывайте/используйте существующее программное обеспечение. И ответ sain_grocen неверен.

    Все это тесты на значимость оценок параметров, которые обычно используются в многомерных ответных множественных регрессиях. Это было бы непросто сделать вне среды статистического программирования. Я бы предложил либо получить результат от уже существующей статистической программы, либо использовать ту, которую вы можете связать и использовать этот код.

    Я боюсь, что первый ответ (sain_grocen) приведет вас по неправильному пути. Его объяснение, скорее всего, является частным случаем того, с чем вы на самом деле имеете дело. Anova объяснил в своих ссылках для одного вариативного ответа, в сбалансированном дизайне. Это не статистика F, которую вы видите. Имена в выходных данных (Pillai, Hotelling,…) некоторые из доступных многомерных версий. Они имеют F распределений при определенных предположениях. Я не могу объяснить текст книги стоит материала здесь, я бы посоветовал вам начать с просмотра»Прикладной многомерный статистический анализ» Джонсона и Вихерна

  4. Можете ли вы объяснить больше, почему SPSS сам по себе не является прекрасным решением проблемы? Это то, что он генерирует сводные таблицы в качестве выходных данных, которые трудно манипулировать? Это стоимость программы?

    F-статистика может возникнуть из любого числа конкретных тестов. F — это просто распределение (слабо: описание «частот» групп значений), подобное нормальному (Гауссовскому) или равномерному. Как правило, они возникают из соотношения дисперсий. Мнение: многие статистики (в том числе и я) считают тесты на основе F нестабильными (жаргон: ненадежными ).

    Конкретная статистика выходных данных (трассировка Pillai и др.) предположим, что первоначальный анализ является примером MANOVA, который, как и другие плакаты, является сложной и трудной для получения правильной процедуры.

    Я предполагаю также, что, основываясь на MANOVA и использовании SPSS, это психологический или социологический проект… если нет, пожалуйста, просветите. Возможно, что другие, более простые модели на самом деле легче понять и более воспроизводимы. Обратитесь в местную университетскую статистическую Консалтинговую группу, если она у вас есть.

    Удачи!

  5. Исходя из вашего вопроса, я предполагаю, что ваши коллеги-исследователи хотят автоматизировать процесс, с помощью которого выполняются определенные статистические анализы (т. е. они хотят пакетной обработки наборов данных). У вас есть два варианта:

    1) SPSS теперь доступен через python (начиная с версии 15) — перейти к spss.com и искать python. Вы можете писать скрипты python для автоматизации анализа данных и извлечения ключевых значений из сводных таблиц, а затем обрабатывать ответы любым удобным вам способом. Это имеет то преимущество, что позволяет точно сравнить результаты от вашего скрипта python и рассчитанных вручную усилий в SPSS ваших сотрудников. Таким образом, вам не придется действительно знать статистику, чтобы сделать эту работу (что является ключевым преимуществом)

    2) Вы можете сделать это в R, свободной среде статистики, которая, вероятно, может быть написана по сценарию. Это имеет недостаток, что вам придется изучить статистику, чтобы убедиться, что вы делаете это правильно.

  6. Вот объяснение MANOVA ouptput, с очень хорошего сайта по статистике и на SPSS:

    Выход с объяснением:
    http://faculty.chass.ncsu.edu/garson/PA765/manospss.htm

    Как и зачем делать MANOVA или многомерное GLM:
    (тот же путь как выше, но заканчивающийся в ‘/manova.htm’)

    Написание программного обеспечения с нуля для расчета этих результатов будет длительным и трудным;
    есть много численных задач и матричных инверсий.

    Как сказал Генри, используйте скрипты Python или R. Я бы предложил работать с кем-то, кто знает SPSS if scripting.
    Кроме того, SPSS сама способна экспортировать выходные таблицы в файлы с помощью чего-то под названием OMS.
    Сценарий в SPSS может сделать это.

    Узнайте, кто в вашей исследовательской группе знает SPSS и работайте с ними.