Машинное обучение: PCA для различного количества функций

Я довольно новый в машинном обучении, и я строю простое приложение для распознавания разговорных цифр.
Я использовал MFCC для извлечения фильтрационных характеристик моих аудиофайлов. MFCC выводит мне матрицу 13 x length_of_audio. Я хотел бы использовать эту информацию для моего вектора объектов. Но очевидно, что каждый пример будет иметь разное количество функций.
Мой вопрос заключается в том, каковы подходы к обработке различного количества функций. Например. могу ли я использовать PCA, чтобы всегда извлекать некоторое фиксированное количество функций, а затем использовать их в определенном алгоритме обучения ?
В качестве алгоритма обучения я хотел бы использовать логистическую регрессию.


Это то, что я получил при анализе одной из произнесенных цифр.
КМПЦ

1 ответ

  1. В вашем случае, если у вас есть для пользователя length_of_audio_matrix = N, у вас нет вектора объектов 13*N, у вас есть N векторов объектов длины 13 (они составляют последовательность, но они разные векторы объектов).

    Необходимо составить матрицу из 13 объектов:

    MFCCUser1,Slot1
    MFCCUser1,Slot2
    ....
    MFCCUser1,SlotN
    MFCCUser2,Slot1
    MFCCUser2,Slot2
    ...
    

    Затем можно применить анализ основных компонентов.

    У вас есть только 13 функций, вам действительно нужно уменьшить их?