Сходство предложений-как вычислить глубину субсчета с помощью WordNet?

Я пытаюсь построить инструмент для вычисления сходства между 2 словами, и я обнаружил, что есть формула, пришедшая из Манчестерского столичного университета, как показано ниже:

Формула сходства слов из Manchester research group

До сих пор я не понимаю, как получить h, который является глубиной субсумера в иерархических семантических сетях.
Как я понимаю, h-длина пути от верхнего слова к определенному слову, как ссылка от автора, верхнее слово «сущность» для существительного.
Но как насчет другого вида слова, такого как ADJ, ADV, глагол…?
И если у нас уже есть верхнее слово, как мы можем перечислить путь от него к слову, которое нам нужно вычислить

Документ находится по следующей ссылке: https://www.researchgate.net/profile/Keeley_Crockett/publication/232645326_Sentence_Similarity_Based_on_Semantic_Nets_and_Corpus_Statistics/links/0deec51b8db68f19fa000000.pdf

Очень ценю за любой ответ.
Спасибо

2 ответа

  1. Я хотел бы добавить больше деталей, которые я только что нашел.
    Эти детали достаточно для моего поиска, но не может точно с вопросом выше, но я думаю, что мне нужно поделиться с кем-то нужно в будущем.

    1. «Сущность» — это не только корень существительного, но и корень любого слова, даже глагола, ADJ, ADV….

      • Ex полный путь для слова ‘kiss’: корень #n#1 < сущность#n#1 < абстракция#n#6 < психологическая реальность#n#1 < событие#n#1 < действие#n#2 < сенсорный#n#5
      • EX полный путь для слова «удар»: корень #n#1 < сущность#n#1 < абстракция#n#6 < психологическая реальность#n#1 < событие#n#1 < действие#n#2 < speech_act#n#1 < возражение#n#2
    2. Чтобы вычислить глубину любого слова, нужно вычислить от начала слово (‘entity’) и базироваться на слове Net hierarchical database.

    Вернитесь к приведенному выше примеру, h (длина подсуммера ‘kiss’ и ‘kick’) составляет 6, который подсчитывается от корня верхнего дерева до слова ‘act’

  2. Каждый раз, когда я пытался понять иерархию Wordnet, я находил что-то, что делает недействительным все, что я ранее предполагал 🙂
    Что касается сходства, если вы используете Python и NLTK, я бы рекомендовал вам использовать предоставленные метрики сходства, если нет, они могут быть хорошим началом, чтобы понять, как все работает.

    В этой ссылке прокрутите вниз до сходства:
    http://www.nltk.org/howto/wordnet.html