Найти китайский текст в HTML с помощью preg_match

Я пытаюсь получить текстовую строку из строки HTML.
Я хотел бы захватить только текст между тегами и пропустить пустые теги.

Моя попытка текущая попытка может быть найдена здесь:
https://regex101.com/r/3Ujmw6/2

  • Я не могу использовать w, так как мне нужно захватить китайские иероглифы
  • Я хотел бы только текст и не много пустых результатов

Я пробовал:

/>(X+?)</g

//I will fail on nested tags, it capture the first nested tag
<p><strong>blablab</strong></p>

И это:

/>(X*?)</g

//Finds me all the string, but also includes loads of empty strings
//for adjacent tags ><

Есть ли способ исключить Или есть лучший способ написать это так, чтобы он возвращал только текстовые части?

1 ответ