Parle поддерживает сопоставление регулярных выражений аналогично flex. Также поддерживаются следующие наборы символов POSIX: [:alnum:]
, [:alpha:]
, [:blank:]
, [:cntrl:]
, [:digit:]
, [:graph:]
, [:lower:]
, [:print:]
, [:punct:]
, [:space:]
, [:upper:]
и [:xdigit:]
.
Классы символов Unicode в настоящее время не включены по умолчанию, передайте --enable-parle-utf32, чтобы сделать их доступными.
Конкретная кодировка может быть отображена с помощью правильно построенного регулярного выражения.
Например, чтобы соответствовать символу евро, закодированному в UTF-8, можно использовать регулярное выражение [\xe2][\x82][\xac]
.
Шаблон для строки в кодировке UTF-8 может быть [ -\x7f]{+}[\x80-\xbf]{+}[\xc2-\xdf]{+}[\xe0-\xef]{+}[\xf0-\xff]+
.