Pcre UDF
Pcre UDF на данный момент является алиасом к HyperScan UDF.
Если вы завязываетесь на какие-либо особенности конкретного движка, реализующего регулярные выражения, то лучше использовать UDF с определённой библиотекой внутри, а Pcre UDF рассматривать как текущий наиболее рекомендуемый вариант для простых проверок на соответствие, который может в будущем поменяться.
На данный момент доступны:
- HyperScan UDF (Intel).
- Re2 UDF (Google).
- Pire UDF (Яндекс).
HyperScan и Pire оптимизированы в первую очередь на Grep и Match. HyperScan внутри имеет несколько реализаций c использованием разных наборов процессорных инструкций, среди которых автоматически выбирается нужная в соответствии с текущим процессором. Pire также известна своей отличной производительностью и, если вам это важно, стоит померить на своих данных и регулярных выражениях и её, но с 2011–2013 года эта библиотека практически не развивается и, как намекает название («i» расшифровывается как incompatible), возможно потребуется адаптировать сами выражения.
Основной плюс библиотеки Re2 — развитый функционал по Capture и Replace, если вам нужны эти функции, то рекомендуется пользоваться именно ей.
В HyperScan UDF также доступны отдельные функции с backtracking (возможность сослаться на предыдущую найденную часть строки), которые реализованы через гибридное использование двух библиотек HyperScan и libpcre.