Регулярное выражение — удобный инструмент поиска, который упрощает работу с Google Analytics и помогает настраивать события в Google Tag Manager. С помощью регулярного выражения можно объяснить сервису, что вы хотите найти сразу две кампании или искать по всем словам, даже если они написаны с ошибкой. Как это сделать — на примерах рассказывает Михаил Быков, веб-аналитик агентства комплексного интернет-маркетинга Adindex.
Что означают символы в регулярных выражениях и как их использовать
Вертикальная линия |
Означает «или». Символ можно использовать, например, когда нужно искать сразу по двум рекламным кампаниям. Допустим, они называются Share promo и Apparel. Чтобы найти информацию в Share или Apparel, нужно написать:
Share promo|Apparel
Точка .
Означает один любой символ. Если вам нужно найти слова «тлен», «клен», «плен», пишите так:
.лен
Звездочка *
Означает повторение предыдущего символа ноль или больше раз. Например, если вам нужно найти gogle, google, gooogle, goooogle, пишите так:
goo*gle
Чаще всего звездочку используют в паре с точкой или в составе других регулярных выражений.
Знак плюс +
Похож на звездочку, но соответствует одному или более предыдущим символам. Если вам нужно найти gggoogle, ggoogle, google, пишите так:
g+oogle
Точка звездочка .*
Выражение соответствует нулю или большему количеству случайных символов. Если проще — любой комбинации символов или отсутствию символов. Регулярное выражение можно использовать в Google Analytics, например, чтобы настроить сегменты пользователей с User ID.
Каретка ^
Помогает найти текст, который начинается с определенной фразы или слова. Например, у вас запущено несколько рекламных кампаний с похожими названиями: Fantastic campaign end, Our Fantastic campaign, The best Fantastic campaign, Test Fantastic campaign. И нужно найти именно Fantastic campaign end. В таком случае пишем:
^Fantastic campaign
Символ доллар $
Работает наоборот и помогает найти название, которое заканчивается на определенный символ или слово. Рассмотрим тот же пример с кампаниями Fantastic campaign end, Our Fantastic campaign, The best Fantastic campaign, Test Fantastic campaign. Чтобы найти первую, нужно написать:
campaign end$
Вопросительный знак ?
Означает, что символ перед ним не обязательный. Например, вам нужно найти все кампании, связанные с фирмой Kerrigan и ее брендом rainnor. Но вы не уверены, что названия правильно пишутся с двумя rr и двумя nn. В этом случае ищите так:
Kerr?igan|rainn?or
Скобки ()
Круглые скобки отделяют одну часть выражения от другой. Допустим, у вас есть три разных страницы — мужская, женская и детская обувь, и вы хотите получить данные о них одним запросом.
Адреса страниц выглядят так:
- /products/men/shoes/
- /products/women/shoes/
- /products/kids/shoes/
Нужно найти страницы, которые начинаются с /products, заканчиваются на shoes/, а между этими словами содержат men или women или kids. Для решения задачи используйте регулярно выражение:
^/products/(men|women|kids)/shoes/$
Квадратные скобки []
Квадратные скобки помогают создать список. Например, у вас есть три слова baker341, baker342, baker343. Чтобы найти их все за раз, напишите:
baker34[123]
Аналогично можно искать слова на кириллице. Чтобы найти сон, тон и фон, пишем [стф]он.
Дефис —
Помогает создать продвинутый список, его лучше использовать вместе с квадратными скобками:
- [a-z] соответствует всем строчным буквам;
- [A-Z] соответствует всем заглавным буквам;
- [0-9] соответствует всем числам;
- [a-zA-Z0-9] соответствует всем буквам и цифрам.
Допустим, вам нужно вывести все ourCampaign, в названии которых есть даты с 2013 по 2019 год. Пишем так:
ourCampaign201[3-9]
Фигурные скобки { }
Указывают, сколько раз нужно повторить предыдущий символ или выражение.
- {1,2} — нужно повторить последний «пункт» не менее 1 раза и не более 2 раз.
- {2} — нужно повторить последний «пункт» 2 раза.
Например, нужно выбрать список IP адресов определенного диапазона с 77.120.120.0 по 77.120.120.99. Если вводить их вручную, придется писать 100 разных адресов. С помощью регулярного выражения можно обойтись одной строкой: \
^77\.120\.120\.[0-9]{1,2}$
Обратная косая черта \
Существует много символов регулярных выражений, которые встречаются и в простом тексте — точка, знак вопроса, дефис и другие. С помощью обратной косой черты можно указать, что эти символы часть текста, а не регулярного выражения.
Допустим, нужно отфильтровать все строки запроса в Google Analytics, которые начинаются с / search /? s = (URL поиска на сайте). Регулярное выражение будет выглядеть так:
search \ / \? s =
- Расширите свои знания в Google Analytics, Яндекс.Метрике, Google Tag Manager, Google Data Studio и Excel
- Научитесь настраивать счётчики и цели, собирать данные и определять эффективность бизнеса
- Узнаете, как оптимизировать трафик и находить точки роста для компании
Регулярные выражения для решения задач сложнее
Рассмотрим, как использовать регулярные выражения при создании фильтров в Google Analytics.
Поиск страниц в определенном каталоге
Допустим, вам нужно просмотреть на сайте категорию /movies/, но только в третьем подкаталоге. В этом случае пишем такое выражение:
^/.*/.*/movies/.*
Расшифровать можно так: мы задаем путь к странице, которая начинается ^ с /, затем следуют любые символы . *, потом снова / и любые символы . *, а в конце — /movies.
Исключение трафика по IP-диапазону
Допустим, у компании есть определенный диапазон IP-адресов и при анализе трафика на сайте нужно исключить тот трафик, который генерируют сотрудники компании. Для этого используем фильтр:
Важно. Фильтры, которые изменяют способ сбора данных, в том числе фильтр исключения IP-адресов, нельзя отменить. Если вы ошибочно исключите IP-адреса, то потеряете данные Google Analytics и не сможете вернуть их даже после удаления фильтра.
Это не касается фильтров поиска в отчетах: после их применения данные не пропадут, их можно посмотреть снова.
Создание пользовательских отчетов
Допустим, вам нужно отфильтровать пользователей, которые посетили страницы movies или musik с планшетов table или смартфонов mobile. Решить задачу поможет следующее регулярное выражение:
Резюмируем
- Регулярные выражения — это шаблоны поиска, с помощью которых удобно объяснять программе, что именно вы хотите найти.
- Регулярные выражения могут состоять из одного-двух или комбинации символов, в зависимости от того, что они описывают.
- Их можно использовать в Google Analytics и Google Tag Manager, чтобы настраивать фильтры, цели, сегменты, аудитории, группы контента.
Читать также