Πώς να γράψετε και να δοκιμάσετε φίλτρα Regex για το Google Analytics (με παραδείγματα)

Regular Expressions Regex Google Analytics φίλτρα

Όπως με πολλά από τα άρθρα μου εδώ, κάνω κάποια έρευνα για έναν πελάτη και μετά γράφω για αυτό εδώ. Για να είμαι ειλικρινής, υπάρχουν μερικοί λόγοι για τους οποίους… πρώτον είναι ότι έχω μια φοβερή μνήμη και συχνά ερευνά τη δική μου ιστοσελίδα για πληροφορίες. Δεύτερον είναι να βοηθήσουμε άλλους που μπορεί επίσης να αναζητούν πληροφορίες.

Τι είναι μια κανονική έκφραση (Regex);

Το Regex είναι μια μέθοδος ανάπτυξης για την αναζήτηση και τον προσδιορισμό ενός μοτίβου χαρακτήρων εντός του κειμένου για αντιστοίχιση ή αντικατάσταση του κειμένου. Όλες οι σύγχρονες γλώσσες προγραμματισμού υποστηρίζουν τακτικές εκφράσεις.

Λατρεύω τις κανονικές εκφράσεις (ρεγεξ) αλλά μπορεί να είναι λίγο απογοητευτικό ή ενοχλητικό για να μάθουν και να δοκιμάσουν. Το Google analytics έχει μερικές καταπληκτικές δυνατότητες… όπου μπορείτε να δημιουργήσετε προβολές με κανονικές εκφράσεις ή να φιλτράρετε τα δεδομένα σας σε κανονικές εκφράσεις.

Για παράδειγμα, αν ήθελα να δω μόνο την επισκεψιμότητα στις σελίδες των ετικετών μου, θα μπορούσα να φιλτράρω το / tag / στη δομή του μόνιμου συνδέσμου χρησιμοποιώντας:

/tag\/

Η σύνταξη είναι κρίσιμη εκεί. Αν μόλις χρησιμοποιούσα "ετικέτα", θα έπαιρνα όλες τις σελίδες με τον όρο ετικέτα σε αυτές. Αν χρησιμοποιούσα "/ tag", θα συμπεριλαμβανόταν οποιαδήποτε διεύθυνση URL που ξεκινά με ετικέτα, όπως / διαχείριση ετικετών επειδή το Google Analytics είναι προεπιλεγμένο να συμπεριλαμβάνει οποιονδήποτε χαρακτήρα μετά την κανονική έκφραση. Επομένως, πρέπει να διασφαλίσω ότι συμπεριλαμβάνω την ακόλουθη κάθετο ... αλλά πρέπει να έχει χαρακτήρα διαφυγής.

regex φίλτρου σελίδας

Βασικά σύνταξης Regex

Σύνταξη Περιγραφή
^ Ξεκινάει με
$ Τελειώνει με
. Ένα μπαλαντέρ για οποιονδήποτε χαρακτήρα
* Μηδέν ή περισσότερο από το προηγούμενο στοιχείο
.* Ταιριάζει με τους χαρακτήρες σε
? Μηδέν ή μία φορά του προηγούμενου στοιχείου
+ Μία ή περισσότερες φορές του προηγούμενου στοιχείου
| Ο χειριστής OR
[αλφάβητο] A ή b ή c (μπορεί να είναι οποιοσδήποτε αριθμός χαρακτήρων)
[αζ] Εύρος α έως ζ (μπορεί να είναι οποιοσδήποτε αριθμός χαρακτήρων)
[ΑΖ] Εύρος Α έως Ω (με κεφαλαία γράμματα)
[0-9] Εύρος 0 έως 9 (μπορεί να είναι οποιοσδήποτε αριθμός)
[α-ζΑ-Ζ] Εύρος από a έως Z ή A έως Z
[a-zA-Z0-9] Όλοι οι αλφαριθμητικοί χαρακτήρες
1 {} Ακριβώς 1 παρουσία (μπορεί να είναι οποιοσδήποτε αριθμός)
{1-4} Εύρος από 1 έως 4 παρουσίες (μπορεί να είναι οποιοσδήποτε αριθμός)
{1,} 1 ή περισσότερες εμφανίσεις (μπορεί να είναι οποιοσδήποτε αριθμός)
() Ομαδοποιήστε τους κανόνες σας
\ Αποδράστε από ειδικούς χαρακτήρες
\d Ψηφιακός χαρακτήρας
\D Μη ψηφία χαρακτήρας
\s Λευκός χώρος
\S Μη λευκός χώρος
\w λέξη
\W Μη λέξη (σημεία στίξης)

Παραδείγματα Regex για το Google Analytics

Ας βάλουμε μερικά παραδείγματα εκεί έξω για μερικά Προσαρμοσμένα φίλτρα. Ένας από τους συναδέλφους μου με ζήτησε βοήθεια για να προσδιορίσω μια εσωτερική σελίδα με το μονοπάτι του /δείκτης εκτός από όλες τις αναρτήσεις ιστολογίου που γράφτηκαν με το έτος στον μόνιμο σύνδεσμο:

Το προσαρμοσμένο μοτίβο φίλτρου μου για το πεδίο φίλτρου Αίτημα Url:

^/(index|[0-9]{4}\/)

Αυτό βασικά δηλώνει για αναζήτηση / ευρετηρίου Ή οποιασδήποτε τετραψήφιας αριθμητικής διαδρομής που τελειώνει με κάθετο. Δημιούργησα μια προβολή στο Analytics και το πρόσθεσα ως φίλτρο:

Φίλτρο προβολής Google Analytics

Ακολουθούν μερικά ακόμη παραδείγματα:

  • Έχετε ένα ιστολόγιο με το έτος στη διαδρομή μόνιμου συνδέσμου URL και θέλετε να φιλτράρετε τη λίστα σε οποιοδήποτε έτος. Θέλω λοιπόν 4 αριθμητικά ψηφία ακολουθούμενο από μια τελεία κάθετου. Αίτημα μοτίβου φίλτρου URl:

^/[0-9]{4}\/

  • Θέλετε να συγκρίνετε όλες τις σελίδες σας με τον τίτλο πιστοποιητικό or πιστοποίηση σε αυτό. Μοτίβο φίλτρου τίτλου σελίδας:

(.*)certificat(.*)

  • Θέλετε να συγκρίνετε δύο σελίδες προορισμού με βάση το μέσο καμπάνιας που έχουν περάσει στο Διεύθυνση URL καμπάνιας του Google Analytics ως utm_medium = άμεση αλληλογραφία or καταβληθεί αναζήτηση.

(direct\smail|paid\ssearch)

  • Θέλετε να συγκρίνετε όλα τα προϊόντα που είναι ανδρικά πουκάμισα με βάση τη διαδρομή URL. Αίτημα μοτίβου φίλτρου URl:

^/mens/shirt/(.*)

  • Θέλετε να συγκρίνετε όλες τις σελίδες με αρίθμηση τη διαδρομή URL που τελειώνει με τον αριθμό. Αίτημα μοτίβου φίλτρου URl:

^/page/[1-9]*/$

  • Θέλετε να εξαιρέσετε μια σειρά διευθύνσεων IP. Εξαίρεση μοτίβου φίλτρου διεύθυνσης IP:

123\.456\.789\.[0-9]

  • Θέλετε να συμπεριλάβετε μια σελίδα thankyou.html όπου μια υποβολή ήταν επιτυχής με βάση το querystring success = true. Αίτημα μοτίβου φίλτρου URl:

thankyou\.html\?success=true

Πώς να δοκιμάσετε τις εκφράσεις σας Regex

Αντί να δοκιμάσω και να κάνω λάθη στο Google Analytics, συχνά απλώς μεταβαίνω regex101, ένα φανταστικό εργαλείο για τη δοκιμή των τυπικών σας εκφράσεων. Καταστρέφει ακόμη και τη σύνταξή σας για εσάς και παρέχει τις λεπτομέρειες της κανονικής έκφρασής σας:

τυπικές εκφράσεις regex101

Δημιουργία, δοκιμή και εντοπισμός σφαλμάτων Regex

Ποια είναι η γνώμη σας;

Αυτός ο ιστότοπος χρησιμοποιεί το Akismet για να μειώσει το spam. Μάθετε πώς επεξεργάζονται τα δεδομένα των σχολίων σας.