Βασανιστήρια νερού - Μια αναλογία του Analytics προχωράει πολύ

ανάλυση στάγδην

Τα δεδομένα, όπως το νερό, διατίθενται σε πολλές μορφές. Το ανθρώπινο μυαλό έχει εξελιχθεί για να φιλτράρει τα περισσότερα από τα δεδομένα που έρχονται με τον τρόπο μας, επειδή υπάρχουν απλά πολλά από αυτά.

Όταν ανοίγετε τα μάτια και τα αυτιά σας, τα δεδομένα είναι παντού. Το χρώμα του τοίχου, ο ήχος του κλιματισμού και η μυρωδιά του καφέ του γείτονά σας αντιμετωπίζονται σαν υγρασία. Το νερό είναι στον αέρα όλη την ώρα, αλλά δεν είναι χρήσιμο να προσέχετε πολύ.

Όταν το νερό συμπυκνώνεται σε ομίχλη, σας αναγκάζει να το δείτε και καθιστά ακόμη πιο δύσκολη την κατανόηση του κόσμου γύρω σας. Τα ελλιπή σύνολα δεδομένων, τα κατεστραμμένα δεδομένα, η κακή επιστήμη, τα λανθασμένα συμπεράσματα και οι γνωστικές προκαταλήψεις σας κάνουν να χάσετε το δρόμο σας στην ομίχλη.

Τα δεδομένα πέφτουν σαν βροχή. Όταν υπάρχει λίγο, είναι άγρια ​​μη ικανοποιητικό - αρκεί να κάνει το αυτοκίνητό σας βρώμικο και να συγχέει τη συνομιλία. Βρίσκεστε στον εαυτό σας να σκουπίζετε το σημείο στα γυαλιά σας καθώς κάποιος εκτοξεύει κάποιο τυχαίο σημείο δεδομένων, που συλλέγεται από κάποια σκοτεινή πηγή.

  • Παλιό νερό σε μια ρηχή λίμνη είναι επικίνδυνη. Τα δεδομένα, που συλλέγονται από μια αναξιόπιστη παροχή, ούτε καθαρίζονται ούτε ομαλοποιούνται και αφήνονται να παραμείνουν στάσιμα, μπορούν εύκολα να οδηγήσουν σε ελαττωματικά συμπεράσματα.
  • A σταθερή στάλα του νερού μπορεί να είναι αρκετό για να γεμίσει καντίνα ή να διατηρήσει ένα δασικό οικοσύστημα. Μόνο τρία σημεία δεδομένων (ο αριθμός των email που αποστέλλονται, έναντι των ανοιγμένων, έναντι των κλικ) μπορούν να διατηρήσουν ένα πρόγραμμα μάρκετινγκ.
  • A υγιέστερη ροή δεδομένων με τη μορφή μικρού κολπίσκου μπορούν να χρησιμοποιηθούν για κολύμβηση. Η συνεχής ροή δεδομένων επιτρέπει συγκριτική αξιολόγηση και σύγκριση ιστορικού. Η βελτιστοποίηση σελίδας προορισμού μπορεί να επιτευχθεί με σταθερά δεδομένα μετατροπών.
    A μέτριο ποτάμι μπορεί να τροφοδοτήσει έναν μύλο για να πριονίσει ξύλο ή να αλέσει σιτάρι. Μια μηχανή προτάσεων χρειάζεται μόνο την αξιόπιστη συμβολή από μερικούς παραπόταμους για να αυξήσει την αξία των καλαθιών αγορών.
  • A καταρράκτη του μπορεί να ωθήσει ένα τεράστιο τροχό του τροχού και μια επαρκής εισροή πληροφοριών μπορεί να οδηγήσει σε πραγματικό χρόνο, ένα δυναμικό σύστημα περιεχομένου.
  • A ποτάμι που είναι αρκετά ευρύ και βαθύ μπορεί να υποστηρίξει μια ολόκληρη βιομηχανία μεταφορών. Αρκετά δεδομένα μπορούν να επιπλέουν φορτηγίδες και φορτηγά πλοία με τη μορφή μιας συλλογής cookie από διαφημιστικά δίκτυα, αθροιστές δεδομένων προγράμματος κάρτας επιβράβευσης πελατών και μεσίτες δεδομένων.

Όταν τα δεδομένα φτάνουν σε αναμενόμενα ποσά σε αναμενόμενες ώρες, μπορούν να καταγραφούν, να διοχετευθούν και να χρησιμοποιηθούν. Τα συστήματα άρδευσης, τα φράγματα και οι δεξαμενές παρέχουν μια αίσθηση ελέγχου και επιτρέπουν την κατασκευή μιας συνεχώς διευρυνόμενης υποδομής με κανάλια, κλειδαριές και φράγματα. Οι αποθήκες δεδομένων έχουν κατασκευαστεί σε λιγότερο αξιόπιστες ροές.

Η καθαριότητα είναι δίπλα στη θεότητα

Το καθαρό νερό είναι ζωτικής σημασίας για την επιτυχία της ζωής, την άρδευση, τους σταθμούς παραγωγής ενέργειας κ.λπ. είναι εντάξει εάν υπάρχουν φύκια στο νερό που ψύχουν μια μονάδα παραγωγής ενέργειας και δεν είναι αποδεκτό εάν υπάρχουν περισσότερα από 10 μέρη ανά δισεκατομμύριο αρσενικού στο πόσιμο νερό.

Τα δεδομένα είναι τα ίδια. Σε μια εφαρμογή άμεσης αλληλογραφίας, εάν έχετε τον τίτλο ενός ατόμου (κύριε, κυρία, κα) είναι ασήμαντο… εκτός αν στέλνετε μηνύματα στους γιατρούς Ωστόσο, τα βρώμικα δεδομένα θα σας προκαλούν κάθε φορά

Ως επικεφαλής επιστήμονας δεδομένων των ΗΠΑ, DJ Patil, βάλτε το σε μια πρώτη διάσκεψη κορυφής CTO, "Αν δεν σκέφτεστε πώς να διατηρήσετε τα δεδομένα σας καθαρά από την αρχή, είστε έτοιμοι. Το εγγυώμαι. Η προσπάθεια να το καθαρίσετε μετά το γεγονός θα διαρκέσει τουλάχιστον μήνες. "

Εάν θερμαίνετε νερό στο σημείο βρασμού, μπορεί να τροφοδοτήσει μια ολόκληρη Βιομηχανική Επανάσταση. Τα δεδομένα φαίνεται να κάνουν το ίδιο πράγμα. Από τη στιγμή που οι υπολογιστές μπορούσαν να αποθηκεύσουν και να υπολογίσουν, τα δεδομένα έχουν συλλεχθεί τόσο γρήγορα όσο θα μπορούσε να δημιουργηθεί ο εξοπλισμός αποθήκευσης για να το κάνει.

Η λίμνη δεδομένων

Καθώς τα δεδομένα από αυτούς τους παραπόταμους περνούν μέσα από τους κινητήρες των μύλων, όλα καταλήγουν στη λίμνη, πίσω από το φράγμα. Καθώς τα δεδομένα εκδίδονται με ελεγχόμενο τρόπο, ενισχύει τους στροβίλους της βιομηχανίας δεδομένων. αυτές οι γιγαντιαίες μηχανές επεξεργασίας δεδομένων με ονόματα όπως το Google και το Facebook. Δεν θα υπάρξει ξηρασία εδώ.

Και, τέλος, υπάρχει μια βαθιά δεξαμενή νερού, περιμένοντας τον αναλυτή να βουτήξει. Scuba gear και spear gun στο χέρι, ο αναλυτής ερευνά το βαθύ, χαρτογραφεί νέο έδαφος και ανακαλύπτει νέα είδη. Είναι μια πολύ συναρπαστική στιγμή για να είστε εξερευνητής δεδομένων.

Γι 'αυτό τόσα πολλά από αυτά έχουν εμφανιστεί για το Σύνοδος κορυφής eMetrics από το 2002. Η επόμενη ευκαιρία είναι στη Βοστώνη, 27 Σεπτεμβρίου έως 1 Οκτωβρίου 2015.

Εγγραφή Κορυφής eMetrics

Μια γέφυρα πάρα πολύ μακριά

Και ποια είναι η δύναμη των δεδομένων να χαράξουμε το επόμενο Grand Canyon; Τι γίνεται με την παγετώδη τήξη δομημένων δεδομένων; Πώς αντιμετωπίζουμε τα λύματα σε έναν κόσμο που όλο και περισσότερο συνειδητοποιεί την προστασία της ιδιωτικής ζωής;

Αυτές είναι ερωτήσεις για άλλη μια φορά και νερό κάτω από τη γέφυρα.

Ποια είναι η γνώμη σας;

Αυτός ο ιστότοπος χρησιμοποιεί το Akismet για να μειώσει το spam. Μάθετε πώς επεξεργάζονται τα δεδομένα των σχολίων σας.