Εξερεύνηση CSV: Εργασία με μεγάλα αρχεία CSV

Τα αρχεία CSV είναι θεμελιώδη και είναι συνήθως ο χαμηλότερος κοινός παρονομαστής εισαγωγής και εξαγωγής δεδομένων από οποιοδήποτε σύστημα. Δουλεύουμε με έναν πελάτη αυτήν τη στιγμή που διαθέτει μια πολύ μεγάλη βάση δεδομένων επαφών (πάνω από 5 εκατομμύρια εγγραφές) και πρέπει να φιλτράρουμε, να υποβάλουμε ερωτήματα και να εξάγουμε ένα υπο-τμήμα των δεδομένων. Τι είναι το αρχείο CSV; Ένα αρχείο τιμών διαχωρισμένων με κόμμα είναι ένα οριοθετημένο αρχείο κειμένου που χρησιμοποιεί κόμμα για διαχωρισμό τιμών. Κάθε γραμμή του

DataRobot: Μια πλατφόρμα αυτόματης μηχανικής εκμάθησης για επιχειρήσεις

Πριν από χρόνια, έπρεπε να κάνω μια τεράστια χρηματοοικονομική ανάλυση για την εταιρεία μου για να προβλέψω εάν οι αυξήσεις των μισθών θα μπορούσαν να μειώσουν την εξέλιξη των εργαζομένων, το κόστος εκπαίδευσης, την παραγωγικότητα και τη συνολική ηθική των εργαζομένων. Θυμάμαι να τρέχω και να δοκιμάζω πολλά μοντέλα για εβδομάδες, όλα καταλήγοντας στο συμπέρασμα ότι θα υπάρξει εξοικονόμηση. Ο διευθυντής μου ήταν ένας απίστευτος άντρας και μου ζήτησε να επιστρέψω και να τους ελέγξω για άλλη μια φορά προτού αποφασίσουμε να αυξήσουμε τους μισθούς για μερικές εκατοντάδες υπαλλήλους.