Tilastot 240 Kurssin Muistiinpanoja
7.3 Tietojen Haasteet
Jokainen muuttujista kirjataan vapaata tekstiä.Sama tieto voidaan ilmaista hyvin eri havainnoissa riippuen siitä, kuka äänityksen teki.Esimerkiksi puuttuvat tiedot voitaisiin jättää tyhjiksi ja lukea R as NA.Mutta teksti, kuten ”n/a”, ”N/a”, ”None”, ”N/A” tai muut tarkoittavat samaa asiaa.Samoin on monia vaihtoehtoisia tapoja, joilla poliisi voisi syöttää tietoja uhrien, epäiltyjen ja pidätettyjen sukupuolesta, rodusta tai iästä.,Esimerkkejä ovat: ”15-vuotias mies”, ”aikuinen mies”, ”M/B 18-vuotias”, ”2 urosta, sekä 20-vuotias 1 nainen, 19 vuotta vanha”, ”Kaksi valkoista naarasta, 18-20-vuotiaita”, ja monet muut.Jotkut yksilöt tunnistetaan nimeltä ja sukupuoli voidaan päätellä.
Tämä puute on yleinen keino tallentaa tiedot ei yleensä ole ongelma älykkään ihmisen lukija yrittää lukea tietoja pieni määrä tapauksia,mutta liittyy merkittävä haaste, kun yrittää poimia yhteenveto koko tietokokonaisuutta.,Lisäksi samat tiedot on tallennettu monin tavoin,on edelleen haasteena on, että on joitakin ilmeisiä virheitä päivämäärät,jos numeroita, ja muut muuttujat.Arvot ovat eri asia kuin numerot ja muut muuttujat sama havainto tai muut havainnot lähellä tietoaineistossa voi olla hyödyllistä korjata errorsas tapaukset ovat, enemmän tai vähemmän, jotta aikaa.