Articles

Statistics 240 Course Notes (Magyar)


7.3 Data Challenges

az egyes változók rögzített szabad szöveg.Ugyanez az információ nagyon eltérő módon fejezhető ki különböző megfigyelésekben, attól függően, hogy ki készítette a felvételt.Például a hiányzó adatokat üresen lehet hagyni, és az R-nek mint NA-nak be kell olvasnia.De az olyan szöveg, mint “n/a”, “N/a”, “Nincs”, “N/A” vagy mások ugyanazt jelentik.Hasonlóképpen, számos alternatív módszer létezik arra, hogy a rendőrség információkat adjon meg az áldozatok, gyanúsítottak és letartóztatottak neméről, fajáról vagy életkoráról.,Példák: “15 éves férfi”, “felnőtt férfi”, “M/B 18 éves”, “2 férfi, mind 20 éves 1 nő, 19 éves”, “Két fehér nő, 18-20 éves korig”, és még sokan mások.Egyes egyedeket név és nem alapján azonosítanak.

az adatok rögzítésére szolgáló univerzális eszköz hiánya általában nem jelent problémát egy intelligens emberi olvasó számára, aki kis számú eseményből próbál adatokat olvasni, de jelentős kihívást jelent, amikor összefoglaló információkat próbál kinyerni a teljes adatkészletből.,Amellett, hogy ugyanazokat az információkat sok szempontból tárolják, további kihívás az,hogy vannak nyilvánvaló hibák a dátumokban, az esetszámokban és más változókban.Az esetszámok és más változók értékei ugyanarra a megfigyelésre vagy más megfigyelésekre az adatkészletben hasznosak lehetnek a hibák kijavításáhozmivel az események többé-kevésbé az idő sorrendjében vannak.