통계 240 물론 메모
7.3 데이터 문제를 해결하기 위해
각각의 변수를 기록한 무료 텍스트입니다.동일한 정보는 기록을 수행 한 사람에 따라 다른 관찰에서 매우 다르게 표현 될 수 있습니다.예를 들어 누락 된 데이터는 비워두고 R 에 의해 na 로 읽을 수 있습니다.그러나”n/a”,”N/a”,”None”,”N/a”또는 기타와 같은 텍스트는 동일한 것을 의미합니다.마찬가지로,많은 대안 방법으로는 경찰 수 있습에 대한 정보를 입력 성별,인종,나이,피해자의 용의자를,그리고 사람들을 체포했다.,예를 들면”15 세 남성”,”성인 남성”,”M/B18 세”,”남성 2 명,20 세 여성 1 명,19 세”,”백인 여성 2 명,18-20 세”등이 있습니다.일부 개인은 이름으로 식별되며 성은 유추 될 수 있습니다.
이 부족의 보편적인 의미하는 데이터를 기록하는 일반적으로 않는 문제에 대한 지적인 인간의 독자 노력하고 데이터를 읽는 소수의 사건은,그러한 도전을 추출하고자 할 때 요약에서 정보를 전체 데이터를 설정합니다.,외에도 같은 정보가 저장되는 여러 가지 방법으로,도전 과제가 있다는 명백한 오류 날짜에,경우의 숫자,그리고 다른 변수입니다.에서 값을 경우 숫자와 다른 변수를 동일한 관찰 또는 기타 관측 근처에 의해서 데이터를 설정할 수 있는 유용한 올바른 errorsas 사건은 내일’동물의 세계 더불어 사는 세상에서의 순서는 시간입니다.피>