자료를 정리하는 방법에는 표 또는 그림을 이용하는 방법과 수치를 이용하는 방법이 있다.
표 또는 그림을 이용하는 방법에는 도수분포표가 있다.
책에서 제공해주는 자료를 다운받아서 실습해보자.
결과물도 함께 제공해 주었는데, Rstudio 프로그램을 이용해서 실습한것으로 보인다.
앞으로 나도 Rstudio 로 실습 해야겠다.
시작하자마자 오류가 났다.
오타가 난줄 알았으나 제대로 썻다.
자료를 불러오는 과정에서 문제가 생긴것이다.
error in make.names(col.names, unique = true) : invalid multibyte string at '<bc><ba><ba><b0>'
이러한 유형의 오류는 인코딩 명령어를 앞에 넣어줘야 한다고 한다.
d = read.csv(fileEncoding = "euc-kr", "C:/R_행통/stat.csv")
이렇게 명령어를 넣어줘야 정상적으로 실행이된다.
자료를 분석하고 그래프까지 나타낸 사진이다.
아직 아무것도 익숙치 않아서 그냥 책에 써있는데로 따라 쓰기만 했다.
양적자료를 질적자료화하여 도수분포표 등을 이용해 자료의 특성을 이해 할 수 있다.
하지만 더욱 간단하게 수치로 자료의 특성을 파악할 수도있다.
대표적으로 자료의 대표값, 분포도, 비대칭도 등이 주로 이용된다.
대표값 : 대표값은 주로 산술평균, 중앙값, 최빈값 등으로 자료를 대표할 수 있는 위치를 수치로 나타낸 것이다.
책에 나와있는 예제로 무작위 수를 분석한 결과이다.
자료의 갯수, 평균값, 중앙값 등 을 구했다.
아무래도 수식을 어느정도 외워야 할 것만 같다.
참고문헌
정건섭, 김성우, R과 R Studio를 활용한 사회과학 통계연습, 윤성사, 2019
감사합니다.
'R' 카테고리의 다른 글
R언어 공부 - 확률과 확률 분포 (0) | 2023.07.14 |
---|---|
R언어 공부 - 자료의 정리 (2) (0) | 2023.07.05 |
R언어 공부 - 통계 기본 이론 (0) | 2023.07.05 |
R언어 공부 - 스크립트 (0) | 2023.07.03 |
R언어 공부 - 예제 따라하기 (3) (0) | 2023.07.03 |