전체보기 10

R언어 공부 - 확률과 확률분포 실습

R 프로그램을 이용해 확률분포 그래프를 만들어 보았다. 확률 변수를 생성하고 이항분포 및 포아송 분포 그래프이다. 표준정규분포 그래프를 만들었다. 좌우 대칭 그래프 인듯 아닌듯.. lim을 다시 지정해야하나? 평균 100, 표준편차 10 90 ~ 110 , 80 ~ 120, 70 ~ 130 3가지의 정규확률 분포도 그래프를 만들었다. 표준정규분포 그래프 이다. 수식을 문자로 써야하나보다.. 참고문헌 정건섭, 김성우, R과 R Studio를 활용한 사회과학 통계연습, 윤성사, 2019 감사합니다.

R 2023.07.14

R언어 공부 - 확률과 확률 분포

확률은 불확실한 상황에서 의사결정을 하는데에 유용한 개념이다. 우연한 사건의 결과를 관찰하는 과정을 "확률 실험" , 관찰이나 실험을 통해 얻어지는 결과나 사건을 "사상(event)" 이라고 한다. 확률은 크게 객관적 방법과 주관적 방법이 있다. 객관적 방법에는 경험적 방법과 추론적 방법이 있다. 경험적 방법 : 직접 다 경험해보고 나온 결론이다. ex ) 여러가지 색깔의 구슬이 들어있는 구슬 주머니에서 100회 뽑기 했는데, 노란색 구슬이 50번 나왔다면 노란색 구슬이 나올 확률은 50% 이다. 논리적 추론에 의한 확률의 정의 : 실험하지 않고 추론을 통해서 얻는 결론이다. ex ) 동전 앞면이 나올 확률, 주사위 눈금이 1이 나올 확률 등이 있다. 1. 어떤 사건 A가 일어날 확률은 0 ≤ P(A) ..

R 2023.07.14

R언어 공부 - 자료의 정리 (2)

왜도와 첨도 - 왜도 : 분포가 기울어진 방향과 정도 - 첨도 : 분포가 얼마나 중심에 집중되어있는 정도 앞선 자료인 무작위 숫자를 가지고 실습을 해본다. 수식이 조금 복잡하다. 오른쪽으로 꼬리가 긴 형태를 보인다. 0에 가까울 수록 정규분포인 대칭형태가 나타난다. (무슨말인지 잘 이해는 안된다..) 푸른 직선에 가까울 수록 정규분포에 해당한다. 이번에는 표로 정리 했던 자료를 가지고 왜도와 첨도를 구해보았다. 이번에도 오른쪽으로 꼬리가 긴 형태이다.. 파일을 불러 올때 무조건 인코딩파일 명령어를 써야 하나보다.. 좀 귀찮은데.. 다른 설정 방법이 없는지 찾아봐야 겠다. 자료의 갯수가 많아서 그런가 점들이 더 진하게 나타난다. 왜도와 첨도 수식이 길어서 이것들을 펑션으로 합쳐놓는 기능이 있다. 펑션을 이..

R 2023.07.05

R언어 공부 - 자료의 정리 (1)

자료를 정리하는 방법에는 표 또는 그림을 이용하는 방법과 수치를 이용하는 방법이 있다. 표 또는 그림을 이용하는 방법에는 도수분포표가 있다. 책에서 제공해주는 자료를 다운받아서 실습해보자. 결과물도 함께 제공해 주었는데, Rstudio 프로그램을 이용해서 실습한것으로 보인다. 앞으로 나도 Rstudio 로 실습 해야겠다. 시작하자마자 오류가 났다. 오타가 난줄 알았으나 제대로 썻다. 자료를 불러오는 과정에서 문제가 생긴것이다. error in make.names(col.names, unique = true) : invalid multibyte string at '' 이러한 유형의 오류는 인코딩 명령어를 앞에 넣어줘야 한다고 한다. d = read.csv(fileEncoding = "euc-kr", "C:..

R 2023.07.05

R언어 공부 - 통계 기본 이론

R언어 프로그램은 통계학에서 주로 사용되는 프로그램이다. 따라서 통계학 이론에 대해 공부할 필요가 있다. 통계학의 기초 - 통계학의 기원 : 통계학은 인구조사, 세금 징수 등과 같은 국가 유지 수단에서 기원했다. - 통계 : 조사를 통하여 수집된 자료들을 수치로 종합해 놓은 것이다. - 통계학 : 정보를 최적의 방법으로 수집하고, 수집한 자료를 정리하는 학문이다. 즉, 통계는 통계분석의 원자료, 통계학은 분석 도구인셈이다. 통계학의 필요성 - 좀 더 나은 의사결정을 하기 위한 수단이다. - 통계학은 방대한 자료의 특징을 한 눈에 이해 할 수 있도록 요약, 정리 해주는 기능이 있다. ex) 경제성장률을 기초로 정부의 다음해 세수 결정 소비자의 성향 파악으로 기업의 마케팅 전략 수립 자료의 구분 질적 자료 ..

R 2023.07.05

R언어 공부 - 스크립트

이때까지 명령어를 작성하고 엔터를 누르면 바로 작동 했던 창을 콘솔 이라고 부른다. 지금처럼 배우는 단계에서는 콘솔창에다가 바로바로 간단한 명령어만 입력하니까 상관없겠지만, 나중에는 복잡한 명령어를 쓸 것으로 예상된다. 그럴 때 스크립트를 이용하면 좋아보인다. 새 스크립트를 클릭하면 우측에 '제목없음 - R 편집기' 가 생성된다. 스크립트 창에 명령어를 입력해주고 커서를 글자 있는 곳에 둔 다음에 'ctrl + r' 키를 눌러주면 콘솔창에서 바로 명령어가 실행된다. 스크립트는 따로 저장도 되고 불러오기도 가능하다. 저장할 때 주의할 점이 있다. R은 다른 소프트웨어와는 달리 확장자 R이 자동으로 붙여지지 않는다. 그러므로 스크립트 이름을 붙일 때는 다음과 같이 이름 뒤에 확장자까지 붙여야 한다. 아직 스..

R 2023.07.03

R언어 공부 - 예제 따라하기 (3)

R프로그램도 엑셀 프로그램처럼 다양한 함수가 사용 가능하다. 함수 기능 abs(x) 절대값 sqrt(x) 제곱근 x^n n승값 ceiling(x) 올림 floor 내림 trunc(x) 소수점 이하 버림 위에 D 항목을 보면 오타로 인해 에러가 난것을 볼 수 있다. 이 때 다시 처음부터 쓰는게 아닌 방향키 위 또는 아래 를 누르면 이전에 사용했던 명령문이 바로 작성된다. 거기서 틀린 부분을 수정해서 다시 엔터를 누르면 정상적으로 실행이 된다. 만약 오타로 틀렸다면 다시 처음부터 쓸 필요가 없다. plot ( ) 그래프 그리기 함수 기능 X x축 변수 지정 Y y축 변수 지정 main= 그래프 제목 sub= 그래프 아래 제목 xlim= x축 좌표 눈금 지정, y축은 ylim ylab= y축 제목 지정, x축..

R 2023.07.03

R언어 공부 - 예제 따라하기 (2)

R은 기본적으로 행벡터와 열벡터의 구분이 없다. 따라서 명령문을 사용하여 만들어야 한다. 이외에도 matrix 명령어를 이용하여 행렬을 을 만들 수 있다. 다음 표는 R의 행렬 함수이다. R 명령문 내용 %*% 행렬곱 t 전치 dim 차수 det 행렬식 diag 대각원소 solve 역행렬 eigen 고유값, 고유벡터 mean 평균 min 최소값 max 최대값 median 중위수 quantile 분위수 var 분산 sd 표준편차 IOQ 사분위범위 cov 공분산 cor 상관계수 감사합니다. 참고문헌 정건섭, 김성우, R과 R Studio를 활용한 사회과학 통계연습, 윤성사, 2019

R 2023.07.03

R언어 공부 - 설치

이 포스트는 'R과 R Studio를 활용한 사회과학 통계연습' 책을 통해 공부하면서 배운 내용을 정리하기 위한 목적으로 작성했다. R은 통계 계산과 그래프 작성을 위한 언어이다. R의 장점은 작고 효과적이며, 대용량 데이터 관리 및 처리, 행렬 연산이 가능하다. 무엇보다 무료이며 전 세계 연구자들이 개발한 알고리즘과 함수들을 사용 할 수 있다. 그리고 다양한 확장성 및 범용성을 가지고 있다. R 프로그램을 설치하는 방법은 홈페이지에서 다운받으면 된다. https://www.r-project.org/ R: The R Project for Statistical Computing www.r-project.org 홈페이지가 영어로 되어있어 불편하신 분들은 아래 사진을 참고해주시면 됩니다. 이후 설치 과정은 개..

R 2023.07.03