R과 통계분석
2024-06-04
소개하기
R은 통계분석과 그래프 작성 및 통계적 프로그래밍에 적합한 매우 효과적인 분석 도구이다.
또한 R은 잠시도 정체되어 있지 않고 끊임없이 진화하고 있으며,
놀라운 발전 속도를 항상 보여주고 있다.
특히 패키지 tidyverse
의 출현은 매우 주목할 사항이다.
그것은 R의 모습이 tidyverse
이전과 이후로 완전히 구분된다고 할 수 있기 때문이다.
데이터 다루기와 그래프 성능이 비교할 수 없을 만큼 향상되었고, 복잡한 분석 과정이 대폭 단순화되어 매우 효율적인 분석이 가능해졌다.
이러한 발전으로 인하여 R은 이제 data science를 위한 최적의 프로그램으로 자리매김을 확고하게 했다고 할 수 있다.
이 책은 R을 처음 접하는 초급 사용자에게 R의 특징을 소개하는 것뿐만이 아니라 이미 R을 사용하고 있는 중급 사용자에게 실질적인 도움이 될 수 있도록 구성되어 있다.
1장에서 5장까지는 초급 사용자를 위해 R의 기본 개념에 대한 설명을 시작으로 해서,
패키지 readr
등을 활용한 외부 데이터 불러오기, dplyr
에 의한 데이터 다듬기 및 ggplot2
의 기본 개념을 소개하고 있다.
6장부터 9장까지는 중급 사용자를 위해 tidyr
에 의한 데이터 변형, dplyr
에 의한 자료 결합, stringr
에 의한 문자 다루기 및 purrr
에 의한 프로그래밍 기법에 대한 소개가 있으며, 데이터 시각화에 의한 자료탐색 과정에 대한 설명이 예제와 함께 잘 소개되어 있다.
이 책에 포함되어 있는 R code에는 프롬프트(>
또는 +
)를 제거하였고, console 창에 출력되는 실행 결과물은 ##
으로 시작되도록 하였다.
제공된 R code를 쉽게 복사하는 방법은 R code 블록에 마우스를 놓으면 우측 상단에 기호가 나타나는데, 그 기호를 클릭하는 것이다.
R은 data science 분야에서 사용되는 여러 프로그래밍 언어 중에서 가장 뛰어난 통계분석 기능이 있는 언어이다. Data scientist가 되기를 원하시는 분들에게 조금이나마 도움이 되기를 바라는 마음에서 이 책을 출간한다.
이 책을 작성할 때의 R 세션 정보는 다음과 같다.
sessionInfo()
## R version 4.4.0 (2024-04-24 ucrt)
## Platform: x86_64-w64-mingw32/x64
## Running under: Windows 11 x64 (build 22631)
##
## Matrix products: default
##
##
## locale:
## [1] LC_COLLATE=Korean_Korea.utf8 LC_CTYPE=Korean_Korea.utf8
## [3] LC_MONETARY=Korean_Korea.utf8 LC_NUMERIC=C
## [5] LC_TIME=Korean_Korea.utf8
##
## time zone: Asia/Seoul
## tzcode source: internal
##
## attached base packages:
## [1] stats graphics grDevices utils datasets methods base
##
## other attached packages:
## [1] lubridate_1.9.3 forcats_1.0.0 stringr_1.5.1 dplyr_1.1.4
## [5] purrr_1.0.2 readr_2.1.5 tidyr_1.3.1 tibble_3.2.1
## [9] ggplot2_3.5.1 tidyverse_2.0.0
##
## loaded via a namespace (and not attached):
## [1] gtable_0.3.5 jsonlite_1.8.8 compiler_4.4.0 tidyselect_1.2.1
## [5] jquerylib_0.1.4 scales_1.3.0 yaml_2.3.8 fastmap_1.1.1
## [9] R6_2.5.1 generics_0.1.3 knitr_1.46 bookdown_0.39
## [13] munsell_0.5.1 bslib_0.7.0 pillar_1.9.0 tzdb_0.4.0
## [17] rlang_1.1.3 utf8_1.2.4 stringi_1.8.4 cachem_1.0.8
## [21] xfun_0.44 sass_0.4.9 timechange_0.3.0 cli_3.6.2
## [25] withr_3.0.0 magrittr_2.0.3 digest_0.6.35 grid_4.4.0
## [29] rstudioapi_0.16.0 hms_1.1.3 lifecycle_1.0.4 vctrs_0.6.5
## [33] evaluate_0.23 glue_1.7.0 fansi_1.0.6 colorspace_2.1-0
## [37] rmarkdown_2.26 tools_4.4.0 pkgconfig_2.0.3 htmltools_0.5.8.1