소개하기

R은 통계분석과 그래프 작성 및 통계적 프로그래밍에 적합한 매우 효과적인 분석 도구이다. 또한 R은 잠시도 정체되어 있지 않고 끊임없이 진화하고 있으며, 놀라운 발전 속도를 항상 보여주고 있다. 특히 패키지 tidyverse의 출현은 매우 주목할 사항이다. 그것은 R의 모습이 tidyverse 이전과 이후로 완전히 구분된다고 할 수 있기 때문이다. 데이터 다루기와 그래프 성능이 비교할 수 없을 만큼 향상되었고, 복잡한 분석 과정이 대폭 단순화되어 매우 효율적인 분석이 가능해졌다. 이러한 발전으로 인하여 R은 이제 data science를 위한 최적의 프로그램으로 자리매김을 확고하게 했다고 할 수 있다.

이 책은 R을 처음 접하는 초급 사용자에게 R의 특징을 소개하는 것뿐만이 아니라 이미 R을 사용하고 있는 중급 사용자에게 실질적인 도움이 될 수 있도록 구성되어 있다. 1장에서 5장까지는 초급 사용자를 위해 R의 기본 개념에 대한 설명을 시작으로 해서, 패키지 readr 등을 활용한 외부 데이터 불러오기, dplyr에 의한 데이터 다듬기 및 ggplot2의 기본 개념을 소개하고 있다. 6장부터 9장까지는 중급 사용자를 위해 tidyr에 의한 데이터 변형, dplyr에 의한 자료 결합, stringr에 의한 문자 다루기 및 purrr에 의한 프로그래밍 기법에 대한 소개가 있으며, 데이터 시각화에 의한 자료탐색 과정에 대한 설명이 예제와 함께 잘 소개되어 있다.

이 책에 포함되어 있는 R code에는 프롬프트(> 또는 +)를 제거하였고, console 창에 출력되는 실행 결과물은 ##으로 시작되도록 하였다. 제공된 R code를 쉽게 복사하는 방법은 R code 블록에 마우스를 놓으면 우측 상단에 기호가 나타나는데, 그 기호를 클릭하는 것이다.

R은 data science 분야에서 사용되는 여러 프로그래밍 언어 중에서 가장 뛰어난 통계분석 기능이 있는 언어이다. Data scientist가 되기를 원하시는 분들에게 조금이나마 도움이 되기를 바라는 마음에서 이 책을 출간한다.

이 책을 작성할 때의 R 세션 정보는 다음과 같다.

sessionInfo()
## R version 4.4.0 (2024-04-24 ucrt)
## Platform: x86_64-w64-mingw32/x64
## Running under: Windows 11 x64 (build 22631)
## 
## Matrix products: default
## 
## 
## locale:
## [1] LC_COLLATE=Korean_Korea.utf8  LC_CTYPE=Korean_Korea.utf8   
## [3] LC_MONETARY=Korean_Korea.utf8 LC_NUMERIC=C                 
## [5] LC_TIME=Korean_Korea.utf8    
## 
## time zone: Asia/Seoul
## tzcode source: internal
## 
## attached base packages:
## [1] stats     graphics  grDevices utils     datasets  methods   base     
## 
## other attached packages:
##  [1] lubridate_1.9.3 forcats_1.0.0   stringr_1.5.1   dplyr_1.1.4    
##  [5] purrr_1.0.2     readr_2.1.5     tidyr_1.3.1     tibble_3.2.1   
##  [9] ggplot2_3.5.1   tidyverse_2.0.0
## 
## loaded via a namespace (and not attached):
##  [1] gtable_0.3.5      jsonlite_1.8.8    compiler_4.4.0    tidyselect_1.2.1 
##  [5] jquerylib_0.1.4   scales_1.3.0      yaml_2.3.8        fastmap_1.1.1    
##  [9] R6_2.5.1          generics_0.1.3    knitr_1.46        bookdown_0.39    
## [13] munsell_0.5.1     bslib_0.7.0       pillar_1.9.0      tzdb_0.4.0       
## [17] rlang_1.1.3       utf8_1.2.4        stringi_1.8.4     cachem_1.0.8     
## [21] xfun_0.44         sass_0.4.9        timechange_0.3.0  cli_3.6.2        
## [25] withr_3.0.0       magrittr_2.0.3    digest_0.6.35     grid_4.4.0       
## [29] rstudioapi_0.16.0 hms_1.1.3         lifecycle_1.0.4   vctrs_0.6.5      
## [33] evaluate_0.23     glue_1.7.0        fansi_1.0.6       colorspace_2.1-0 
## [37] rmarkdown_2.26    tools_4.4.0       pkgconfig_2.0.3   htmltools_0.5.8.1