R을 처음 접한 것은 1988년 미국으로 유학가자 마자 시작한 RA 생활에서이다. Chairman은 내가 computer science background가 있으니 RA로 통계컨설팅을 해 보라고 권유했고, 컨설팅센터 리더인 Dr. Cabrera를 만나 보라는 것이 었다. Dr.Cabrera는 나에게 Unix를 다룰 줄 아냐고 하면서 나에게 account 정보와 두꺼운 바인딩 출력물을 주며 S language를 공부하여 의뢰 받은 모든 분석은 S로 하라는 것이 었다.
당시 영어가 너무 서툴러 대부분의 대답은 "yes"일 수 밖에 없어 Unix로 안다고 했고 S language도 할 수 있다고 한 상태였다. 한국 분의 도움을 받으며 겨우 Unix 사용법을 익히고 S language를 일주일 간 공부하여 첫번째 의뢰 받은 컨설팅 과제를 분석해 나아갔다. 많은 우여곡절, 당시는 너무나도 부끄럽지만 지금은 추억이 되어버린 이야기들이 많지만... 결국 S language 역시 많은 시간을 흐르며 open source인 R로 자리를 잡은 것이다.
R은 교수로 첫발을 디딘 90년대말에 접하게 되었는데, 당시 S-PLUS라는 제품에 비해 완성도나 처리능력, 제공 함수들이 떨어졌었다. 그러나 미국의 실리콘밸리 중심의 대형 인터넷 기업들이 분석 플랫폼으로 사용하며 big data 분석 엔진으로 자리를 잡은 것이다.
미국의 통계학 박사논문, 기타 연구의 99.9%가 R이나 S-PLUS로 진행되고 대학 커리큘럼에서도 R을 기본으로 하는데 비해, 국내에서는 그 활용도나 보급률이 매우 낮은 상황이다.