최근 포스트

[Ubuntu]Apache Hadoop 설치하기

3 분 소요

Hadoop 의 구축 방법 단독 작업 모드 (Stand-Alone Operation) 가상 분산 모드 (Pseudo-Distributed Operation) 완전 분산 모드 (Fully-Distributed Operation)

hadoop spark

최대 1 분 소요

하둡의 맵리듀스와 하이브 슈퍼컴퓨터 없이 서버를 여러대 연결해 빅데이터 분석을 가능하게 했다. 하지만 기술이 나오고 시간이 한참 지난 뒤부터 여러 단점들이 보이기 시작하며, Apache Spark 가 등장한다. 맵리듀스와 비슷한 목적의 업무를 수행하는데 메모리를 활용한 굉장히...

R CSV 파일 불러오기

최대 1 분 소요

데이터를 얻었으니 본격적으로 데이터들을 불러와야하는데 생초보인 나는 이것 조차 모른다 ㅠㅠ