새로운 것

대용량 데이터 분석 및 처리를 위한 Hadoop & NoSQL 출간

archmond 2012. 12. 29. 19:16

[신간 보도자료]

대용량 데이터 분석 및 처리를 위한 Hadoop & NoSQL

http://www.yes24.com/24/goods/8225777

hadoop

▶ 발행 : (주) 도서출판 길벗
▶ 출간일 : 2013년 1월 3일
▶ 지은이 : 서상원, 김재홍, 박윤성, 이준섭, 명재석
▶ 쪽수 : 440쪽
▶ 가격 : 32,000원
▶ ISBN : 978-89-6618-503-0 03000
▶ 판형 : 188*243
▶ 분야 :

  • 국내도서 > 컴퓨터와 인터넷 > IT 전문서 > 개발/OS/DB > 클라우드/빅데이터
  • 국내도서 > 컴퓨터와 인터넷 > IT 전문서 > 개발/OS/DB > DB 프로그래밍
  • 국내도서 > 컴퓨터/인터넷 > 프로그래밍 개발/방법론 > 프로그래밍 기초/개발 방법론

▶ 검색어 : 하둡, Hadoop, NoSQL, 빅데이터분석, BigData, 맵리듀스, MapReduce, HBase, 클라우드

[책 소개]

콘텐츠의 품질은 “빅데이터를 가공하는 방식”에 전적으로 의존한다.
“생생한 국내 구축 사례”를 통해 우리 환경에 맞는 빅데이터 기술의 노하우를 배운다!

인터넷 기술이 급속도로 발전함에 따라 콘텐츠를 구성하는 데이터의 양이 기하급수적으로 증가하는 “빅데이터” 시대다. 유튜브나 넷플릭스 등은 이미 수년 전부터 고객의 성향을 찾아내어 적절히 추천하고 필터링하는 작업을 거쳐 맞춤형 서비스를 하고 있다. 클라우드 컴퓨팅의 가장 큰 도전은 자원의 효율적인 분배 및 안정성 보장이다. 본서에서는 하둡 뿐만 아니라 실질적인 빅데이터 분석에 쓰이는 전문 도구들을 심도 있게 다루고 있으며, 예제와 그림을 통해 쉽게 접근할 수 있도록 하였다.

최근 빅데이터의 ‘실시간성’ 이슈가 급격하게 증가함과 동시에 페이스북(Facebook)을 비롯한 많은 선도 기업들이 HBase를 채택하여 큰 관심을 받고 있다. 간단한 예제를 통하여 HBase를 설치하고 운영하는 방법뿐만 아니라, HBase의 한계를 보완하기 위한 NHN과 KT 클라우드웨어 주도로 이뤄진 국내 오픈소스 프로젝트인 DuoBase내의 HBase까지 속속들이 파헤쳐 본다.

[저자 소개]

■ 저자

서상원(smiler.seo@gmail.com)

  • 현, 팀장(LG 전자)
  • 본부장(KT 클라우드웨어)
  • 대표이사(아헴스)
  • 한국과학기술원 전산학 박사수료

김재홍(wja300@gmail.com)

  • 현, 팀장(KT 클라우드웨어)
  • 기술총괄이사(아헴스)
  • 한국과학기술원 전산학 박사수료

박윤성(ys.park@kaist.ac.kr)

  • 현, 팀장(KT 클라우드웨어)
  • 책임연구원(아헴스)
  • 한국과학기술원로봇공학 석사 졸업

이준섭(skyaicom@gmail.com)

  • 현, 팀장(KT 클라우드웨어)
  • 전략총괄이사(아헴스)
  • 연구원(ETRI)
  • 한국과학기술원 전산학 석사 졸업

명재석(jsmyung@europa.snu.ac.kr)

  • 현, 서울대학교 컴퓨터공학 박사과정

■ 감수

김세영

  • 현, 아키텍트(KT 클라우드웨어)
  • 연구개발 본부장(아헴스)
  • 성균관대학교 정보통신공학 졸업

박희종

  • 현, PM(KT 클라우드웨어)
  • 사업기획팀장(아헴스)
  • KTH, SK 컴즈, 인터파크
  • 성균관대학교 기계공학과 졸업

[출판사 리뷰]

Hadoop&Nosql_400빅데이터 처리 기술의 핵심인 하둡(Hadoop)과 NoSQL!

하둡이란 무엇일까? 기업들은 현업에서 어떤 식으로 빅데이터를 처리할까? 하둡 생태계에서의 NoSQL인 HBase를 알아보고, NHN과 KT 클라우드웨어의 주도로 진행된 국내 오픈소스 프로젝트 DuoBase 내의 HBase를 소개한다.

※ 이 책의 대상 독자

데이터 분석 또는 플랫폼 아키텍트, 또는 그와 관련된 업무를 배우려는 대학생, 개발자가 읽어야 할 책이다. 빅데이터를 다룰 때 공통적으로 알아야 할 필수적인 기술들을 실무 경험을 바탕으로 설명하고 있다.

※ 이 책의 구성

이 책은 크게 두 파트로 나뉜다. 첫 번째 파트는 챕터 1부터 4까지로, 하둡에 대한 기본기를 다진다. 챕터 5부터는 두 번째 파트로, 클라우드 컴퓨팅에 대한 주제로 환기하며 하둡을 이용한 빅데이터 도구 및 NoSQL 저장 기술에 대해 자세히 다루고 있다.

  • Chapter 1. 너치와 루씬으로 시작된 하둡의 역사, 국내외 구축 사례 그리고 하둡을 실제 구축하기 위해 하나의 서버를 이용해 구축하는 분산 모조형과 여러 대의 서버를 이용하여 구축하는 클러스터형에 대해서 알아본다.
  • Chapter 2. 하둡 분산 파일 시스템 구조 분석 특히 하둡 분산 파일 시스템(HDFS)의 주요 구성 요소인 네임노드와 데이터노드, 그리고 세컨더리 네임노드의 각자 역할과 동작 방식에 대해서 자세히 살펴본다.
  • Chapter 3. 빅데이터에 대한 개념 정의, 맵리듀스 살펴보기 특히, 맵리듀스의 필요성에 대해 전통적인 방식과 비교를 통해 이해하기 쉽게 설명하고 여러 가지 맵리듀스 예제를 작성해가며 맵리듀스 응용에 대한 감각을 익힌다.
  • Chapter 4. 하둡의 초기 버전부터 1.0 까지의 발전, 각 버전의 특징 논의 API의 변화, 덧붙이기 기능, 보안 요소를 중심으로 현재의 하둡을 깊게 이해한다. 그리고 네임노드 장애에 대응할 수 있도록 설계된 하둡 2.0의 파일 시스템과 차세대 맵리듀스로 불리우는 YARN 프레임워크를 통해 앞으로의 하둡의 발전 방향을 살펴본다.
  • Chapter 5. 클라우드 컴퓨팅의 기본 개념, 아마존 주요 서비스 소개 더불어 하둡을 직접 구축한 사례와 클라우드 서비스를 활용해 구축할 수 있는 방법에 대해 소개한다.
  • Chapter 6. 아마존의 하둡 서비스, Hive, Pig, EC2 인프라 구축 및 관리에 대한 오버헤드, 그리고 동적으로 증가하는 빅데이터에 대한 효율적인 처리를 위해서 아마존의 하둡 서비스는 클라우드 인프라를 200% 활용하여 빅데이터 운용에 대한 탄력성을 제공한다. 이러한 서비스를 직접 사용해 보고, 클라우드 환경에서의 빅데이터 운용에 대한 이슈를 살펴보기로 한다.
  • Chapter 7. 마하웃(Mahout), 알하이브(RHive), 지라프(Giraph) 프레임워크 다양한 기계 학습 알고리즘을 손쉽게 사용할 수 있게 해주는 도구인 마하웃(Mahout), 통계 분석 도구인 R과 하둡의 대용량 스토리지 기능을 결합한 알하이브(RHive), 하둡을 통한 그래프 데이터 처리 도구인 지라프(Giraph) 프레임워크를 살펴본다. 이러한 도구들을 통해 하둡과 맵리듀스가 생소한 사용자들도 대용량의 데이터 처리할 수 있도록 돕는다.
  • Chapter 8. 빅데이터 저장, 실시간 질의 및 분석을 위한 NoSQL 개발 및 배포하려는 서비스 또는 빅데이터 환경에 있어, NoSQL을 하나의 적용 가능한 솔루션으로 객관적으로 평가할 수 있도록, 그 등장 배경을 비롯하여 NoSQL의 기본적 특성, NoSQL 종류별 특성과 그것의 기본 데이터 모델링 기법에 대하여 하나하나 짚어 보는 것을 목표로 한다.
  • Chapter 9. 하둡 생태계에서의 NoSQL인 HBase HBase의 특징적인 데이터 모델링 및 스키마를 알아보고, HBase의 시스템 구조를 살펴본다. 그리고 간단한 예제를 통하여 HBase를 설치하고 기본적으로 운영하는 방법에 대하여 알아본다. 마지막으로, HBase의 제약점과 부족한 점을 보완하기 위해 NHN과 KT 클라우드웨어 주도로 진행하는 국내 오픈소스 프로젝트인 DuoBase 내의 HBase를 소개한다.

[추천평]

빅데이터, 하둡, NoSQL은 이제 개발자뿐만 아니라 IT 업계에 있는 사람들이라면 누구나 다 알고 있는 용어가 되었다. 그 인기를 반영하듯 연일 컨퍼런스가 이어지고, 선진국의 다양한 비즈니스 사례를 우리에게 이야기하고 있다. 하지만 무언가 핵심이 빠져 있다는 것을 조금만 관심을 가지면 알 수 있는데 그것은 바로 우리 환경에 맞는 실제 경험이다. 단순히 빅데이터 기술만 익히고자 한다면 인터넷상의 매뉴얼로도 충분하다. 하지만 실제 데이터를 다루어 본 사람들의 생생한 경험에서 나오는 빅데이터가 궁금하다면 이 책을 꼭 살펴보길 바란다. 우리 현실에 적용할 수 있는 빅데이터의 기술과 그 경험을 확인할 수 있을 것이다.

- 황재선(플랫폼전문가그룹 대표위원)

최근 빅데이터에 대한 큰 관심과 더불어 빅데이터를 실제 처리할 수 있는 도구와 시스템에 대한 수요도 많아졌지만 실제 전문가를 찾아보기는 쉽지 않다. 이중 가장 유명한 도구인 Hadoop과 대용량 처리에서 SQL의 단점을 극복하기 위해 만들어진 NoSQL을 비롯한 최근의 경향에 대해서 보다 쉽고 체계적으로 접근할 수 있는 이 책을 통해서 독자들도 많은 지식을 쌓아 빅데이터 활용을 위한 실전으로 이어지길 바란다.

- 최준호(CDNetworks CTO)

빅데이터란 말은 이제 어디에서나 들을 수 있을 정도로 우리에게 다가왔지만 빅데이터 관련 서적을 찾기는 어려웠다. 이 책은 번역서가 아닌 국내 개발자들의 경험을 기반으로 만들어진 책이라 더욱 눈길을 끈다. Hadoop과 NoSQL에 대한 개념을 확립하고 그것을 활용하고자하는 관리자, 개발자 그리고 학생들에게 추천한다.

- 정진(아마존 웹서비스 APAC 이사)

하둡이나 클라우드 기술은 미국에서 태동되어 우리나라 IT에 영향을 미치고 있는 중요한 트렌드 중 하나다. 시중에 나와 있는 많은 외국 서적들은 입문자들이 접근하기에 많은 어려움이 있다. 이 책은 입문자들이 하둡이나 클라우드 기술에 좀 더 쉽게 다가갈 수 있도록 도와준다.

- 형용준(싸이월드, 쿠쿠박스 창업자)

[도서 정보&구매]

http://www.yes24.com/24/goods/8225777