|
|
- 빅데이터의 이해
- 빅데이터의 이해
- 빅데이터의 정의
- 활용하는 데이터 규모에 중점을 둔 정의 : 맥킨지, 2011
- 분석 비용 및 기술에 초점을 맞춘 정의 : IDC, 2011
- 가트너 그룹의 더그 래니의 3V
- Volume(양) : 데이터의 규모 측면
- Variety(다양성) : 데이터의 유형과 소스 측면
- Velocity(속도) : 데이터의 수집과 처리 측면
- 메이어-쇤베르거와쿠기어, 2013
- 빅데이터의 정의를 종합하면 빅데이터를 보는 관점의 범위에 따라 3가지로 정의한다.
- 좁은 범위의 정의 : 3V로 요약되는 데이터 자체의 특성 변화에 초점
- 중간 범위의 정의 : 데이터 자체 뿐 아니라 처리, 분석 기술적 변화까지 포함
- 넒은 범위의 정의 : 인재, 조직 변화까지 포함
- 빅데이터의 정의의 범주 및 효과
- 데이터의 변화
- 규모(Volume)
- 형태(Variety)
- 속도(Velocity)
- 기술 변화
- 새로운 데이터 처리, 저장, 분석
- 기술 및 아키텍쳐
- 클라우드 컴퓨팅 활용
- 인재, 조직 변화
- Data Scientist 같은 새로운 인재 필요
- 데이터 중심 조직
- 효과
- 기존 방식으로는 얻을 수 없었던 통찰 및 가치 창출
- 사업 방식, 시장, 사회, 정부 등에서 변화와 혁신 주도
- 출현 배경
- 출현배경
- 빅데이터 현상은 없었던 것이 새로 등장한 것이 아니라 기존의 데이터, 처리방식, 다루는 사람과 조직 차원에서 일어나는 '변화'를 말한다.
- 빅데이터 출현 배경
- 산업계 - 고객 데이터 축적
- 학계 - 거대 데이터 활용 과학 확산
- 관련기술발전(디지털화, 저장 기술, 인터넷 보급, 모바일 혁명, 클라우드 컴퓨팅)
- 빅데이터 출현에 따른 변화
- 사용자 로그(log) 정보에 대한 프로파일링이 이뤄지기 시작하면서 아이덴티티가 뚜렷해지고 사용자와 광고를 매칭하는 정확도도 향상됨
- 빅데이터는 모바일 시대가 도래하면서 더 빠르게 진화하고 있다.
- 개별 기업의 고객 데이터 축적 및 활용 증가, 인터넷 확산, 저장 기술의 발전과 가격하락, 모바일 시대의 도래와 스마트 단말의 보급, 클라우드 컴퓨팅 기술 발전, SNS와 사물네트워크 확산 등이 맞물려 데이터 생산이 폭발적으로 증가하면서 빅데이터 시대는 대세가 되고 있다.
- 빅데이터 기능
- 차세대 산업혁명에 꼭 필요한 요소
- 산업혁명의 석탄, 철
- 21세기의 원유
- 렌즈
- 플랫폼
- 빅데이터가 만들어 내는 본질적인 변화
- 사전 처리 --> 사후 처리
- 표본 조사 --> 전수 조사
- 질 --> 양
- 인과관계 --> 상관관계
- 빅데이터의 가치와 영향
- 빅데이터의 가치, 가치 산정이 어려운 이유
- 데이터 활용 방식 : 재사용, 재조합(mashup), 다목적용 개발
- 새로운 가치 창출
- 분석 기술 발전
- 빅데이터의 영향
- 매킨지가 언급한 빅데이터가 가치를 만들어 내는 다섯가지 방식
- 빅데이터의 영향
- 기업 : 혁신, 경쟁력 제고, 생산성 향상
- 정부 : 환경 탐색, 성황 분석, 미래 대응
- 개인 : 목적에 따라 활용
- 비지니스 모델
- 빅데이터 활용 사례
- 빅데이터 활용 기본 테크닉
- 연관 규칙 학습 : 어떤 변인들 간에 주목할 만한 상관관계가 있는지를 찾아내는 방법
- 유형분석 : 문서를 분류하거나 조직을 그룹으로 나눌 때, 온라인 수강생들을 특성에 따라 분류할 때
- 유전자 알고리즘 : 최적화가 필요한 문제의 해결책을 자연선택, 돌연벼이 등과 같은 메커니즘을 통해 점진적으로 진화(evolve)시켜 나가는 방법
- 기계 학습 : 훈련 데이터로부터 학습한 알려진 특성을 활용해 예측하는 방법
- 회귀분석 : 독립변수를 조작하며, 종속변수가 어떻게 변하는지를 보면 두 변인의 관계를 파악할 때
- 감정 분석 : 특정 주제에 대해 말하거나 글을 쓴 사람의 감정을 분석
- 소셜 네트워크 분석 : 특정인과 다른 사람이 몇 촌정도의 관계인가를 파악할 때 사용하고 영향력 있는 사람을 찾아낼 때 사용
- 위기 요인과 통제 방안
- 위기 요인
- 사생활 침해
- 책임 원칙 훼손
- 데이터 오용
- 통제 방안
- 동의에서 책임으로
- 결과 기반 책임 원칙 고수
- 알고리즘 접근 허용
- 미래의 빅데이터
- 데이터 : 모든 것의 데이터화
- 기술 : 진화하는 알고리즘, 인공지능
- 인력
- 데이터 사이언티스트 : 빅데이터에 대한 이론적 지식과 숙련된 분석 기술을 바탕으로 통찰력, 전달력, 협업 능력을 두루 갖춘 전문인력으로써 빅데이터의 다각적 분석을 통해 인사이트를 도출하고 이를 조직의 전략 방향제시에 활용할 줄 아는 기획자로서 전문가 역할
- 알고리즈미스트 : 데이터 사이언티스트가 한 일로 부당하게 피해가 발생하는 것을 막는 역할, 알고리즘 코딩 해석을 통해 빅데이터 알고리즘에 의해 부당하게 피해를 입은 사람을 구제하는 전문인력
|
|
|