http://news.naver.com/main/read.nhn?mode=LSD&mid=shm&sid1=105&oid=003&aid=0005575674
【서울=뉴시스】강지혜 기자 = #1. 학교 과제를 하던 A씨는 박근혜 대통령이 창조경제에 관해 어떤 말을 했는지 궁금했다. 기존 검색 방식으로 '창조경제'를 검색하니 방대한 양의 기사가 쏟아져 나왔다. '창조경제 박근혜'라고 검색해도 박 대통령의 발언만 골라볼 수는 없었다.
A씨는 한국언론진흥재단이 카인즈 홈페이지에서 제공하는 '뉴스 소스' 서비스로 궁금증을 해소했다. 이곳에서 언론에 보도된 박 대통령의 발언만을 골라볼 수 있었다. 검색 기간을 설정해 대선 전 후 발언도 비교했다.
#2. 시민단체에서 일하는 B씨는 부동산 관련 전문가에게 자문할 일이 생겼다. 그는 이 분야에 대한 전문가가 누구인지 알지 못했다. 기존 언론에 자주 인용된 권위 있는 전문가를 찾고 싶었다.
B씨는 뉴스 소스에서 '부동산'이라는 키워드를 검색했다. 정치와 경제, 국제 등 분야별 주요 전문가와 기존 발언이 일목요연하게 정리돼 나왔다. 일일이 기사를 찾아야 하는 번거로움을 덜 수 있었다.
뉴스 소스는 60여 개 매체 2900여 만 건의 대용량 기사를 인물(정보원) 중심으로 재배치한다. 검색어에 대해 어떤 논의가 이뤄졌는지 주요 인물 순서대로 보여준다. 사용자는 기존 기사에서 어떤 인물이 무슨 말을 했는지 쉽게 파악할 수 있다. 서울대학교 차세대융합기술연구원과 빅데이터 센터 등이 공동 연구·개발한 이 서비스는 지난 18일 베타 버전으로 출시됐다.
뉴스 소스 서비스는 기존에 쌓아두기만 했던 방대한 양의 정보를 재가공하는 '빅데이터'(Big Data) 기술을 활용한 예다.
빅데이터는 말 그대로 엄청난 양의 데이터를 의미한다. 스마트폰과 소셜네트워크서비스(SNS) 등이 확산되면서 디지털로 저장되는 정보량이 폭발적으로 늘어나고 있다. 한 연구에 따르면 2015년 전세계에서 생산되는 데이터 규모는 미 의회도서관 인쇄물의 7.9억 배에 달할 것으로 예측된다.
하지만 양만 많다고 모두 빅데이터가 되지는 않는다. 빅데이터는 이른바 '4V'라고 일컫는 특징을 지닌다. 데이터의 양(volume)과 다양한 형태(variety), 빠른 생성 속도(velocity), 가치(value)다. 정형화되지 않은 텍스트와 이미지 등으로 이뤄진 초대용량의 데이터를 활용해 새로운 가치를 만드는 것이 빅데이터의 핵심이다.
빅데이터 기술은 이렇게 많은 양의 데이터를 수집·저장·검색·분석·가공해 새로운 가치를 창출하려는 시도다. 이 과정에서 기존에 알아내지 못했던 새로운 사실도 밝혀낼 수 있다. 미국과 영국, 일본 등에서는 금융·의료·마케팅·정책 등 다양한 분야의 빅데이터를 활용하려는 움직임이 활발하다.
국내에서는 2010년 이후 빅데이터 열풍이 불기 시작했다. 2~3년 전만 해도 슈퍼컴퓨터와 같은 값비싼 장비를 동원해야 방대한 자료를 처리할 수 있었고 시간도 많이 걸렸다. 지금은 하드웨어와 소프트웨어가 발달해 비용이 저렴해졌다. 일반 대학 실험실 안에 있는 장비만으로도 대용량 데이터를 처리할 수 있다. 이에 따라 예전에는 분석할 엄두를 내지 못했던 초대용량 정보를 가지고 새로운 사실을 밝혀내려는 시도가 계속되고 있다.
최근 빅데이터를 분석해 산업 현장에 적용하는 사례가 속속 나오고 있다. 코스콤(한국증권전산)은 트위터와 페이스북 등 소셜네트워크서비스(SNS)에 올라오는 단어를 분석해 주가를 예측하는 시스템을 만들었다. 이 주가 예측 시스템은 적중률이 60%를 웃돌아 충분히 상용화 할 수 있는 수준이다. GS샵은 '하둡(빅데이터 분석 플랫폼)'을 이용해 고객이 이전에 구입한 상품 목록을 분석, 관련 상품을 추천해주고 있다. 파리바게뜨는 날씨 마케팅으로 매출을 높이고 있다. 빅데이터를 분석해 맑은 날씨에는 샌드위치가 잘 팔리고 비가 오는 쌀쌀한 날에는 소시지빵이 가장 잘 팔린다는 사실을 밝혀냈다.
대학들도 활발히 빅데이터 연구를 하고 있다. 서울대는 지난해 4월부터 교수와 연구원이 모여 정기 월례 토론회를 열었다. 6개월여 전 부터는 빅데이터 센터와 포럼을 만들어 160여명의 교수가 학제 간 융합 연구를 하고 있다. 연세대학교 정보대학원은 다음해 3월부터 빅데이터 전문가 과정을 개설한다. 이 곳에서 매년 20여명의 빅데이터 전문가를 양성할 예정이다.
정부도 빅데이터 기술에 촉각을 곤두세우고 있다. 미래창조과학부는 2017년까지 국내 빅데이터 전문 인력 5000명을 양성하겠다고 발표했다. 미래부는 이 분야에서 혁신적 서비스를 만들기 위해 과학기술혁신 관련 법 안에서 개인정보 보호 체계를 일부 완화하는 방안도 검토하고 있다.
전문가들은 다음해 하반기부터 이런 다양한 노력들이 결실을 맺기 시작할 것으로 예상한다. 다양한 산업 분야에 적용해 일상 생활에도 도움이 되는 실질적인 결과물이 나올 것으로 보고 있다.
하지만 빅데이터 전문가를 양성할 수 있는 기반이 부족하다는 점은 문제로 지적된다. 미국 대학들은 이미 빅데이터 과학자와 데이터 분석가 등을 육성하는 석사과정을 운영하고 있다. 국내에서도 몇 년 전부터 빅데이터 연구 기반을 확충해야 한다는 의견이 꾸준히 제기됐다. 그러나 정작 전문가를 양성할 교육 지원에는 소홀하다는 지적이 나온다.
서울대 빅데이터 센터장을 맡고 있는 김형주 서울대 컴퓨터공학과 교수(53)는 "빅데이터 전문가를 키워내려면 전문 석사과정 개설 등 새로운 교육체계가 필요하다"며 "이러한 교과과정을 운영할 수 있는 실질적인 지원이 필요한 상황"이라고 말했다.
jhkang@newsis.com
댓글 없음:
댓글 쓰기