견고한 분석 – (3) 읽은 데이터에서 더 얻는 방법

“대부분의 사람들은 읽는 방법을 배우는데 오랜 시간이 걸린다는 사실을 모른다. 나는 8년이 걸렸고 지금도 완전하다고 말할 수 없다.” 괴테(Johan wolfgang Von Goethe)가 한 말입니다.

book-1840910_1920

데이터 분석 방법을 책 읽는 방법에 비유할 수 있을지 모르겠으나 데이터 분석 방법을 배우는데도 오랜 시간이 걸립니다. 많은 사람들은 데이터 분석 방법을 배우는 것을 자전거 타는 법을 배우는 것처럼 특별히 빠른 방법이 있다고 생각하거나 배우고 나면 평생 잊어버리지 않기를 바랍니다. 그리고 데이터 분석 방법을 배우는 것을 분석 도구의 기능을 익히는 것이라 생각하기도 합니다. 모든 배움의 과정에 왕도가 있는 게 아닌 것처럼 분석 방법을 배우는 데도 쉬운 방법이 있는 건 아닙니다. 하지만 오랫동안 데이터가 말하는 것을 듣고 분석을 하다 보면 데이터와 대화를 하는 좋은 경험을 하게 될 것입니다.

잘못된 분석 습관은 오히려 해가 될 수 있습니다. 피해야 할 분석 습관은 다음과 같습니다.

첫째, 분석은 데이터 하나하나를 읽는 것이 아니다.
둘째, 분석은 분석 방법론을 힘들게 배워서 이루어 내는 것이 아니다.
셋째, 분석은 손가락이나 마우스로 데이터를 따라가며 기계적으로 데이터를 읽는 것이 아니다.

진정한 분석이란?

데이터 분석은 사유입니다. 분석은 데이터에 담긴 의미를 캐내어 현상과 비교하고 균형을 잡거나 경험에 적용하는 것입니다. 분석이나 사유는 지극히 정신적이고 심리적인 과정이므로 배우기 어렵고 의식적으로 끊임없이 노력하지 않으면 효과를 볼 수도 없지만 오랫동안 갈고 닦으면 수준이 높아집니다. 분석은 사유이고 연구이며 도전입니다. 제대로 분석하는데 성공한다면 분석은 분석가와 데이터가 함께하는 여행이 됩니다. 데이터와 분석가는 말없이 대화를 나눕니다. 분석가는 데이터가 무슨 애기를 하는지 묻고, 타당성을 따지고 자료의 유용성을 검토합니다. 분석은 결코 수동적으로 받아들이기만 하는 과정이 아닙니다. 데이터를 이해하고 파악하기 위해 데이터를 마음껏 흡수하는 활동입니다. 여기에는 마음과 정신의 적극적인 활동이 요구됩니다.

moon-1815984_1920

분석은 계획이다.

분석 보고서(결과)의 효율을 높이려면 우선 분석 능력과 데이터에 대한 이해력을 향상시켜야 합니다. 분석 보고서가 나쁜 까닭은 대부분 가장 기본이 되는 분석 기술이 부족하기 때문입니다. 경험이 많은 분석가는 전체 작업에 걸쳐 철저한 분석 계획을 세우고 실천에 옮깁니다. 분석을 잘하는 사람은 다음의 세가지 목표를 가지고 분석을 합니다.

(1) 데이터에 집중한다. 분석 자료에 대한 배경 지식이 부족하더라도 잡생각을 떠올리지 말고 집중해서 읽는다. 또 분석 기술이 부족하더라도 주의가 흐트러지지 않도록 애쓴다.
(2) 가능한 많은 것을 분석하려 노력한다.
(3) 개인적인 경험을 분석 내용과 연관시키거나 적용하려고 노력한다, 이렇게 하면 데이터에 대한 이해가 잘될 뿐 아니라 개인적 경험이 지혜로 변하는 과정을 느끼게 된다.

경험이 많은 분석가는 다음과 같은 세가지 방식으로 분석을 합니다.

(1) 훑어보기
(2) 주의 깊게 분석하기
(3) 집중해서 분석하기

자료의 특성과 자신의 목표에 맞게 세가지 유형을 골라서 써야 합니다. ‘훑어보기’는 특별한 사실을 찾거나 주제나 키워드를 찾을 때 씁니다. 이것은 main data 이외의 데이터를 분석할 때 유용합니다. ‘주의 깊게 분석하기’는 찾아야 할 것이 무엇인지부터 알아야 합니다. 이것은 핵심 내용을 뒷받침하는 세부 사항들을 찾으려 할 때 씁니다. ‘집중해서 분석하기’는 핵심이 되는 데이터를 찾아서 전(all) 데이터와 자료를 분석할 때나 핵심 데이터의 키워드를 분석할 때 씁니다. 절대 놓쳐서는 안 되는 요약(summary) 데이터를 분석할 때도 사용합니다. ‘집중해서 분석하기’는 긴 시간을 투자하기 보다 짧은 간격으로 하는 것이 더 효과적입니다.

notes-514998_1920

계획을 짜서 분석을 해야 분석 능력이 향상됩니다. 분석 능력을 키우려면 다음 세 가지가 수반되어야 합니다.

(1) 찾아야 할 것에 대한 정확한 인식 능력을 향상시키는 것
(2) 이해력을 향상시키는 것
(3) 모든 데이터 다 분석하려 하지 말고 분석하는 행 수를 줄여 분석 속도를 높이는 것

그리고 계획적인 분석을 위해서는 두 가지 목표를 세워야 합니다. 두 가지 목표는 핵심 주제 파악하기와 핵심 주제 모으기 입니다. 한 번에 여러 핵심 주제를 보고 이런 핵심 주제에 집중하면 분석 범위와 데이터에 대한 이해가 넓어지고 속도는 빨라 집니다. 분석을 잘하지 못하는 주된 원인은 훈련이 부족한 탓입니다. 특별히 찾고자 하는 바 없이 데이터를 분석해 간다면 아무것도 얻지 못합니다. 핵심 주제를 중심으로 데이터를 읽으면 데이터가 더 쉽게 이해되고, 핵심 주제들로 전체적인 맥락을 잡아 두면 뒤죽박죽 섞인 데이터 때문에 분석이 어지러워 지는 것을 피할 수 있습니다.

나쁜 분석 습관과 습관을 고치는 방법

(1) 자주 멈추기
데이터가 말하는 것을 잘 들으려면 분석 중간에 너무 자주 멈추지 말아야 한다.

(2) 되돌아가기
데이터나 인자들을 확인하려고 되돌아갈 수는 있으나 습관적으로 되돌아가서는 안 된다. 맥락을 자주 놓치게 된다.

(3) 대화하지 않기
동료 분석가나 업무 전문가들과 분석 작업에 대해 대화하지 않는 것은 데이터와 대화하지 않는 것과 동일하다.

(4) 다양한 분석 방법론을 활용하지 않는 것
분석을 할 때는 분석방법론에 대한 자료나 책을 곁에 두라. 그리고 어려운 문제를 만났을 때 반드시 찾아보라.

(5) 어떤 것도 찾아내려 하지 않는 것
분석을 할 때는 명확한 목적 의식을 가져야 한다. 목표와 부합하는 핵심 내용을 발견하면 데이터가 드러내 놓은 것을 이해하려고 애쓰라.

출처 : 한국데이터진흥원

제공 : 데이터 전문가 지식포털 DBguide.net

Advertisements

답글 남기기

아래 항목을 채우거나 오른쪽 아이콘 중 하나를 클릭하여 로그 인 하세요:

WordPress.com 로고

WordPress.com의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Twitter 사진

Twitter의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Facebook 사진

Facebook의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Google+ photo

Google+의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

%s에 연결하는 중