요즘 데이터의 중요성이 크게 부각되고 있다. 회사에서도 데이터를 활용해 의사결정을 하고 성과를 내려고 한다. 처음에는 단순히 인터넷에서 데이터를 찾아 그래프나 표로 만들면 충분할 줄 알았지만, 그게 전부가 아니라는 것을 깨달았다.
데이터를 잘 활용하려면 도구 사용법도 알아야 하지만, 더 중요한 것은 분석 방법이다. 데이터 활용은 크게 세 단계로 나뉜다. 먼저 문제와 목적을 정의하고 가설을 수립하는 1) 생각하는 단계, 분석을 위한 기술과 지식을 적용하는 2)작업하는 단계, 마지막으로 분석 결과를 해석하고 스토리를 구축하는 3)생각하는 단계로 이어진다.
데이터 분석에서 가장 중요한 것은 내가 무엇을 말하고 싶은지 아는 것이다. 대부분 데이터를 다루다 보면 유용한 인사이트가 나오지 않을까 하는 기대로 눈앞의 데이터를 분석하는 것에서 시작하려고 하지만, 그렇게 해서는 데이터를 올바르게 활용한다고 할 수 없다. 데이터 분석은 목적을 이루기 위한 도구일 뿐, 그 자체가 목적이 되어서는 안 된다. 데이터가 직접적인 답을 주지는 않기 때문이다.
따라서 내가 알고 싶은 것이 무엇인지, 그것으로 무엇을 하고 싶은지를 구체적으로 생각해야 한다. 영어 공부할 때 단어와 문법만 외운다고 해서 영어로 소통을 잘하는 게 아닌 것과 마찬가지다. 데이터를 잘 활용하려면 먼저 목적을 정하고, 그다음에 필요한 지표를 선택하고, 현재 상태를 파악하는 순서를 따르는 것이 좋다. 문제의 원인을 찾고, 해결 방법을 생각해낸다. 이 과정에서 계속 올바른 데이터로 올바른 문제를 풀고 있는지 확인해야 한다.
결국 데이터 분석에서 가장 중요한 것은 문제를 정확히 정의하고, 그에 맞는 데이터(지표)를 선택하는 것이다. 데이터 분석은 단순한 숫자가 아니라 그 안에 숨은 이야기와 가치를 찾는 것이 중요하다. 앞으로 데이터 분석은 이러한 사고를 바탕으로 더욱 발전할 것이다.
데이터 '활용'의 중요성과 그 역량을 키우는 데 필요한 접근법에 대해 깊이 생각하게 된다. 특히, 단순히 데이터를 모으는 데 그치지 않고, 그 안에서 의미를 찾아내는 과정이 얼마나 중요한지를 강조함으로써 데이터를 어떻게 효과적으로 분석하고 활용할 수 있는지 생각을 정리하는 데 도움이 된다.
많은 사람들이 데이터 분석을 단순히 숫자를 나열하거나 그래프를 그리는 것으로 이해하지만, 저자는 데이터가 우리에게 직접적인 답을 주지 않는다고 명확히 지적한다. 이는 데이터 분석이 목적이 아니라, 특정 목표를 달성하기 위한 수단이어야 한다는 점을 일깨워 준다. 데이터 활용의 첫 번째 단계는 문제와 목적을 명확히 정의하는 것임을 강조하며, 이는 데이터 분석이 올바르게 이루어졌는지를 가리는 핵심 요소라고 생각한다.
또한, 데이터 활용에서 흔히 저지르는 실수에 대해 언급하며 눈앞의 숫자에만 집중하고 그 의미를 간과하는 것이라 한다. 나 또한 비슷한 경험이 있기 때문에 데이터 문해력(데이터 리터러시)이 왜 더욱 중요해지고, 필요해지는지 알 수 있다. 데이터 문해력은 단순한 기술이 아니라 사고방식이다. 우리가 알고 싶은 것이 무엇인지, 그리고 이를 위해 필요한 데이터가 무엇인지를 명확히 하는 것이 중요하며, 언어를 배우는 과정과도 비슷하다는 생각을 했다(실제로 책에서도 언급된다). 단어와 문법을 암기하는 것만으로는 소통할 수 없듯이, 데이터 역시 그 자체로는 의미가 없다는 것이다.
마지막으로, 데이터와 문제를 올바르게 연결하는 것이 얼마나 중요한지 느꼈다. 문제 정의와 데이터 선택이 일치하지 않으면, 분석 결과는 신뢰할 수 없게 된다. 이 과정에서 논리적 사고와 객관적인 접근이 필수적임을 깨닫게 되었다. 앞으로 데이터 활용 능력을 키우기 위해서는 이러한 사고방식을 지속적으로 연습하고, 다양한 사례를 통해 역량을 길러 나가야겠다는 다짐을 하게 된다.