QA ≠ Test

QA(품질 보증)는 개념적인 용어이고, TEST는 QA(품질 보증)를 하기 위한 수단이자 방법이다.

TESTING/PROGREMING

[데이터 사이언스 코딩] 오해와 진실 사이 그것이 알고 싶다.

품생품사(品生品死) 2021. 7. 6. 01:01
반응형

데이터 사이언스에 대한 오해와 진실. 그것이 알고 싶다.

데이터 사이언스라는 말이 유행? 이 되면서 그에 따른 오해들이 많이 생겨나고 있습니다. 오늘은 그 오해 몇 가지에 대해서 이야기를 해보려 합니다. 사실 4차 산업이라고 해서 인공지능 딥러닝만 있는 것은 아니지만 데이터 사이언스에서 가장 중요하고, 앞으로 해야 하는 것을 사람들은 인공지능과 딥러닝으로 단정을 해버리는 오해가 생기고 있는 것 같습니다.

 

This is data_science_0001
4차 산업 혁명 이미지

 

간단하게 정리를 하면 데이터 사이언스에는 다양한 유형이 존재한다고 하고 리스트는 아래와 같습니다.

✔ 데이터 사이언스 VS 데이터 아키텍트

✔ 데이터 사이언스 VS 데이터 엔지니어

✔ 데이터 사이언스 VS 통계학자

✔ 데이터 사이언스 VS 비즈니스 애널리스트

 

두 번째 오해는 바로 데이터 사이언티스트들은 매일같이 컴퓨터랑 수학만 할 것 같다라고 생각하는 부분입니다. 사실 수학과 통계 프로그래밍 모두 중요하기는 하지만 그것이 전부가 아니기 때문인데요. 데이터 사이언스의 목표는 데이터를 모아서 정리하고, 가공하여 사업 혹은 자신이 하는 일에 대해 가치를 더하고, 문제를 해결하는 것이 목표입니다.

 

문제점을 분석하고, 해결해나가기 위한 능력을 키우는 것 또한 데이터 사이언티스트들에게는 매우 중요한 부분입니다. 비즈니스나 개인의 문제점을 파악하기 위해서는 팀원, 동료, 혹은 거래처, 고객들과의 소통을 통해서 문제점을 파악해야 하기 때문에 커뮤니케이션 스킬 또한 중요합니다. 의미 있는 데이터를 모으기 위해서는 엔지니어와도 항상 소통해야 할 것이며, 발견된 내용을 공유하는 것도 중요할 것입니다.

 

데이터 사이언스의 과정과 진실

 

This is data_science_0002
데이터 사이언스 과정 피라미드

 

데이터 사이언스를 제대로 하기위해서는 이 피라미드의 아래쪽(데이터를 모으는 과정 / 데이터를 옮기고 저장하는 과정 / 데이터를 정리하는 과정)서부터 그러니까 데이터 엔지니어링의 단계를 거쳐야 하는 것입니다. 하지만 인터넷이나 언론에서 너무 인공지능과 딥러닝에 대해서만 너무 강조를 하다 보니까 정작 중요한 데이터 엔지니어링 영역이 무시되고 있는 것입니다.

 

현재 재직중인 회사에서도 AI(인공 지능)에 대해서 상품화하기 위한 노력을 많이 하고 있으며, 이를 베이스 하기 위한 데이터를 다룰 수 있는 조직을 함께 육성하고, 조금씩 상품이나 서비스에 접목하면서 효과를 보고 있습니다. 또한, 위 피라미드의 인공지능을 제외한 영역은 적은 노력으로 많은 가치를 얻을 수 있는 영역으로 조금만 신경 쓴다면 인공지능은 자연스럽게 접근하지 않을까 싶습니다. 결론적으로 피라미드의 영역은 ROI(Returen on Investment)를 의미하는 것이기 때문에 기업에서 필요한 것이 무엇인지? 혹은 내가 필요로 하는 것이 무엇인지 명확히 하여 접근점을 잡는 것도 좋은 방법이라 생각됩니다.

 

📌 인공지능과 딥러닝 기술이 정말 고도화된 기술이라는 것은 너무 잘 알고 있습니다. 하지만 위에서도 확인 할 수 있듯이 수학과 통계, 프로그래밍도 중요하지만 커뮤니케이션과 문제 해결 능력도 갖추어야 하는 사람들이 바로 데이터 사이언티스트입니다.

📌 요약된 결론은 "기술력만 갖춘다고 데이터 사이언티스트가 될 수는 없다." 입니다.

 

This is data_science_000
Data Science

요약 : sparta coding club, 스파르타 코딩, 코드잇, 노마드 코더, 프로그래밍, 직장인 코딩, 내일 배움 카드 코딩, 밀크티 코딩, 초등 코딩, 아이스크림 코딩, 코딩 소프트웨어, 구글 데이터 스튜디오, 데이터 웨어 하우스 , 빅 데이터 클라우드

반응형