메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

한빛랩스 - 지식에 가능성을 머지하다 / 강의 콘텐츠 무료로 수강하시고 피드백을 남겨주세요. ▶︎

IT/모바일

데이터 사이언티스트 : 제너럴 리스트, 스페셜 리스트

한빛미디어

|

2016-03-09

|

by 한빛

14,502

제공 : 한빛 네트워크
저자 : Daniel Tunkelang
역자 : 김상현
원문 : Data Scientists: Generalists or specialists?

그 대답은 회사의 성숙에 대한 수준에 달려있습니다.

2008년에 LinkedIn에서 “데이터 사이언티스트”를 처음 모집할 때에 회사에서는 분명히 제너럴리스트를 원했습니다.
LinkedIn에 도전하세요. 우리는 매우 혁신적인 제품을 만들기 위한 작은 팀을 만들기 위해 분석적인 마인드를 갖고 있는 사람들을 찾고 있습니다.

특별한 테크니컬 스킬은 필요하지 않습니다.(회사에서 SQL, Python, R에 대한 교육을 제공할 예정입니다.) 당신은 매우 영리하고 넓은 배경지식을 가지고 있어야 합니다. 그리고 빨리 배울수 있어야 하며 독립적으로 일을 진행할 수 있어야 합니다. 이 직업은 정말 영리하고 주도적이며 창의적으로 문제를 해결하는데 매우 능숙한 사람에게 완벽한 직업입니다. 당신은 통계, 데이터 마이닝, 프로그래밍, 제품 디자인을 배우게 될 것입니다. 하지만 우리가 가르칠 수 없는 지적 능력과 창의력은 당신이 가지고 있어야 합니다.
반면에 오늘날 데이터 사이언티스트란 직업의 대부분은 높은 수준의 기술들을 요구합니다. 어떤 고용주들은 특정 프로그래밍 언어나 툴 셋에 대한 지식을 요구합니다. 또 다른 곳은 박사 학위나 머신 러닝과 통계에 대한 특별한 학위를 요구하는 곳도 있습니다. 그리고 많은 고용주들은 관련 분야에 경험이 있는 지원자를 선호합니다.

만약 당신이 데이터 사이언티스트들로 팀을 만든다면 제너럴리스트를 선택하겠습니까? 아니면 스페셜 리스트를 선택하겠습니까? 마찬가지로 대부분의 것들은 그것에 의존합니다. 회사가 해결해야 하는 문제의 종류, 팀의 크기, 재능에 대한 당신의 입장을 생각해 보십시오. 그러나 가장 중요한 것은 성숙에 대한 회사의 수준을 고려하는 것입니다.

초기

기업의 초기에는 스페셜리스트보다 제너럴리스트가 더 가치가 있습니다. 왜냐하면 당신은 아무런 사전 준비지식 없이 대부분의 제품을 만들고 무엇인가 없는 것보다 있는게 더 낫기 때문입니다. 당신의 첫 번째 분류는 game-changing 결과를 달성하기 위해 딥 러닝을 사용할 필요가 없습니다. 또한 당신의 첫 번째 추천 시스템도 gradient-boosted decision tree를 사용할 필요가 없습니다. 단순한 t-test 정도면 당신의 A/B 테스트의 요구를 충족시킬 것입니다.

이런 이유로 제품을 만드는 사람은 10년 정도의 머신 러닝 알고리즘을 사용한 경험이나 통계학 박사 학위는 필요하지 않습니다. 초기에는 데이터를 정제하든 네이티브 모바일 앱을 개발하든 원숭이처럼 스택 주위에 올라갈 수 있고 무슨 일이든 할 수 있는 사람이 더 필요했습니다.

뛰어난 제너럴리스트인지 어떻게 확인할 수 있을까요? 이상적으로 그들은 이미 계산, 품질, 이질성에 대한 기술들을 테스트 할 정도로 충분히 거대한 데이터 셋을 가지고 일해온 사람들입니다. 학업이나 직장 내 훈련을 통해서 STEM에 대한 지식을 가지고 있는 사람은 좋은 지원자가 될 수 있습니다. 그리고 어떻게 툴을 사용하는지 배우고 그것을 적절하게 사용할 수 있는 능력과 의지를 보여주는 사람도 확실히 제 주의를 끌 것입니다. 나는 제너럴리스트들을 평가할 때 그들의 다양한 관심사를 보여줄 수 있는 프로젝트를 보여달라고 요청합니다.

나중 단계

제품이 발전할수록 제너럴리스트들은 한계에 부딪치게 됩니다. 그들은 데이터 제품의 초기 버전을 개발하는 데에 열중하기만 할 뿐 그것을 어떻게 발전시켜야 하는지는 관심이 없습니다. 반대로 머신 러닝 스페셜리스트들은 비효율적인 알고리즘을 좀더 나은 방법으로 변경하고 계속해서 시스템들을 튜닝합니다. 기업이 성장하는 단계에서 스페셜리스트들은 기존 시스템들에 추가적인 부분을 도출하는 데에 도움이 됩니다. 만약 당신이 Google이나 Amazon에 있다면 이러한 점진적인 개선들은 놀라운 가치로 나타나게 될 것입니다.

비슷하게 동시에 수천 개의 실험들이 진행되고 상호작용과 새로운 것에 대한 영향, 속성에 대해 걱정이 될 때 직원들이 통계적인 전문지식을 갖고 있는 것은 중요합니다. 이것들은 제1세계 문제이지만, 그들이 정확히 시니어 통계학자를 요구하는 그런 종류의 문제입니다.

뛰어난 스페셜리스트인지 어떻게 확인할 수 있을까요? 머신 러닝이나 실험과 같은 특정 분야에 깊이 있는 경험을 가지고 있는 사람을 찾아야 합니다. 모든 스페셜리스트들은 학위를 가져야만 하는 것은 아니지만 관련 분야에 대한 학력은 전문성에 대한 신뢰할만한 자료이고 그 또는 그녀가 전문분야에 헌신했다는 의미입니다. 간행물과 프리젠테이션도 도움이 됩니다. 제너럴리스트의 영역에서 스페셜리스트를 평가할 때에 그들이 나를 겸손해지게 만들고 무언가 새로운 것을 가르쳐 주기를 원하게 됩니다.

결론

물론 이상적인 데이터 사이언티스트는 팀의 부족한 부분을 보완할 수 있도록 특별한 전문성을 가지고 있는 뛰어난 제너럴 리스트 입니다. 그러나 이상은 유니콘 또는 유니콘의 뿔과 같습니다. 만약 당신이 운 좋게 이러한 희귀 동물들을 찾는다 할지라도 그들이 모든 능력을 발휘할 가능성이 없을 것 같은 일일 지라도 몰두 할 수 있도록 몸부림 칠 것입니다.

자, 이제 제너럴리스트와 스페셜리스트 중 누구를 고용하시겠습니까? 이건 정말로 의존적이긴 하지만 당신의 결정의 큰 요인은 성숙에 대한 회사의 수준이어야만 합니다. 만약 당신이 여전히 확신할 수 없다고 회사가 여전히 빠른 성장 단계에 있다면 제너럴리스트를 선택하는 것이 좋습니다. 당신의 문제들은 아마도 당신이 생각한것 만큼 깊은 수준이 아닐 것입니다. 그래서 제너럴리스트를 고용하는 것이 당신의 부담을 줄여줄 수 있습니다. 더 나아가 제너럴리스트들에게 높은 수준의 스킬을 배울 수 있는 기회를 준다면 모두가 윈윈 할 수 있을 것입니다.
댓글 입력
자료실

최근 본 상품0