Netflix Movies and TV Shows (1) About Netflix
앞으로 4개의 캐글 노트북에 대한 글을 정리하려 합니다.
첫번째 캐글은 Netflix Movies and TV Shows 라는 데이터셋입니다. 개인적인 논리적 흐름을 고민하는 데 있어 Netflix Research에서 Analytics와 관련된 아티클을 공부했습니다. 필요하신 분들은 꼭 참고하시면 좋을 것 같습니다.
시작
바로 EDA에 들어가기 앞서, Netflix라는 기업과 그 비즈니스, 그리고 Data analytics의 목표와 과제가 무엇인지
먼저 확인한 후 이후의 과정을 진행하는 것이 필수적이라고 생각합니다.
따라서 이번 포스팅에서는 도메인에 대한 이해와 Netflix 내의 데이터 팀이 어떤 역할을 수행하는지 먼저 탐구해보겠습니다.
도메인에 대한 이해
Netflix는 다양한 장르의 영화, 다큐멘터리, 드라마에 대한 스트리밍 서비스를 지원합니다.
전 세계적으로 수천개의 콘텐츠를 제작하는만큼 전체적인 상황을 살피는 것이 중요합니다.
그 이유는, 해당 국가마다 선호하는 장르 혹은 배우, 유형, 작품의 길이 등 고유한 특징을 지닐 수 있습니다.
따라서, 이를 종합하여 각 국가의 선호도에 맞는 경영 전략을 펼칠 수 있다면 이탈 유저를 줄이고, 기존의 고객을
활성 유저로 전환시키는 것에 기여할 수 있을 것입니다.
Netflix의 Data analytics 팀의 궁극적 목표는 the highest impact를 가진 프로젝트를 통해 netflix가 고객에게
최상의 제품을 전달하는 것이라고 합니다.
현재 주어진 데이터의 칼럼은 실제 현업의 데이터와 비교했을 때 현저히 한정된 데이터이지만,
이를 가지고 분명 거시적인 동향과 상태를 추적하는 것에는 유의미한 인사이트를 추출할 수 있을 것이라 생각합니다.
Analytics at Netflix: Who We Are and What We Do by Molly Jackman & Meghana Reddy
Netflix의 Data Science group and Engineering group은 “Analytics Engineers” and “Visualization Engineers”로 크게 나뉩니다.
Purpose of the analytics role at Netflix
Data is used to inform a wide range of questions
- “How can we make the product experience even better?”
- “Which shows and films bring the most joy to our members?”
- “Who can we partner with to expand access to our service in new markets?”
Business verticals at Netflix
- Product
- Content
- Membership
- Studio
- Marketing
- Platform
Under “Context not control” culture.
What does the job entail? (What do they actually do?)
Most important characteristics are 1. Deep business context 2. Technical excellence
Three roles
The Analyst
- Delivering metrics, findings, or dashboards that drive analytical insights and business decisions.
The Engineer
- Enjoys making data available by piping it in from new sources in optimal ways,
building robust data models, prototyping systems, and doing project-specific engineering.
- Enjoys making data available by piping it in from new sources in optimal ways,
The Visualizer
- Is passionate about the scalability, beauty, and functionality of dashboards and their capability for telling a visual story.
My fit
저는 개인적으로 위의 세 가지 롤 중, The visualizer > The analyst > The engineer 에 관심이 있습니다. 시각화라는 것에 정답이 없고, 어떻게 표현하느냐가 인사이트를 판단하거나 스토리를 전달하는 데 많은 영향을 미친다고 생각합니다.
Dataset을 통해 알아보고 싶은 것
- 가장 많이 콘텐츠를 소비하는 국가는 어디인가?
- 각 국가마다 가장 인기있는 장르는 무엇인가?
- 각 국가마다 시청등급은 어떤 분포를 보이는가?
업로드 주소
해당 주피터 노트북은 여기에
지속적으로 업데이트 할 예정이니 전체 코드가 궁금하신 분들은 확인해주세요.
Just do it & Keep steady
댓글남기기