Làm thế nào để có được công việc đầu tiên của bạn trong Khoa học dữ liệu?

Làm thế nào một người có thể có được công việc cấp đầu tiên của mình là Nhà khoa học dữ liệu hoặc Nhà phân tích dữ liệu? Nếu bạn cuộn qua các diễn đàn khoa học dữ liệu, bạn sẽ tìm thấy nhiều câu hỏi xung quanh chủ đề này. Thỉnh thoảng các độc giả của blog khoa học dữ liệu của tôi (data36.com) cũng hỏi tôi như vậy. Và tôi có thể nói với bạn đây là một vấn đề hoàn toàn hợp lệ!

Tôi đã quyết định tóm tắt câu trả lời của tôi cho tất cả các câu hỏi lớn!

MỚI! Tôi đã tạo một khóa học video trực tuyến toàn diện (miễn phí) để giúp bạn bắt đầu với Khoa học dữ liệu. Bấm vào đây để biết thêm: Làm thế nào để trở thành một nhà khoa học dữ liệu.

ĐĂNG KÝ TẠI ĐÂY (MIỄN PHÍ): https://data36.com/how-to-become-a-data-scientist/

# 1: Các kỹ năng và công cụ khoa học dữ liệu quan trọng nhất là gì? Và làm thế nào bạn có thể nhận được chúng?

Tin tốt - tin xấu.

Tôi sẽ bắt đầu với cái xấu. Trong 90% trường hợp, các kỹ năng mà họ dạy cho bạn tại các trường đại học không thực sự hữu ích trong các dự án khoa học dữ liệu thực tế. Như tôi đã viết nhiều lần, trong các dự án thực tế, cần có 4 kỹ năng mã hóa dữ liệu này:

  • bash / dòng lệnh
  • Con trăn
  • SQL
  • R
  • (và đôi khi Java)
nguồn: KDnuggets

2 hoặc 3 bạn sẽ thấy hữu ích nhất thực sự phụ thuộc vào công ty. Nhưng nếu bạn đã học một thứ, việc học cái khác sẽ dễ dàng hơn nhiều.

Vì vậy, câu hỏi lớn đầu tiên là: làm thế nào bạn có thể có được các công cụ này? Đây là tin tốt! Tất cả các công cụ này là miễn phí! Nó có nghĩa là bạn có thể tải xuống, cài đặt và sử dụng chúng mà không phải trả một xu nào cho chúng. Bạn có thể thực hành, xây dựng một dự án sở thích dữ liệu hoặc bất cứ điều gì!

Gần đây tôi đã viết một bài viết từng bước về cách cài đặt các công cụ này trên máy tính của bạn. Kiểm tra nó ở đây.

# 2: Học như thế nào?

Có 2 cách chính để học khoa học dữ liệu một cách dễ dàng và tiết kiệm chi phí.

1: Sách.

Kinda trường cũ, nhưng vẫn là một cách học tốt. Từ những cuốn sách bạn có thể có được sự tập trung, kiến ​​thức rất chi tiết về phân tích dữ liệu trực tuyến, số liệu thống kê, mã hóa dữ liệu, v.v ... Tôi đã nhấn mạnh 7 cuốn sách tôi giới thiệu trong bài viết trước của tôi, tại đây.

7 cuốn sách dữ liệu hàng đầu tôi khuyên dùng

Thứ 2: Hội thảo trực tuyến và các khóa học video.

Các khóa học trực tuyến về khoa học dữ liệu đang có giá hợp lý ($ 10- $ 500) và chúng bao gồm nhiều chủ đề khác nhau, từ mã hóa dữ liệu đến kinh doanh thông minh. Nếu bạn không muốn chi tiền cho việc này ngay từ đầu, tôi đã liệt kê các khóa học và tài liệu học tập miễn phí trong bài đăng này.

(Lần 3: Khóa học tháng đầu tiên của nhà khoa học dữ liệu trẻ tôi đã tạo ra một khóa học khoa học dữ liệu trực tuyến kéo dài 6 tuần để các nhà khoa học dữ liệu khao khát thực hành và giải quyết các nhiệm vụ thực tế trên bộ dữ liệu thực tế: Tháng đầu tiên của nhà khoa học dữ liệu Junior .)

# 3: Cách luyện tập và cách trải nghiệm thực tế

Đây là một khó khăn, phải không? Mọi công ty đều muốn có những người có ít nhất một chút kinh nghiệm thực tế ngoài đời Nhưng làm thế nào để bạn có được trải nghiệm thực tế, nếu bạn cần kinh nghiệm thực tế để có được công việc đầu tiên? Bắt cổ điển-22. Và câu trả lời là: dự án thú cưng.

Dự án Pet Pet có nghĩa là bạn nghĩ ra một ý tưởng dự án dữ liệu khiến bạn phấn khích. Sau đó, bạn chỉ cần bắt đầu xây dựng nó. Bạn có thể nghĩ về nó như một khởi nghiệp nhỏ, nhưng hãy chắc chắn rằng bạn tiếp tục tập trung vào phần khoa học dữ liệu của dự án và bạn có thể bỏ qua phần kinh doanh. Để cho bạn một số ý tưởng, đây là một số dự án thú cưng của tôi trong vài năm qua:

  • Tôi đã xây dựng một kịch bản theo dõi một trang web bất động sản và gửi email cho tôi các giao dịch tốt nhất trong thời gian thực - để tôi có thể nhận được các giao dịch này trước mọi người khác.
  • Tôi đã xây dựng một kịch bản kéo tất cả các bài báo từ ABC, BBC và CNN và, dựa trên các từ được sử dụng, kết nối các bài viết về cùng một chủ đề trên 3 cổng thông tin khác nhau.
  • Tôi đã xây dựng một chatbot tự học bằng Python. (Mặc dù nó không quá thông minh - vì tôi chưa đào tạo nó.)

Sáng tạo! Tìm một dự án khoa học thú cưng liên quan đến khoa học dữ liệu cho chính bạn và bắt đầu mã hóa! Nếu bạn gặp vấn đề về mã hóa - điều đó có thể dễ dàng xảy ra, khi bạn bắt đầu học một ngôn ngữ dữ liệu mới - chỉ cần sử dụng google và / hoặc stackoverflow. Một ví dụ ngắn của tôi - về cách stackoverflow hiệu quả là:

bên trái: câu hỏi của tôi - bên phải: câu trả lời (trong 7 phút)

Chú ý dấu thời gian! Tôi đã gửi một loại câu hỏi phức tạp và tôi đã nhận được câu trả lời sau 7 phút. Điều duy nhất tôi cần làm là sao chép-dán mã vào mã sản xuất của mình và bùng nổ, nó chỉ hoạt động!

(Lưu ý: Xác thực chéo là một diễn đàn tuyệt vời khác cho các câu hỏi liên quan đến Khoa học dữ liệu.)

Đề xuất +1:

Ngay cả khi nó hơi khó khăn một chút, hãy cố gắng để có một người cố vấn. Nếu bạn đủ may mắn, bạn sẽ tìm thấy một người làm việc trong vai trò Nhà khoa học dữ liệu tại một công ty tốt và có thể dành 1 giờ mỗi tuần hoặc hai tuần một lần với bạn và thảo luận hoặc giảng dạy mọi thứ.

# 4: Nơi nào và làm thế nào để bạn gửi đơn xin việc đầu tiên?

Nếu bạn không tìm được người cố vấn, bạn vẫn có thể tìm thấy người đầu tiên tại công ty đầu tiên của mình. Đây sẽ là công việc liên quan đến khoa học dữ liệu đầu tiên của bạn, vì vậy tôi khuyên bạn không nên tập trung vào số tiền lớn hoặc vào một bầu không khí khởi nghiệp siêu lạ mắt. Tập trung vào việc tìm kiếm một môi trường nơi bạn có thể học hỏi và cải thiện bản thân.

Nhận công việc khoa học dữ liệu đầu tiên của bạn tại một công ty đa quốc gia có thể không phù hợp với ý tưởng này, bởi vì mọi người thường quá bận rộn với công việc của họ, vì vậy họ sẽ không có thời gian hoặc / và động lực để giúp bạn cải thiện (tất nhiên, luôn luôn có ngoại lệ).

Bắt đầu từ một công ty khởi nghiệp nhỏ với tư cách là người dữ liệu đầu tiên trong nhóm cũng không phải là ý tưởng hay trong trường hợp của bạn, bởi vì các công ty này không có những người làm dữ liệu cao cấp để học hỏi.

Tôi khuyên bạn nên tập trung vào 50 công ty cỡ 500500500. Đó là ý nghĩa vàng. Các nhà khoa học dữ liệu cao cấp đang ở trên tàu, nhưng họ không quá bận rộn để giúp đỡ và dạy bạn.

Được rồi, bạn đã tìm thấy một số công ty tốt. Làm thế nào để áp dụng? Một số nguyên tắc cho CV của bạn: nêu bật các kỹ năng và dự án của bạn, chứ không phải kinh nghiệm của bạn (vì bạn chưa có quá nhiều năm để viết ra giấy). Liệt kê các ngôn ngữ mã hóa có liên quan (SQL và Python), bạn sử dụng và liên kết một số repos github liên quan của bạn, để bạn có thể cho thấy rằng bạn thực sự đã sử dụng ngôn ngữ đó.

Ngoài ra, trong hầu hết các trường hợp, các công ty yêu cầu thư xin việc. Tất nhiên, đây là một cơ hội tốt để thể hiện sự nhiệt tình của bạn, nhưng bạn cũng có thể thêm một số chi tiết thực tế, như những gì bạn sẽ làm trong vài tuần đầu tiên nếu bạn được tuyển dụng. (Ví dụ: Nhìn vào luồng đăng ký của bạn, tôi đoán trang web ____ đóng vai trò quan trọng. Trong vài tuần đầu tiên, tôi thực hiện ___, ___ và ___ (phân tích cụ thể) để chứng minh giả thuyết này và hiểu sâu hơn về giả thuyết này. Nó có thể giúp công ty cải thiện _____ và cuối cùng thúc đẩy _____ KPIs.

Hy vọng rằng điều này sẽ giúp bạn có một cuộc phỏng vấn xin việc, nơi bạn có thể trò chuyện một chút về các dự án thú cưng của bạn, đề nghị thư xin việc của bạn, nhưng chủ yếu sẽ là kiểm tra sự phù hợp với tính cách và có lẽ là một số bài kiểm tra kỹ năng cơ bản. Nếu bạn đã luyện tập đủ, bạn sẽ vượt qua điều này nhưng nếu bạn thuộc tuýp người lo lắng và bạn muốn luyện tập nhiều hơn, bạn có thể làm điều đó trên hackerrank.com.

Phần kết luận

Vâng, đó là nó. Tôi biết nó nghe có vẻ dễ hơn khi được viết, nhưng nếu bạn thực sự quyết tâm trở thành Nhà khoa học dữ liệu, sẽ không có vấn đề gì để biến nó thành hiện thực! Chúc may mắn với điều đó!

Nếu bạn muốn thử sức, giống như một nhà khoa học dữ liệu cơ sở tại một công ty khởi nghiệp thực sự, hãy xem khóa học khoa học dữ liệu trực tuyến 6 tuần của tôi: Tháng đầu tiên của nhà khoa học dữ liệu Junior!

Và nếu bạn muốn tìm hiểu thêm về khoa học dữ liệu, hãy kiểm tra blog của tôi (data36.com) và / hoặc đăng ký nhận Bản tin của tôi! Và đừng bỏ lỡ loạt bài hướng dẫn mã hóa mới của tôi: SQL để phân tích dữ liệu!

Cảm ơn vì đã đọc!

Rất thích bài viết? Xin vui lòng chỉ cho tôi biết bằng cách nhấp vào bên dưới. Nó cũng giúp người khác nhìn thấy câu chuyện!

Tomi Mester tác giả của dữ liệu36.com Twitter: @ data36_com