Como criar seu portfólio de Data Scientist e divulgar seus trabalhos

Saiba como divulgar seus trabalhos de Data Science e ser visto na multidão

Beleza, você chegou até aqui. Você aprendeu sobre Machine Learning e Data Science nos últimos meses; criou conexões com empresas e profissionais da área; leu todos os artigos do meu blog (;-D) e sente que está na hora do seu primeiro emprego como Cientista de Dados. Só tem um problema: ninguém conhece você.

O portfólio de um cientista

Para um Data Scientist, um portfólio é tão importante quanto as experiências e habilidades que este adquiriu nos últimos anos. É o momento onde você mostra todos seus conhecimentos para empresas e profissionais interessados em você. Neste artigo eu trago algumas dicas de como melhorar seu leque de trabalhos realizados e ser visto pelo mundo todo. Confira:

1. Crie um blog

Quando criei este blog, eu tinha dois objetivos em mente. O primeiro: eu queria melhorar o cenário de Data Science no Brasil. Eu sofri caçando conteúdos sobre a área quando comecei a aprender e tive que me aventurar por sites gringos para acessar tal informação. E já que eu estava fazendo isso, por que não divulgar meus trabalhos aqui também?

É na seção Portfólio deste site que eu publico os últimos trabalhos que realizei como Data Scientist. Fazendo isso eu mato dois coelhos com uma cajadada só, primeiro porque eu consigo atrair pessoas aspirantes a Cientista de Dados, que visualizarão meus tutoriais e artigos sobre a área, aumentando o interesse em nosso país; em segundo, eu consigo mostrar a empresas e profissionais da área as minhas habilidades e trabalhos já realizados.

Quando alguém vê você usando bem o Github

2. Use e abuse do Github

Você já ouviu falar que o Github é o currículo do programador? Essa fama não é a toa. Empresas utilizam frequentemente o Github para analisar as habilidades de desenvolvimento de um candidato. Caso ainda não tenha, crie uma conta imediatamente e comece a criar repositórios para seus projetos. Se você não souber como usar a ferramenta, sugiro ler essa série de artigos do Luciano Ratamero sobre melhores práticas no uso do Git e Github.

Se quiser, pode até dar uma olhada no meu perfil no Github para se basear. =)

3. Participe de competições

Você já ouviu falar no site Kaggle? Ele é um dos melhores sites de competições de Data Science e Machine Learning disponíveis na Internet. Em grande parte desses desafios você deverá resolver problemas reais e pode até ganhar uma grana nesse processo — em 2009 o Netflix pagou U$ 1 mi para quem conseguísse melhorar seu algoritmo.

A grande vantagem do Kaggle é que a medida que você participa de desafios, seu perfil é prestigiado com medalhas. Além disso, muitas empresas utilizam o Kaggle como ferramenta para localizar profissionais.

Outra boa opção é o site HackerRank. Aqui você pode realizar desafios diários de programação, fortalecendo seu perfil e mostrando ao mundo suas habilidades em programação.

4. Crie projetos

Você também pode criar projetos avulsos sobre um determinado assunto. Talvez você queira se especializar no ramo da saúde — muito explorado em Data Science — ou financeiro, quem sabe até política. Sendo assim, procure por datasets — conjuntos de dados, em tradução livre — e extraia respostas deles. Faça gráficos, realize Insights, questione e, por fim, publique os seus resultados.

Há inúmeras fontes para você localizar datasets para trabalhar. Você pode usar a seção Dataset do Kaggle, pode utilizar os dados do FiveThirtyEight — esses caras são demais — e pode, inclusive utilizar conjuntos de dados brasileiros, disponíveis no Portal Brasileiro de Dados Abertos. Quer mais? Dá uma olhada nessa incrível matéria do Dataquest sobre outros lugares para encontrar datasets.

Algumas pessoas no Reddit não são muito gentis. Tenha paciência.

5. Não se esqueça do Reddit

O Reddit é um site pouco conhecido no Brasil, mas muito difundido no exterior. Conhecido como “A página inicial da Internet”, o site funciona como um fórum, dividindo assuntos em categorias facilmente acessíveis. As categorias que mais gosto de publicar meus trabalhos são: Data Science, Machine Learning e Brasil.

6. Escreva em dois idiomas

É importante também divulgar seus trabalhos em duas línguas diferentes. Eu, por exemplo, optei por fazê-lo em Português e Inglês, já que um deles é meu idioma nativo e o outro é um dos mais falados no mundo. A minha dica para você é fazer o mesmo, mas, caso esteja mirando em um país específico — digamos, Alemanha —, você pode substituir o Alemão por uma dessas línguas — ou adicionar, o que seria melhor.

Lembra da minha dica do Reddit? Aconselho fortemente divulgar links em Inglês por lá. Já compartilhei meus projetos em Português e no idioma do Tio Sam e tive uma taxa de cliques muito maior quando coloquei em Inglês.

E aí, curtiu as dicas para criar seu portfólio? Tem outras para acrescentar? Diz pra gente nos comentários. Obrigado pela presença e até a próxima!

Já que está aqui, leia:

Como estudar Data Science sem gastar um centavo

Como ser um Data Scientist no Brasil?

Aprenda a fazer um Analisador de Sentimentos do Twitter em Python

--

--