9 Ideias de projeto para o seu portfólio de Análise de dados

encontrar projetos para o seu portfólio de análise de dados pode ser complicado, especialmente quando você é novo no campo. Você também pode pensar que seus projetos de dados precisam ser especialmente complexos ou vistosos, mas não é esse o caso. A coisa mais importante é demonstrar suas habilidades, idealmente usando um dataset que lhe interessa. E as boas notícias? Os dados estão em toda parte-você só precisa saber onde encontrá-lo e o que fazer com ele.

neste post, destacaremos os elementos chave que o seu portfólio de análise de dados deve demonstrar. Vamos então compartilhar nove ideias de projetos que irão ajudá-lo a construir seu portfólio do zero, com foco em três áreas-chave: raspagem de dados, análise exploratória e visualização de dados.

vamos cobrir:

  1. O que você deve incluir na sua carteira de análise de dados?análise de dados exploratória ideias do projecto de visualização de dados ideias do projecto o que se segue?pronto para se inspirar? Vamos!

    o que deve incluir no seu portfólio de análise de dados?

    análise de dados é tudo sobre encontrar insights que informam a tomada de decisão. Mas esse é apenas o objectivo final. Como qualquer analista de dados experiente lhe dirá, os insights que vemos como consumidores são o resultado de muito trabalho. Na verdade, cerca de 80% de todas as tarefas de análise de dados envolvem a preparação de dados para análise. Isso faz sentido quando você pensa sobre isso-afinal de contas, nossos insights são tão bons quanto a qualidade de nossos dados.sim, o seu portfólio precisa mostrar que pode realizar diferentes tipos de análise de dados. Mas também precisa mostrar que você pode coletar dados, limpá-los, e relatar suas descobertas de uma forma clara e visual. À medida que suas habilidades melhorarem, seu portfólio crescerá em complexidade. Como um novato, você precisará mostrar que você pode:

    • Raspar a web para dados
    • Realizar análises exploratórias
    • Limpar desarrumado conjuntos de dados
    • Comunicar os seus resultados utilizando visualizações

    Se você é inexperiente, ele pode ajudar a apresentar cada item como um mini-projecto da sua própria. Isso torna a vida mais fácil, uma vez que você pode aprender as habilidades individuais de uma forma controlada. Com isso em mente, vamos mantê-lo agradável e simples com algumas idéias básicas, e algumas ferramentas que você pode querer explorar para ajudá-lo ao longo do caminho.o que é raspagem de dados?raspagem de dados é o primeiro passo em qualquer projeto de análise de dados. Envolve puxar os dados (geralmente da web) e compilá-los em um formato utilizável. Enquanto não há escassez de grandes repositórios de dados disponíveis on-line, raspar e limpar os dados você mesmo é uma ótima maneira de mostrar suas habilidades.

    o processo de raspagem da web pode ser automatizado usando ferramentas como Parsehub, ScraperAPI, ou Octoparse (para não codificadores) ou usando bibliotecas como Beautiful Soup ou Scrapy (para desenvolvedores). Seja qual for a ferramenta que você usa, o importante é mostrar que você entende como ela funciona e pode aplicá-la de forma eficaz.

    Antes de raspar um site, certifique-se de que você tem permissão para fazê-lo. Se você não tiver certeza, você pode sempre procurar por um conjunto de dados em um repositório site como o Kaggle. Se ele existe lá, é uma boa aposta que você pode ir direto para a fonte e raspá-lo você mesmo. Tenha em mente-raspagem de dados pode ser um desafio se você estiver minando sites complexos e dinâmicos. Recomendamos começar com algo fácil-um site quase estático. Aqui estão algumas ideias para começar.

    data scringing project ideas

    the Internet Movie Database

    a good beginner’s project is to extract data from IMDb. Você pode coletar detalhes sobre programas de TV populares, críticas de filmes e trivialidades, as alturas e pesos de vários atores, e assim por diante. Os dados do IMDb são armazenados em um formato consistente em todas as suas páginas, tornando a tarefa muito mais fácil. Também há muito potencial aqui para uma análise mais aprofundada.

    portais de trabalho

    muitos iniciantes, como raspar dados de portais de trabalho, uma vez que muitas vezes contêm tipos de dados padrão. Você também pode encontrar muitos tutoriais online explicando como proceder. Para mantê-lo interessante, por que não se concentrar em sua área local? Coletar títulos de trabalho, Empresas, salários, locais, habilidades necessárias, e assim por diante. Isso oferece um grande potencial para visualização posterior, como gráficos de skillsets contra salários.

    e-commerce sites

    outra popular é raspar os dados de produtos e preços de sites de comércio eletrônico. Por exemplo, extrair informações sobre produtos Sobre falantes Bluetooth na Amazon, ou coletar opiniões e preços em vários tablets e laptops. Mais uma vez, isto é relativamente simples de fazer, e é escalável. Isso significa que você pode começar com um produto que tem um pequeno número de opiniões, e, em seguida, subir a escala uma vez que você está confortável usando os algoritmos.

    Reddit

    para algo um pouco menos convencional, outra opção é raspar um site como Reddit. Você pode procurar por palavras-chave particulares, upvotes, dados de usuário, e muito mais. Reddit é um site muito estático, tornando a tarefa agradável e simples. Mais tarde, você pode realizar análises exploratórias interessantes, por exemplo, para ver se há alguma correlação entre posts populares e palavras-chave particulares. O que nos leva à nossa próxima secção.

    Exploratory data analysis project ideas

    What is exploratory data analysis?

    o próximo passo em qualquer técnica de Analista de dados é a capacidade de realizar uma análise exploratória de dados (EDA). Uma EDA olha para a estrutura dos dados, permitindo que você determine seus padrões e características. Eles também ajudam você a limpar seus dados. Você pode extrair variáveis importantes, detectar anómalos e anomalias, e geralmente testar suas suposições subjacentes.embora este processo seja uma das tarefas mais demoradas para um analista de dados, também pode ser um dos mais gratificantes. Modelagem posterior se concentra em gerar respostas a perguntas específicas. Uma EDA, entretanto, ajuda – o a fazer um dos bits mais excitantes—gerando essas perguntas em primeiro lugar.

    linguagens como R e Python são frequentemente usadas para realizar essas tarefas. Eles têm muitos algoritmos pré-existentes que você pode usar para realizar o trabalho para você. A verdadeira habilidade reside na apresentação de seu projeto e seus resultados. Como você decide fazer isso depende de você, mas um método popular é usar uma ferramenta de documentação interativa como o Livro de Jupyter. Isto permite capturar elementos de código, juntamente com texto explicativo e visualizações, tudo em um só lugar. Aqui estão algumas ideias para o seu portfólio.

    Exploratory data analysis project ideas

    global suicide rates

    This global suicide rates dataset covers suicide rates in various countries, with additional data including year, gender, age, population, GDP, and more. Ao realizar sua EDA, pergunte a si mesmo: que padrões você pode ver? Os índices de suicídios estão subindo ou caindo em vários países? Que variáveis (tais como sexo ou idade) pode encontrar que possam estar relacionadas com as taxas de suicídio?no outro extremo da escala, o World Happiness Report segue seis fatores para medir a felicidade em todos os cidadãos do mundo: expectativa de vida, economia, apoio social, ausência de corrupção, liberdade e generosidade. Então, qual é o país mais feliz? Que continente? Que Fator parece ter o maior (ou menor) impacto na felicidade de uma nação? No geral, a felicidade está aumentando ou diminuindo?para além das duas ideias acima, também pode utilizar os seus próprios conjuntos de dados. Afinal, se você já raspou seus próprios dados, por que não usá-los? Por exemplo, se você raspou um portal de emprego, que locais ou regiões oferecem os empregos mais bem pagos? Quem oferece as menos bem pagas? Porquê? Da mesma forma, com os dados do e-commerce, você poderia olhar para quais preços e produtos oferecem a melhor relação custo-benefício.

    em última análise, seja qual for o conjunto de dados que esteja a utilizar, deverá chamar a sua atenção. Se os dados são muito complexos ou não lhe interessam, é provável que fique sem energia antes de ir muito longe. Tenha em mente o que mais sondar você pode fazer para detectar tendências ou padrões interessantes, e para extrair os insights que você precisa.

    compilámos uma lista de Dez grandes locais para encontrar conjuntos de dados gratuitos para o seu próximo projecto aqui.

    ideias do projecto de visualização de dados

    o que é a visualização de dados?raspar, arrumar e analisar dados é uma coisa. Comunicar as suas descobertas é outra. Os nossos cérebros não gostam de ver Números e números, mas adoram imagens. É aqui que entra a capacidade de criar visualizações de dados efetivas. Boas visualizações-sejam estáticas ou interativas—fazem uma grande adição a qualquer portfólio de análise de dados. Mostrar que você pode criar visualizações que são eficazes e visualmente atraentes vai um longo caminho para impressionar um potencial empregador.

    algumas ferramentas de visualização livre incluem o Google Charts, Canva Graph Maker (livre), e Tableau Public. Enquanto isso, se você quiser mostrar suas habilidades de codificação, use uma biblioteca Python, como Seaborn, ou flex suas habilidades R com Shiny. Escusado será dizer que existem muitas ferramentas disponíveis para ajudá-lo. O que você escolher depende do que você está procurando alcançar. Aqui está um pouco de inspiração …

    Ideas do projeto de visualização de dados

    Covid-19

    Tema tópico parece ótimo em qualquer portfólio, e a pandemia não é nada, senão tópico! Além disso, sites como o Kaggle já têm milhares de conjuntos de dados Covid-19 disponíveis. Como você pode representar os dados? Você poderia usar um mapa global de heatmap para mostrar onde os casos dispararam, versus onde há muito poucos? Talvez você possa criar dois gráficos de barras sobrepostos para mostrar infecções conhecidas versus infecções previstas. Aqui está um tutorial útil para ajudá-lo a visualizar os dados Covid-19 usando R, Shiny, e Plotly.Instagram Instagram é um programa de televisão de alta definição que permite a visualização de dados sobre as pessoas mais seguidas no Instagram. Você pode criar um gráfico de barras interativo que acompanha as mudanças nas contas mais seguidas ao longo do tempo. Ou você poderia explorar se as contas da marca ou das celebridades são mais eficazes no influencer marketing. Caso contrário, por que não encontrar outro dataset de mídia social para criar uma visualização? Por exemplo, Este mapa dos EUA pelo cientista de dados Greg Rafferty destaca muito bem a fonte geográfica de trending tópicos no Instagram.

    dados de viagem

    outro tópico que se presta bem à visualização são os dados de transporte. Há grandes tutoriais passo-a-passo lá fora para Como visualizar dados de viagem, dados de voo sendo um exemplo principal. Por exemplo, confira o data scientist Spencer J Fox’s flight data visualizations using ggplot2, a data visualization package for R.

    neste post, nós exploramos quais habilidades cada iniciante precisa demonstrar em seu portfólio de análise de dados. Independentemente do conjunto de dados que está a usar, deverá ser capaz de demonstrar as seguintes capacidades:

    • raspagem da Web—utilizando ferramentas como o Parsehub, A Beautiful Soup ou o Scrapy para extrair dados de sítios Web (lembre-se: as estáticas são mais fáceis!)
    • Exploratory data analysis and data cleaning-manipulating data with tools like R and Python, before drawing some initial insights.visualização de dados-utilizando ferramentas como Tableau, Shiny, ou Plotly para criar painéis crisp, convincentes, e visualizações.

    Uma vez que você domina o básico, você pode começar a ficar mais ambicioso com seus projetos de análise de dados. Por exemplo, por que não introduzir alguns projetos de aprendizado de máquina, como análise de sentimento ou análise preditiva? A coisa chave é começar simples e lembrar que um bom portfólio de análise de dados não precisa ser vistoso, apenas competente.para continuar a desenvolver as suas competências, existem muitos cursos online concebidos para o colocar no caminho certo. Para começar, por que não tentar o nosso curso curto de análise de dados Grátis de cinco dias?

    E, se você quiser saber mais sobre como se tornar um analista de dados e a construção de sua carteira, confira a seguir:

    • Como construir uma análise de dados portfólio
    • O melhor a análise de dados dos programas de certificação no mercado agora
    • Estes são os mais comuns de análise de dados de perguntas da entrevista

Deixe uma resposta

O seu endereço de email não será publicado.