9 Projektiideat Data Analytics portfoliosi

projektien löytäminen data analytics portfolioosi voi olla hankalaa, varsinkin kun olet uusi alalla. Saatat myös ajatella, että dataprojektejesi täytyy olla erityisen monimutkaisia tai näyttäviä, mutta näin ei ole. Tärkeintä on osoittaa taitosi, mieluiten käyttämällä aineistoa, joka kiinnostaa sinua. Entä hyvät uutiset? Tietoa on kaikkialla-sinun tarvitsee vain tietää, mistä se löytyy ja mitä tehdä sen kanssa.

tässä viestissä korostamme keskeisiä elementtejä, jotka data-analytiikkaportfoliosi tulisi osoittaa. Sitten jaamme yhdeksän projektiideaa, jotka auttavat sinua rakentamaan portfoliosi tyhjästä, keskittyen kolmeen avainalueeseen: tietojen kaavintaan, eksploratiiviseen analyysiin ja tietojen visualisointiin.

käsittelemme:

  1. mitä sinun pitäisi sisällyttää data-analytiikkaportfolioosi?
  2. Data scraping project ideas
  3. Eksplorative data analysis project ideas
  4. Data visualization project ideas
  5. What ’ s next?

valmis innostumaan? Mennään!

mitä sinun pitäisi sisällyttää data-analytiikkaportfolioosi?

Data-analytiikassa on kyse päätöksentekoa informoivien oivallusten löytämisestä. Mutta se on vasta päätavoite. Kuten jokainen kokenut data-analyytikko kertoo, kuluttajina näkemämme oivallukset ovat suuren työn tulosta. Itse asiassa noin 80% kaikista data-analytiikan tehtävistä sisältää tietojen valmistelun analysointia varten. Tämä käy järkeen, kun asiaa ajattelee—loppujen lopuksi meidän oivalluksemme ovat vain yhtä hyviä kuin datamme laatu.

Kyllä, portfoliosi on osoitettava, että voit tehdä erityyppisiä data-analyysejä. Mutta sen on myös osoitettava, että voit kerätä tietoja, puhdistaa ne ja ilmoittaa havainnoistasi selkeällä, visuaalisella tavalla. Kun taitosi paranevat, portfoliosi monimutkaistuu. Aloittelijana sinun on kuitenkin näytettävä, että voit:

  • kaapia verkosta tietoa
  • suorittaa eksploratiivisia analyysejä
  • puhtaat epäsiistit aineistot
  • viestittää tuloksesi visualisointien avulla

Jos olet kokematon, se voi auttaa esittämään jokaisen kohteen omana miniprojektinaan. Tämä helpottaa elämää, sillä yksilötaitoja voi oppia hallitusti. Tämä mielessä, pidämme sen mukava ja yksinkertainen joitakin perusideoita, ja muutamia työkaluja haluat ehkä tutkia auttaa sinua matkan varrella.

Data scraping project ideas for your portfolio

What is data scraping?

tietojen kaavinta on ensimmäinen vaihe kaikissa data-analytiikkaprojekteissa. Siihen kuuluu datan vetäminen (yleensä verkosta) ja sen kokoaminen käyttökelpoiseen muotoon. Vaikka ei ole pulaa suuri tietovarastoja saatavilla verkossa, kaavinta ja puhdistus tiedot itse on hyvä tapa keuliminen taitosi.

web-kaavinta voidaan automatisoida työkaluilla kuten Parsehub, ScraperAPI tai Octoparse (ei-koodaajille) tai käyttämällä kirjastoja kuten Beautiful Soup tai Scrapy (kehittäjille). Kumpi työkalu käytät, tärkeintä on osoittaa, että ymmärrät, miten se toimii ja voi soveltaa sitä tehokkaasti.

ennen kuin kaavit sivuston, varmista, että sinulla on siihen lupa. Jos et ole varma, voit aina etsiä aineistoa arkiston sivustolta, kuten Kaggle. Jos se on olemassa siellä, voit mennä suoraan lähteelle ja kaapia sen itse. Muista kuitenkin-tietojen kaavinta voi olla haastavaa, jos olet kaivos monimutkainen, dynaaminen sivustot. Suosittelemme aloittaa jotain helppoa-enimmäkseen – staattinen sivusto. Tässä muutamia ideoita, joilla pääset alkuun.

Data scraping project ideas

Internet Movie Database

hyvä aloittelijan projekti on poimia tietoja IMDb: stä. Voit kerätä tietoja suosituista TV-ohjelmista, elokuva-arvosteluista ja triviasta, eri toimijoiden korkeuksista ja painoista ja niin edelleen. IMDb: n tiedot tallennetaan yhdenmukaisessa muodossa kaikille sen sivuille, mikä tekee tehtävästä paljon helpomman. Tässä on myös paljon potentiaalia jatkotutkimuksiin.

Työpaikkaportaalit

monet aloittelijat pitävät tietojen kaavimisesta työpaikkaportaaleista, koska ne sisältävät usein standarditietotyyppejä. Voit myös löytää paljon online tutorials selittää, miten edetä. Jos haluat pitää sen mielenkiintoisena, miksi et keskittyisi omaan paikkakuntaasi? Kerää työnimikkeitä, yrityksiä, palkkoja, paikkoja, vaadittavia taitoja ja niin edelleen. Tämä tarjoaa suuria mahdollisuuksia myöhemmin visualisointi, kuten kuvaamalla skillsets vastaan palkat.

verkkokauppasivustot

toinen suosittu on kaapia tuote-ja hintatietoja verkkokauppasivustoilta. Esimerkiksi poimia tuotetietoja Bluetooth kaiuttimet Amazon, tai kerätä arvosteluja ja hintoja eri tableteissa ja kannettavissa tietokoneissa. Jälleen kerran, tämä on suhteellisen yksinkertainen tehdä, ja se on skaalautuva. Tämä tarkoittaa, että voit aloittaa tuotteen, joka on pieni määrä arvosteluja, ja sitten hyväpalkkainen, kun olet mukava käyttää algoritmeja.

Reddit

jotain hieman tavanomaisempaa varten toinen vaihtoehto on raaputtaa Redditin kaltainen sivusto. Voit etsiä tiettyjä avainsanoja, upvotes, käyttäjätiedot, ja enemmän. Reddit on hyvin staattinen verkkosivusto, mikä tekee tehtävästä mukavan ja suoraviivaisen. Myöhemmin, voit tehdä mielenkiintoisia alustavia analyysejä, esimerkiksi, onko korrelaatioita suosittujen viestien ja tiettyjen avainsanojen. Siitä pääsemmekin seuraavaan osioon.

eksploratiivinen data-analyysi projektiideat

mitä on eksploratiivinen data-analyysi?

seuraava askel data-analyytikon taidoissa on kyky suorittaa eksploratiivinen data-analyysi (Eda). Eda tarkastellaan rakennetta tietojen, jonka avulla voit määrittää niiden malleja ja ominaisuuksia. Niiden avulla voit myös puhdistaa tietosi. Voit poimia tärkeitä muuttujia, havaita poikkeamia ja poikkeavuuksia, ja yleensä testata taustaoletuksiasi.

vaikka tämä prosessi on data-analyytikon aikaa vievimpiä tehtäviä, se voi olla myös yksi palkitsevimmista. Myöhemmin mallinnus keskittyy tuottamaan vastauksia tiettyihin kysymyksiin. Eda, sillä välin, auttaa sinua tekemään yksi mielenkiintoisimmista bittiä—tuottaa näitä kysymyksiä ensinnäkin.

kieliä kuten R ja Python käytetään usein näiden tehtävien suorittamiseen. Heillä on monia olemassa olevia algoritmeja, joiden avulla voit suorittaa työn puolestasi. Todellinen taito on esitellä projekti ja sen tulokset. Se, miten päätät tehdä tämän, riippuu sinusta, mutta yksi suosittu tapa on käyttää Jupyter Notebookin kaltaista interaktiivista dokumentointityökalua. Näin voit tallentaa elementtejä koodin, sekä selittävä teksti ja visualisointeja, kaikki yhdessä paikassa. Tässä muutamia ideoita portfoliosi.

eksploratiivinen data analysis project ideas

maailmanlaajuiset itsemurhat

tämä maailmanlaajuinen itsemurhalukuja koskeva tietokokonaisuus kattaa itsemurhien määrät eri maissa ja sisältää lisätietoja, kuten vuoden, sukupuolen, iän, väestön, BKT: n ja paljon muuta. Kun suoritat EDA: ta, kysy itseltäsi: Mitä kuvioita näet? Nousevatko tai laskevatko itsemurhien määrät eri maissa? Mitä muuttujia (kuten sukupuolta tai ikää) voit löytää, jotka voisivat korreloida itsemurhien määrään?

World Happiness Report

asteikon toisessa päässä World Happiness Report seuraa kuutta tekijää, joilla mitataan onnellisuutta maailman kansalaisten keskuudessa: elinajanodote, talous, sosiaalinen tuki, korruption puuttuminen, vapaus ja anteliaisuus. Mikä maa on onnellisin? Mikä maanosa? Millä seikalla näyttää olevan suurin (tai pienin) vaikutus kansakunnan onnellisuuteen? Lisääntyykö vai väheneekö onnellisuus kaiken kaikkiaan?

edellä mainittujen kahden idean lisäksi voit käyttää myös omia tietokokonaisuuksiasi. Loppujen lopuksi, jos olet jo kaavittu omia tietoja, Miksi ei käyttää niitä? Jos esimerkiksi kaavittaisiin työportaali, mitkä paikat tai alueet tarjoavat parhaiten palkattuja töitä? Mitkä tarjoavat pienipalkkaisimpia? Mistä se johtuu? Yhtä lailla verkkokauppadatan avulla voisi katsoa, mitkä hinnat ja tuotteet tarjoavat rahalle parasta vastinetta.

lopulta riippumatta siitä, mitä aineistoa käytät, sen pitäisi kiinnittää huomiosi. Jos tiedot ovat liian monimutkaisia tai eivät kiinnosta sinua, olet todennäköisesti loppuu höyry ennen kuin saat hyvin pitkälle. Pidä mielessä, mitä muuta voit tehdä bongataksesi kiinnostavia trendejä tai kuvioita ja poimiaksesi tarvitsemasi oivallukset.

kokosimme listan kymmenestä upeasta paikasta, joista löydät seuraavan projektisi ilmaiset aineistot täältä.

Data visualization project ideas

mitä on data visualization?

datan kaavinta, siistiminen ja analysointi on eri asia. Havainnoista kertominen on toinen asia. Aivomme eivät pidä numeroiden ja lukujen katselusta, mutta he rakastavat visuaalisuutta. Tämä on, jos kyky luoda tehokas data visualisointeja tulee. Hyvät visualisoinnit—joko staattiset tai Interaktiiviset—ovat hyvä lisä mihin tahansa data-analytiikkaportfolioon. Osoittaa, että voit luoda visualisointeja, jotka ovat sekä tehokkaita että visuaalisesti menee pitkälle kohti vaikutuksen mahdollinen työnantaja.

joitakin ilmaisia visualisointityökaluja ovat muun muassa Google Charts, Canva Graph Maker (ilmainen) ja Tableau Public. Jos taas haluat esitellä koodaustaitojasi, käytä Python-kirjastoa, kuten Seabornia, tai flex Your R skills with Shiny. Tarpeetonta sanoa, on olemassa monia työkaluja, jotka auttavat sinua. Yksi valitset riippuu siitä, mitä etsit saavuttaa. Tässä vähän inspiraatiota …

Data visualization project ideas

Covid-19

ajankohtainen aihe näyttää hyvältä missä tahansa portfoliossa, ja pandemia on suorastaan ajankohtainen! Lisäksi kagglen kaltaisilla sivustoilla on jo tuhansia Covid-19-datasarjoja saatavilla. Miten voit edustaa tietoja? Voisitko käyttää global heatmap näyttää, missä tapauksissa on piikki, verrattuna missä on hyvin vähän? Ehkä voisit luoda kaksi päällekkäistä pylväsdiagrammia, joissa näkyvät tunnetut infektiot ja ennustetut infektiot. Tässä on kätevä opetusohjelma, jonka avulla voit visualisoida Covid-19-tietoja R: n, Shinyn ja Plotlyn avulla.

Instagramissa seuratuimmat

kiinnostuitpa sitten somesta tai julkkis-ja brändikulttuurista, Instagram-Instagram-seuratuimpien ihmisten aineistossa on paljon potentiaalia visualisointiin. Voit luoda interaktiivisen pylväskaavion, joka seuraa seuratuimpien tilien muutoksia ajan myötä. Tai voit tutkia, ovatko brändi-tai julkkistilit tehokkaampia vaikuttajamarkkinoinnissa. Muuten, miksi ei löytää toinen sosiaalisen median dataset luoda visualisointi? Esimerkiksi tämä datatutkija Greg Raffertyn USA: n kartta korostaa hienosti trendien aiheiden maantieteellistä lähdettä Instagram-palvelussa.

Matkadata

toinen visualisointiin hyvin soveltuva aihe on kuljetustieto. On olemassa suuri askel-askeleelta tutorials siellä miten visualisoida matkatietoja, lennon tiedot on erinomainen esimerkki. Esimerkiksi, tutustu data scientist Spencer J Fox ’ s flight data visualisointeja käyttäen ggplot2, data visualisointi paketti R.

tässä viestissä olemme selvittäneet, mitä taitoja jokaisen aloittelijan on osoitettava data-analytiikkaportfoliossaan. Riippumatta dataset käytät, sinun pitäisi pystyä osoittamaan seuraavat kyvyt:

  • Web scraping—käyttämällä työkaluja, kuten Parsehub, Beautiful Soup, tai Scrapy poimia tietoja verkkosivuilta (muista: staattiset ovat helpompia!)
  • eksploratiivinen data analysis and data cleaning—datan manipulointi työkaluilla kuten R ja Python, ennen joidenkin alustavien oivallusten piirtämistä.
  • Data visualization—hyödyntämällä työkaluja, kuten Tableau, kiiltävä, tai Plotly luoda teräviä, pakottavia dashboards, ja visualisointeja.

kun hallitsee perusasiat, voi data-analytiikkaprojekteista alkaa tulla kunnianhimoisempia. Miksi emme esimerkiksi esittelisi joitakin koneoppimisprojekteja, kuten tunteanalyysiä tai ennakoivaa analyysiä? Avainasia on aloittaa yksinkertainen ja muistaa, että hyvä data analytics portfolio ei tarvitse olla räikeä, vain pätevä.

taitojen edelleen kehittämiseksi on paljon verkkokursseja, jotka on suunniteltu ohjaamaan sinut oikeille raiteille. Ensinnäkin, miksi et kokeilisi ilmaista, viisipäiväistä data analytics-lyhytkurssiamme?

ja jos haluat oppia lisää data-analyytikoksi ryhtymisestä ja portfolion rakentamisesta, tutustu seuraaviin:

  • miten data-analytiikkasalkku rakennetaan
  • markkinoiden parhaat data-analytiikan sertifiointiohjelmat juuri nyt
  • nämä ovat yleisimmät data-analytiikan haastattelukysymykset

Vastaa

Sähköpostiosoitettasi ei julkaista.