Yrititkö rakentaa joitakin data science -projekteja parantaaksesi ansioluetteloasi ja pelästyit koodin kokoa ja käytettyjen käsitteiden määrää? Tuntuuko se liian ylitsepääsemättömältä ja murskasiko se haaveesi datatieteilijän urasta? Olemme keränneet sinulle kuusitoista datatieteen projektia lähdekoodin kanssa, jotta voit todella osallistua datatieteen reaaliaikaisiin projekteihin. Nämä auttavat lisäämään itseluottamusta ja kertovat myös haastattelijalle, että olet tosissasi datatieteen suhteen.
Tiedätkö?
Täydellisen idean löytäminen projektillesi huolestuttaa sinua enemmän kuin itse projektin toteuttaminen, eikö totta? Joten pitäen saman mielessä, olemme koonneet luettelon yli 500+ projekti-ideasta juuri sinua varten. Sinun tarvitsee vain merkitä tämä artikkeli kirjanmerkkeihin ja aloittaa.
- Python-projektit
- Python Django (web-kehitys) projektit
- Python pelikehitysprojektit
- Python tekoälyprojektit
- Python koneoppiminen Projects
- Python Data Science Projects
- Python Deep Learning Projects
- Python Computer Vision Projects
- Python Internet of Things Projects
Tässä blogissa, listaamme erilaisia datatieteen hanke-esimerkkejä R- ja Python-kielillä. Erottelemme nämä vaikeusasteen perusteella, jotta sinulla on oikea polku, jota seurata.
Pysy ajan tasalla uusimmista teknologiatrendeistä
Join DataFlair on Telegram!!
- Top Data Science -projekti-ideat
- Aloittelijan data science -projekti-ideat
- 1.1 Valeuutisten havaitseminen
- 1.2 Tiekaistaviivojen havaitseminen
- 1.3 Sentimenttianalyysi
- 1.4 Parkinsonin taudin havaitseminen
- 1.5 Color Detection with Python
- 1.6 Brain Tumor Detection with Data Science
- 1.7 Lehtisairauksien havaitseminen
- Intermediate Data Science Projects
- 2.1 Speech Emotion Recognition
- 2.2 Sukupuolen ja iän havaitseminen datatieteellä
- 2.3 Diabeettinen retinopatia
- 2.3 Uber Data Analysis in R
- 2.4 Kuljettajan uneliaisuuden havaitseminen Pythonilla
- 2.5 Chatbot-projekti Pythonilla
- 2.6 Käsinkirjoitettujen numeroiden tunnistamisprojekti
- Advanced Data Science Projects
- 3.1 Image Caption Generator Project in Python
- 3.2 Luottokorttipetosten havaitsemisprojekti
- 3.3 Movie Recommendation System
- 3.4 Asiakassegmentointi
- 3.5 Rintasyövän luokittelu
- 3.6 Liikennemerkkien tunnistaminen
- Summary
Top Data Science -projekti-ideat
Tässä ovat parhaat data science -projekti-ideat lähdekoodin kera:
Aloittelijan data science -projekti-ideat
1.1 Valeuutisten havaitseminen
Ajata urasi uusiin korkeuksiin työskentelemällä Data Science Project for Beginners – Detecting Fake News with Python
Keltaisen journalismin kuninkaana valeuutiset ovat väärää tietoa ja huijauksia, joita levitetään sosiaalisessa mediassa ja muussa verkkomediassa poliittisen agendan saavuttamiseksi. Tässä datatieteen projekti-ideassa käytämme Pythonia rakentaaksemme mallin, joka pystyy tunnistamaan tarkasti, onko uutinen aito vai väärennös. Rakennamme TfidfVectorizerin ja käytämme PassiveAggressiveClassifieria luokitellaksemme uutiset “oikeisiin” ja “väärennettyihin”. Käytämme 7796×4-muotoista datasettiä ja suoritamme kaiken Jupyter Labissa.
Kieli: Python
Dataset/Package: news.csv
1.2 Tiekaistaviivojen havaitseminen
Katso kaistaviivojen havaitsemisen datatieteen projektin täydellinen toteutus: Real-time Lane Line Detection in Python
Data Science Project Idea: Teille piirretyt viivat opastavat ihmiskuljettajille, missä kaistat ovat. Se viittaa myös siihen, mihin suuntaan ajoneuvoa pitää ohjata. Tämä sovellus on keskeisessä asemassa kehitettäessä kuljettajattomia autoja.
Voit rakentaa sovelluksen, jolla on kyky tunnistaa ajorataviivoja syötetyistä kuvista tai jatkuvista videokuvista.
1.3 Sentimenttianalyysi
Check the complete implementation of Data Science Project with Source Code – Sentiment Analysis Project in R
Sentimenttianalyysi on teko, jossa analysoidaan sanoja, jotta voidaan määritellä sentimentit ja mielipiteet, jotka voivat olla napaisuudeltaan positiivisia tai negatiivisia. Kyseessä on eräänlainen luokittelu, jossa luokat voivat olla binäärisiä (positiivinen ja negatiivinen) tai moninaisia (iloinen, vihainen, surullinen, inhottava,…). Toteutamme tämän datatieteellisen projektin R-ohjelmointikielellä ja käytämme ‘janeaustenR’-paketin tuottamaa aineistoa. Käytämme yleiskäyttöisiä leksikoita, kuten AFINN, bing ja loughran, suoritamme sisäisen yhdistämisen, ja lopuksi rakennamme sanapilven tuloksen esittämiseksi.
Kieli: R
Dataset/Package: janeaustenR
1.4 Parkinsonin taudin havaitseminen
Työskentele datatieteen projekti-idea – Parkinsonin taudin havaitseminen XGBoostilla
Olemme alkaneet käyttää datatiedettä terveydenhuollon ja palveluiden parantamiseen – jos pystymme ennustamaan sairauden varhaisessa vaiheessa, siitä on monia etuja ennusteen kannalta. Tässä datatieteen projekti-ideassa opettelemme siis havaitsemaan Parkinsonin taudin Pythonilla. Kyseessä on neurodegeneratiivinen, etenevä keskushermoston sairaus, joka vaikuttaa liikkumiseen ja aiheuttaa vapinaa ja jäykkyyttä. Se vaikuttaa aivojen dopamiinia tuottaviin neuroneihin, ja joka vuosi siihen sairastuu yli miljoona ihmistä Intiassa.
Kieli: Python
Dataset/Package: UCI ML Parkinsons dataset
1.5 Color Detection with Python
Rakenna sovellus värien havaitsemiseen Beginner Data Science Project – Color Detection with OpenCV
Kuinkahan monta kertaa sinulle on tullut mieleen, että vaikka olet nähnyt, et muista värin nimeä? Värejä voi olla 16 miljoonaa eri RGB-väriarvoihin perustuvaa väriä, mutta muistamme vain muutaman. Tässä projektissa aiomme siis rakentaa interaktiivisen sovelluksen, joka tunnistaa valitun värin mistä tahansa kuvasta. Toteuttaaksemme tämän tarvitsemme merkityt tiedot kaikista tunnetuista väreistä, minkä jälkeen laskemme, mikä väri muistuttaa eniten valittua väriarvoa.
Kieli: Python
Dataset: Codebrainz Color Names
1.6 Brain Tumor Detection with Data Science
Data Science Project Idea: On olemassa monia kuuluisia syväoppimisprojekteja MRI-skannaustietoaineistosta. Yksi niistä on aivokasvaimen havaitseminen. Voit käyttää siirto-oppimista näihin MRI-skannauksiin saadaksesi tarvittavat piirteet luokittelua varten. Tai voit kouluttaa oman konvoluutiohermoverkon tyhjästä aivokasvainten havaitsemiseen.
Dataset: Aivojen MRI-kuva-aineisto
1.7 Lehtisairauksien havaitseminen
Data Science Project Idea: Tautien havaitseminen kasveissa on erittäin tärkeässä asemassa maatalouden alalla. Tämän Data Science -hankkeen tavoitteena on tarjota kuvapohjainen automaattinen tarkastusrajapinta. Siinä käytetään itse suunniteltuja kuvankäsittely- ja syväoppimistekniikoita. Se luokittelee kasvien lehdet terveiksi tai tartunnan saaneiksi.
Dataset: Leaf Dataset
Intermediate Data Science Projects
2.1 Speech Emotion Recognition
Explore the complete implementation of Data Science Project Example – Speech Emotion Recognition with Librosa
Opiskellaan nyt käyttämään eri kirjastoja. Tässä datatieteellisessä projektissa käytetään Librosaa puheen tunnetunnistuksen suorittamiseen. SER on prosessi, jossa ihmisen tunteita ja affektitiloja yritetään tunnistaa puheesta. Koska käytämme äänensävyä ja sävelkorkeutta ilmaistaksemme tunteita äänen kautta, SER on mahdollinen; mutta se on vaikeaa, koska tunteet ovat subjektiivisia ja äänen kommentointi on haastavaa. Käytämme mfcc-, chroma- ja mel-piirteitä ja käytämme RAVDESS-tietokokonaisuutta tunteiden tunnistamiseen. Rakennamme mallia varten MLPC-luokittelijan.
Kieli: Python
Dataset/Package: RAVDESS dataset
2.2 Sukupuolen ja iän havaitseminen datatieteellä
Polkaise kaasu pohjaan & tee vaikutus rekrytoijiin ultimaattisella datatieteellisellä projektilla – Sukupuolen ja iän havaitseminen OpenCV:llä
Tämä on mielenkiintoinen datatieteellinen Projekti Pythonin avulla. Yhden kuvan avulla opit ennustamaan henkilön sukupuolen ja iän. Tässä tutustutaan tietokonenäköön ja sen periaatteisiin. Rakennamme konvolutiivisen neuroverkon ja käytämme Tal Hassnerin ja Gil Levin kouluttamia malleja Adience-tietokantaan. Käytämme matkan varrella joitakin .pb-, .pbtxt-, .prototxt- ja .caffemodel-tiedostoja.
Kieli: Python
Dataset/Package: Adience
2.3 Diabeettinen retinopatia
Data Science Project Idea: Diabeettinen retinopatia on johtava sokeutumisen syy. Voit kehittää automaattisen menetelmän diabeettisen retinopatian seulontaan. Voit kouluttaa neuroverkon sairastuneiden ja normaalien ihmisten verkkokalvokuvilla. Tämä projekti luokittelee, onko potilaalla retinopatiaa vai ei.
Dataset: Diabetic Retinopathy Dataset
2.3 Uber Data Analysis in R
Check the complete implementation of Data Science Project with Source Code – Uber Data Analysis Project in R
Tämä on ggplot2:lla toteutettu datan visualisointiprojekti, jossa käytämme R:ää ja sen sisältämiä kirjastoja ja analysoimme erilaisia parametreja, kuten matkoja tuntien mukaan vuorokaudessa ja matkoja kuukausien aikana vuodessa. Käytämme Uber Pickups in New York City -tietokokonaisuutta ja luomme visualisointeja vuoden eri ajankohdille. Tämä kertoo meille, miten aika vaikuttaa asiakkaiden matkoihin.
Kieli: R
Dataset/Package: Uber Pickups in New York City dataset
2.4 Kuljettajan uneliaisuuden havaitseminen Pythonilla
Ajata urasi uusiin korkeuksiin työskentelemällä Top Data Science Project – Drowsiness Detection System with OpenCV & Keras
Uneliaana ajaminen on erittäin vaarallista, ja noin tuhansia tapaturmia sattuu vuosittain kuljettajien nukahtaessa ajon aikana. Tässä Python-projektissa rakennamme järjestelmän, joka pystyy havaitsemaan uniset kuljettajat ja myös varoittamaan heitä piippaavalla hälytyksellä.
Tämä projekti on toteutettu käyttäen Kerasia ja OpenCV:tä. Käytämme OpenCV:tä kasvojen ja silmien havaitsemiseen ja Kerasin avulla luokittelemme silmän tilan (Avoin tai Suljettu) käyttäen Deep neural network -tekniikoita.
2.5 Chatbot-projekti Pythonilla
Build a chatbot using Python & step up in your career – Chatbot with NLTK & Keras
Chatbotit ovat olennainen osa liiketoimintaa. Monien yritysten on tarjottava palveluja asiakkailleen ja se vaatii paljon työvoimaa, aikaa ja vaivaa asiakkaiden käsittelyyn. Chatbotit voivat automatisoida suurimman osan asiakkaiden vuorovaikutuksesta vastaamalla joihinkin asiakkaiden usein esittämiin kysymyksiin. Chatbotteja on pääasiassa kahdenlaisia: Verkkotunnuskohtaiset ja avoimen verkkotunnuksen chatbotit. Aluekohtaista chatbotia käytetään usein tietyn ongelman ratkaisemiseen. Sinun on siis räätälöitävä se älykkäästi, jotta se toimisi tehokkaasti omalla toimialueellasi. Open-domain-chatboteille voidaan esittää minkä tahansa tyyppisiä kysymyksiä, joten niiden kouluttaminen vaatii valtavia määriä dataa.
Kieli: Python
Dataset: Intents json-tiedosto
2.6 Käsinkirjoitettujen numeroiden tunnistamisprojekti
Käytännön toteutus Syväoppimisprojekti lähdekoodilla – käsinkirjoitettujen numeroiden tunnistaminen CNN:llä
Käsinkirjoitetuista numeroista koostuva MNIST-tietokokonaisuus on levinnyt laajalti tietojenkäsittelytieteilijöiden ja koneenopiskelun harrastajien keskuudessa. Se on hämmästyttävä projekti, jonka avulla pääsee alkuun datatieteen parissa ja ymmärtää projektiin liittyviä prosesseja. Projekti on toteutettu käyttäen Convolutional Neural Networks ja sitten reaaliaikaista ennustamista varten rakennamme myös mukavan graafisen käyttöliittymän, jossa numerot piirretään kankaalle ja sitten malli ennustaa numeron.
Kieli: Python
Dataset: MNIST
Get hired as a data scientist with Top Data Science Interview Questions
Advanced Data Science Projects
3.1 Image Caption Generator Project in Python
Katso datatieteen projektin täydellinen toteutus lähdekoodilla – Image Caption Generator with CNN & LSTM
Tämä on mielenkiintoinen datatieteen projekti. Kuvan sisällön kuvaaminen on ihmiselle helppo tehtävä, mutta tietokoneille kuva on vain joukko numeroita, jotka edustavat kunkin pikselin väriarvoa. Tämä on siis vaikea tehtävä tietokoneille ymmärtää, mitä kuvassa on, ja kuvauksen tuottaminen luonnollisella kielellä, kuten englanniksi, on toinen vaikea tehtävä. Tässä projektissa käytetään syväoppimistekniikoita, joissa toteutamme Convolutional Neural Networkin (CNN) ja Recurrent Neural Networkin( LSTM) kuvan kuvatekstigeneraattorin rakentamiseksi.
Dataset: Flickr 8K
Kieli: Python
Framework: Keras
3.2 Luottokorttipetosten havaitsemisprojekti
Työskentele datatieteen projektien parissa – Luottokorttipetosten havaitseminen koneoppimisen avulla
Joko nyt olet alkanut ymmärtää menetelmiä ja käsitteitä. Siirrytään seuraavaksi edistyneisiin datatieteen projekteihin. Tässä projektissa käytämme R:ää sellaisten algoritmien kanssa kuin päätöspuut, logistinen regressio, keinotekoiset neuroverkot ja Gradient Boosting -luokitin. Käytämme Card Transactions -tietokokonaisuutta luokitellaksemme luottokorttitapahtumat vilpillisiin ja aitoihin. Sovitamme erilaiset mallit ja piirrämme niiden suorituskykykäyrät.
Kieli: R
Dataset/Package: Card Transactions dataset
3.3 Movie Recommendation System
Explore the implementation of the Best Data Science Project with Source Code- Movie Recommendation System Project in R
Tässä data science -hankkeessa suoritamme R:n avulla elokuvasuosituksen koneoppimisen avulla. Suosittelujärjestelmä lähettää käyttäjille ehdotuksia suodatusprosessin kautta, joka perustuu muiden käyttäjien mieltymyksiin ja selaushistoriaan. Jos A ja B pitävät Yksin kotona -elokuvasta ja B pitää Mean Girls -elokuvasta, sitä voidaan ehdottaa A:lle – hänkin saattaa pitää siitä. Tämä pitää asiakkaat sitoutuneina alustaan.
Kieli: R
Dataset/Package: MovieLens dataset
3.4 Asiakassegmentointi
Laita mitali polkimelle & tee vaikutus rekrytoijiin Data Science -projektilla (sisältää lähdekoodin) – Asiakassegmentointi koneellisella oppimisella
Tämä on yksi suosituimmista Data Science -projekteista. Ennen minkään kampanjan toteuttamista yritykset luovat erilaisia asiakasryhmiä.
Asiakassegmentointi on suosittu valvomattoman oppimisen sovellus. Klusteroinnin avulla yritykset tunnistavat asiakassegmenttejä potentiaalisen käyttäjäkunnan kohdentamiseksi. Ne jakavat asiakkaat ryhmiin yhteisten ominaisuuksien, kuten sukupuolen, iän, kiinnostuksen kohteiden ja kulutustottumusten mukaan, jotta ne voivat markkinoida kutakin ryhmää tehokkaasti. Käytämme K-means-klusterointia ja visualisoimme myös sukupuoli- ja ikäjakaumat. Sitten analysoimme heidän vuositulojaan ja kulutustulojaan.
Kieli: R
Dataset/Package: Mall_Customers dataset
3.5 Rintasyövän luokittelu
Katso Data Science Project in Python – Breast Cancer Classification with Deep Learning -projektin täydellinen toteutus
Palatakseni takaisin tietojenkäsittelytieteen lääketieteellisiin kontribuutioihin opettelemme havaitsemaan rintasyövän Pythonilla. Käytämme IDC_regular-tietokokonaisuutta rintasyövän yleisimmän muodon, invasiivisen duktaalisen karsinooman, havaitsemiseen. Se kehittyy maitokanavassa tunkeutuen kanavan ulkopuolella olevaan kuituiseen tai rasvaiseen rintakudokseen. Tässä datatieteen projekti-ideassa käytämme Deep Learningia ja Keras-kirjastoa luokitteluun.
Kieli: Python
Dataset/Package: IDC_regular
3.6 Liikennemerkkien tunnistaminen
Tarkkuuden saavuttaminen itseajavien autojen teknologiassa Data Science Project on Traffic Signs Recognition using CNN with Source Code
Liikennemerkkien tunnistaminen CNN:n avulla lähdekoodilla
Liikennemerkkien tunnistaminen liikennemerkkien avulla ja liikennemerkkien ja liikennesääntöjen noudattaminen ovat erittäin tärkeitä asioita, joita jokaisen autoilijan täytyy noudattaa, jotta hän voi välttyä mahdolliselta onnettomuudelta. Sääntöjen noudattamiseksi on ensin ymmärrettävä, miltä liikennemerkki näyttää. Ihmisen on opeteltava kaikki liikennemerkit ennen kuin hän saa ajokortin ajaa mitä tahansa ajoneuvoa. Nyt autonomiset ajoneuvot ovat kuitenkin yleistymässä, eikä ihmiskuljettajia ole tulevaisuudessa enää lainkaan. Liikennemerkkien tunnistamisprojektissa opit, miten ohjelma voi tunnistaa liikennemerkin tyypin ottamalla kuvan syötteeksi. Saksan liikennemerkkien tunnistamisen vertailutietoaineistoa (GTSRB) käytetään syvän neuroverkon rakentamiseen liikennemerkin luokan tunnistamiseksi. Rakennamme myös yksinkertaisen graafisen käyttöliittymän, joka mahdollistaa vuorovaikutuksen sovelluksen kanssa.
Kieli: Python
Dataset: GTSRB (German Traffic Sign Recognition Benchmark)