16 Data Science -projektia lähdekoodin kanssa ansioluettelosi vahvistamiseksi

Yrititkö rakentaa joitakin data science -projekteja parantaaksesi ansioluetteloasi ja pelästyit koodin kokoa ja käytettyjen käsitteiden määrää? Tuntuuko se liian ylitsepääsemättömältä ja murskasiko se haaveesi datatieteilijän urasta? Olemme keränneet sinulle kuusitoista datatieteen projektia lähdekoodin kanssa, jotta voit todella osallistua datatieteen reaaliaikaisiin projekteihin. Nämä auttavat lisäämään itseluottamusta ja kertovat myös haastattelijalle, että olet tosissasi datatieteen suhteen.

Tiedätkö?

Täydellisen idean löytäminen projektillesi huolestuttaa sinua enemmän kuin itse projektin toteuttaminen, eikö totta? Joten pitäen saman mielessä, olemme koonneet luettelon yli 500+ projekti-ideasta juuri sinua varten. Sinun tarvitsee vain merkitä tämä artikkeli kirjanmerkkeihin ja aloittaa.

  1. Python-projektit
  2. Python Django (web-kehitys) projektit
  3. Python pelikehitysprojektit
  4. Python tekoälyprojektit
  5. Python koneoppiminen Projects
  6. Python Data Science Projects
  7. Python Deep Learning Projects
  8. Python Computer Vision Projects
  9. Python Internet of Things Projects

Tässä blogissa, listaamme erilaisia datatieteen hanke-esimerkkejä R- ja Python-kielillä. Erottelemme nämä vaikeusasteen perusteella, jotta sinulla on oikea polku, jota seurata.

Pysy ajan tasalla uusimmista teknologiatrendeistä
Join DataFlair on Telegram!!

Top Data Science -projekti-ideat

Tässä ovat parhaat data science -projekti-ideat lähdekoodin kera:

Aloittelijan data science -projekti-ideat

1.1 Valeuutisten havaitseminen

Ajata urasi uusiin korkeuksiin työskentelemällä Data Science Project for Beginners – Detecting Fake News with Python

python project detecting fake news - data science project ideas

Keltaisen journalismin kuninkaana valeuutiset ovat väärää tietoa ja huijauksia, joita levitetään sosiaalisessa mediassa ja muussa verkkomediassa poliittisen agendan saavuttamiseksi. Tässä datatieteen projekti-ideassa käytämme Pythonia rakentaaksemme mallin, joka pystyy tunnistamaan tarkasti, onko uutinen aito vai väärennös. Rakennamme TfidfVectorizerin ja käytämme PassiveAggressiveClassifieria luokitellaksemme uutiset “oikeisiin” ja “väärennettyihin”. Käytämme 7796×4-muotoista datasettiä ja suoritamme kaiken Jupyter Labissa.

Kieli: Python

Dataset/Package: news.csv

1.2 Tiekaistaviivojen havaitseminen

Katso kaistaviivojen havaitsemisen datatieteen projektin täydellinen toteutus: Real-time Lane Line Detection in Python

kaistaviivan havaitseminen ml-projekti

Data Science Project Idea: Teille piirretyt viivat opastavat ihmiskuljettajille, missä kaistat ovat. Se viittaa myös siihen, mihin suuntaan ajoneuvoa pitää ohjata. Tämä sovellus on keskeisessä asemassa kehitettäessä kuljettajattomia autoja.

Voit rakentaa sovelluksen, jolla on kyky tunnistaa ajorataviivoja syötetyistä kuvista tai jatkuvista videokuvista.

1.3 Sentimenttianalyysi

Check the complete implementation of Data Science Project with Source Code – Sentiment Analysis Project in R

Data-Science R Project Sentimenttianalyysi

Sentimenttianalyysi on teko, jossa analysoidaan sanoja, jotta voidaan määritellä sentimentit ja mielipiteet, jotka voivat olla napaisuudeltaan positiivisia tai negatiivisia. Kyseessä on eräänlainen luokittelu, jossa luokat voivat olla binäärisiä (positiivinen ja negatiivinen) tai moninaisia (iloinen, vihainen, surullinen, inhottava,…). Toteutamme tämän datatieteellisen projektin R-ohjelmointikielellä ja käytämme ‘janeaustenR’-paketin tuottamaa aineistoa. Käytämme yleiskäyttöisiä leksikoita, kuten AFINN, bing ja loughran, suoritamme sisäisen yhdistämisen, ja lopuksi rakennamme sanapilven tuloksen esittämiseksi.

Kieli: R

Dataset/Package: janeaustenR

1.4 Parkinsonin taudin havaitseminen

Työskentele datatieteen projekti-idea – Parkinsonin taudin havaitseminen XGBoostilla

Python koneoppimisprojekti - datatieteen projekti-ideat

Olemme alkaneet käyttää datatiedettä terveydenhuollon ja palveluiden parantamiseen – jos pystymme ennustamaan sairauden varhaisessa vaiheessa, siitä on monia etuja ennusteen kannalta. Tässä datatieteen projekti-ideassa opettelemme siis havaitsemaan Parkinsonin taudin Pythonilla. Kyseessä on neurodegeneratiivinen, etenevä keskushermoston sairaus, joka vaikuttaa liikkumiseen ja aiheuttaa vapinaa ja jäykkyyttä. Se vaikuttaa aivojen dopamiinia tuottaviin neuroneihin, ja joka vuosi siihen sairastuu yli miljoona ihmistä Intiassa.

Kieli: Python

Dataset/Package: UCI ML Parkinsons dataset

1.5 Color Detection with Python

Rakenna sovellus värien havaitsemiseen Beginner Data Science Project – Color Detection with OpenCV

project in python on color detection

Kuinkahan monta kertaa sinulle on tullut mieleen, että vaikka olet nähnyt, et muista värin nimeä? Värejä voi olla 16 miljoonaa eri RGB-väriarvoihin perustuvaa väriä, mutta muistamme vain muutaman. Tässä projektissa aiomme siis rakentaa interaktiivisen sovelluksen, joka tunnistaa valitun värin mistä tahansa kuvasta. Toteuttaaksemme tämän tarvitsemme merkityt tiedot kaikista tunnetuista väreistä, minkä jälkeen laskemme, mikä väri muistuttaa eniten valittua väriarvoa.

Kieli: Python

Dataset: Codebrainz Color Names

1.6 Brain Tumor Detection with Data Science

Data Science Project Idea: On olemassa monia kuuluisia syväoppimisprojekteja MRI-skannaustietoaineistosta. Yksi niistä on aivokasvaimen havaitseminen. Voit käyttää siirto-oppimista näihin MRI-skannauksiin saadaksesi tarvittavat piirteet luokittelua varten. Tai voit kouluttaa oman konvoluutiohermoverkon tyhjästä aivokasvainten havaitsemiseen.

Dataset: Aivojen MRI-kuva-aineisto

1.7 Lehtisairauksien havaitseminen

Data Science Project Idea: Tautien havaitseminen kasveissa on erittäin tärkeässä asemassa maatalouden alalla. Tämän Data Science -hankkeen tavoitteena on tarjota kuvapohjainen automaattinen tarkastusrajapinta. Siinä käytetään itse suunniteltuja kuvankäsittely- ja syväoppimistekniikoita. Se luokittelee kasvien lehdet terveiksi tai tartunnan saaneiksi.

Dataset: Leaf Dataset

Intermediate Data Science Projects

2.1 Speech Emotion Recognition

Explore the complete implementation of Data Science Project Example – Speech Emotion Recognition with Librosa

Python-projekti - puhe-emootiotunnistus

Opiskellaan nyt käyttämään eri kirjastoja. Tässä datatieteellisessä projektissa käytetään Librosaa puheen tunnetunnistuksen suorittamiseen. SER on prosessi, jossa ihmisen tunteita ja affektitiloja yritetään tunnistaa puheesta. Koska käytämme äänensävyä ja sävelkorkeutta ilmaistaksemme tunteita äänen kautta, SER on mahdollinen; mutta se on vaikeaa, koska tunteet ovat subjektiivisia ja äänen kommentointi on haastavaa. Käytämme mfcc-, chroma- ja mel-piirteitä ja käytämme RAVDESS-tietokokonaisuutta tunteiden tunnistamiseen. Rakennamme mallia varten MLPC-luokittelijan.

Kieli: Python

Dataset/Package: RAVDESS dataset

2.2 Sukupuolen ja iän havaitseminen datatieteellä

Polkaise kaasu pohjaan & tee vaikutus rekrytoijiin ultimaattisella datatieteellisellä projektilla – Sukupuolen ja iän havaitseminen OpenCV:llä

Python-projekti iän ja sukupuolen havaitsemisessa

Tämä on mielenkiintoinen datatieteellinen Projekti Pythonin avulla. Yhden kuvan avulla opit ennustamaan henkilön sukupuolen ja iän. Tässä tutustutaan tietokonenäköön ja sen periaatteisiin. Rakennamme konvolutiivisen neuroverkon ja käytämme Tal Hassnerin ja Gil Levin kouluttamia malleja Adience-tietokantaan. Käytämme matkan varrella joitakin .pb-, .pbtxt-, .prototxt- ja .caffemodel-tiedostoja.

Kieli: Python

Dataset/Package: Adience

2.3 Diabeettinen retinopatia

Data Science Project Idea: Diabeettinen retinopatia on johtava sokeutumisen syy. Voit kehittää automaattisen menetelmän diabeettisen retinopatian seulontaan. Voit kouluttaa neuroverkon sairastuneiden ja normaalien ihmisten verkkokalvokuvilla. Tämä projekti luokittelee, onko potilaalla retinopatiaa vai ei.

Dataset: Diabetic Retinopathy Dataset

2.3 Uber Data Analysis in R

Check the complete implementation of Data Science Project with Source Code – Uber Data Analysis Project in R

Data Science R Project Uber Data Analysis

Tämä on ggplot2:lla toteutettu datan visualisointiprojekti, jossa käytämme R:ää ja sen sisältämiä kirjastoja ja analysoimme erilaisia parametreja, kuten matkoja tuntien mukaan vuorokaudessa ja matkoja kuukausien aikana vuodessa. Käytämme Uber Pickups in New York City -tietokokonaisuutta ja luomme visualisointeja vuoden eri ajankohdille. Tämä kertoo meille, miten aika vaikuttaa asiakkaiden matkoihin.

Kieli: R

Dataset/Package: Uber Pickups in New York City dataset

2.4 Kuljettajan uneliaisuuden havaitseminen Pythonilla

Ajata urasi uusiin korkeuksiin työskentelemällä Top Data Science Project – Drowsiness Detection System with OpenCV & Keras

Datatieteen projekti-ideat - Kuljettajan uneliaisuuden havaitsemisjärjestelmä

Uneliaana ajaminen on erittäin vaarallista, ja noin tuhansia tapaturmia sattuu vuosittain kuljettajien nukahtaessa ajon aikana. Tässä Python-projektissa rakennamme järjestelmän, joka pystyy havaitsemaan uniset kuljettajat ja myös varoittamaan heitä piippaavalla hälytyksellä.

Tämä projekti on toteutettu käyttäen Kerasia ja OpenCV:tä. Käytämme OpenCV:tä kasvojen ja silmien havaitsemiseen ja Kerasin avulla luokittelemme silmän tilan (Avoin tai Suljettu) käyttäen Deep neural network -tekniikoita.

2.5 Chatbot-projekti Pythonilla

Build a chatbot using Python & step up in your career – Chatbot with NLTK & Keras

Python chatbot project

Chatbotit ovat olennainen osa liiketoimintaa. Monien yritysten on tarjottava palveluja asiakkailleen ja se vaatii paljon työvoimaa, aikaa ja vaivaa asiakkaiden käsittelyyn. Chatbotit voivat automatisoida suurimman osan asiakkaiden vuorovaikutuksesta vastaamalla joihinkin asiakkaiden usein esittämiin kysymyksiin. Chatbotteja on pääasiassa kahdenlaisia: Verkkotunnuskohtaiset ja avoimen verkkotunnuksen chatbotit. Aluekohtaista chatbotia käytetään usein tietyn ongelman ratkaisemiseen. Sinun on siis räätälöitävä se älykkäästi, jotta se toimisi tehokkaasti omalla toimialueellasi. Open-domain-chatboteille voidaan esittää minkä tahansa tyyppisiä kysymyksiä, joten niiden kouluttaminen vaatii valtavia määriä dataa.

Kieli: Python

Dataset: Intents json-tiedosto

2.6 Käsinkirjoitettujen numeroiden tunnistamisprojekti

Käytännön toteutus Syväoppimisprojekti lähdekoodilla – käsinkirjoitettujen numeroiden tunnistaminen CNN:llä

python-syväoppimisprojekti - käsinkirjoitettujen numeroiden tunnistaminen

Käsinkirjoitetuista numeroista koostuva MNIST-tietokokonaisuus on levinnyt laajalti tietojenkäsittelytieteilijöiden ja koneenopiskelun harrastajien keskuudessa. Se on hämmästyttävä projekti, jonka avulla pääsee alkuun datatieteen parissa ja ymmärtää projektiin liittyviä prosesseja. Projekti on toteutettu käyttäen Convolutional Neural Networks ja sitten reaaliaikaista ennustamista varten rakennamme myös mukavan graafisen käyttöliittymän, jossa numerot piirretään kankaalle ja sitten malli ennustaa numeron.

Kieli: Python

Dataset: MNIST

Get hired as a data scientist with Top Data Science Interview Questions

Advanced Data Science Projects

3.1 Image Caption Generator Project in Python

Katso datatieteen projektin täydellinen toteutus lähdekoodilla – Image Caption Generator with CNN & LSTM

python-pohjainen projekti - Image Caption Generator with CNN and LSTM

Tämä on mielenkiintoinen datatieteen projekti. Kuvan sisällön kuvaaminen on ihmiselle helppo tehtävä, mutta tietokoneille kuva on vain joukko numeroita, jotka edustavat kunkin pikselin väriarvoa. Tämä on siis vaikea tehtävä tietokoneille ymmärtää, mitä kuvassa on, ja kuvauksen tuottaminen luonnollisella kielellä, kuten englanniksi, on toinen vaikea tehtävä. Tässä projektissa käytetään syväoppimistekniikoita, joissa toteutamme Convolutional Neural Networkin (CNN) ja Recurrent Neural Networkin( LSTM) kuvan kuvatekstigeneraattorin rakentamiseksi.

Dataset: Flickr 8K

Kieli: Python

Framework: Keras

3.2 Luottokorttipetosten havaitsemisprojekti

Työskentele datatieteen projektien parissa – Luottokorttipetosten havaitseminen koneoppimisen avulla

Datatieteen R-projekti Luottokorttipetosten havaitseminen ML:n avulla - Datatieteen projektien ideat

Joko nyt olet alkanut ymmärtää menetelmiä ja käsitteitä. Siirrytään seuraavaksi edistyneisiin datatieteen projekteihin. Tässä projektissa käytämme R:ää sellaisten algoritmien kanssa kuin päätöspuut, logistinen regressio, keinotekoiset neuroverkot ja Gradient Boosting -luokitin. Käytämme Card Transactions -tietokokonaisuutta luokitellaksemme luottokorttitapahtumat vilpillisiin ja aitoihin. Sovitamme erilaiset mallit ja piirrämme niiden suorituskykykäyrät.

Kieli: R

Dataset/Package: Card Transactions dataset

3.3 Movie Recommendation System

Explore the implementation of the Best Data Science Project with Source Code- Movie Recommendation System Project in R

data science movie recommendation project - data science projects

Tässä data science -hankkeessa suoritamme R:n avulla elokuvasuosituksen koneoppimisen avulla. Suosittelujärjestelmä lähettää käyttäjille ehdotuksia suodatusprosessin kautta, joka perustuu muiden käyttäjien mieltymyksiin ja selaushistoriaan. Jos A ja B pitävät Yksin kotona -elokuvasta ja B pitää Mean Girls -elokuvasta, sitä voidaan ehdottaa A:lle – hänkin saattaa pitää siitä. Tämä pitää asiakkaat sitoutuneina alustaan.

Kieli: R

Dataset/Package: MovieLens dataset

3.4 Asiakassegmentointi

Laita mitali polkimelle & tee vaikutus rekrytoijiin Data Science -projektilla (sisältää lähdekoodin) – Asiakassegmentointi koneellisella oppimisella

Data Science R -projekti Asiakassegmentointi

Tämä on yksi suosituimmista Data Science -projekteista. Ennen minkään kampanjan toteuttamista yritykset luovat erilaisia asiakasryhmiä.

Asiakassegmentointi on suosittu valvomattoman oppimisen sovellus. Klusteroinnin avulla yritykset tunnistavat asiakassegmenttejä potentiaalisen käyttäjäkunnan kohdentamiseksi. Ne jakavat asiakkaat ryhmiin yhteisten ominaisuuksien, kuten sukupuolen, iän, kiinnostuksen kohteiden ja kulutustottumusten mukaan, jotta ne voivat markkinoida kutakin ryhmää tehokkaasti. Käytämme K-means-klusterointia ja visualisoimme myös sukupuoli- ja ikäjakaumat. Sitten analysoimme heidän vuositulojaan ja kulutustulojaan.

Kieli: R

Dataset/Package: Mall_Customers dataset

3.5 Rintasyövän luokittelu

Katso Data Science Project in Python – Breast Cancer Classification with Deep Learning -projektin täydellinen toteutus

project in python breast cancer classification - data science project ideas

Palatakseni takaisin tietojenkäsittelytieteen lääketieteellisiin kontribuutioihin opettelemme havaitsemaan rintasyövän Pythonilla. Käytämme IDC_regular-tietokokonaisuutta rintasyövän yleisimmän muodon, invasiivisen duktaalisen karsinooman, havaitsemiseen. Se kehittyy maitokanavassa tunkeutuen kanavan ulkopuolella olevaan kuituiseen tai rasvaiseen rintakudokseen. Tässä datatieteen projekti-ideassa käytämme Deep Learningia ja Keras-kirjastoa luokitteluun.

Kieli: Python

Dataset/Package: IDC_regular

3.6 Liikennemerkkien tunnistaminen

Tarkkuuden saavuttaminen itseajavien autojen teknologiassa Data Science Project on Traffic Signs Recognition using CNN with Source Code

python Data Science Project on Traffic Signs Recognition

Liikennemerkkien tunnistaminen CNN:n avulla lähdekoodilla

python Data Science Project on Traffic Signs Recognition

Liikennemerkkien tunnistaminen liikennemerkkien avulla ja liikennemerkkien ja liikennesääntöjen noudattaminen ovat erittäin tärkeitä asioita, joita jokaisen autoilijan täytyy noudattaa, jotta hän voi välttyä mahdolliselta onnettomuudelta. Sääntöjen noudattamiseksi on ensin ymmärrettävä, miltä liikennemerkki näyttää. Ihmisen on opeteltava kaikki liikennemerkit ennen kuin hän saa ajokortin ajaa mitä tahansa ajoneuvoa. Nyt autonomiset ajoneuvot ovat kuitenkin yleistymässä, eikä ihmiskuljettajia ole tulevaisuudessa enää lainkaan. Liikennemerkkien tunnistamisprojektissa opit, miten ohjelma voi tunnistaa liikennemerkin tyypin ottamalla kuvan syötteeksi. Saksan liikennemerkkien tunnistamisen vertailutietoaineistoa (GTSRB) käytetään syvän neuroverkon rakentamiseen liikennemerkin luokan tunnistamiseksi. Rakennamme myös yksinkertaisen graafisen käyttöliittymän, joka mahdollistaa vuorovaikutuksen sovelluksen kanssa.

Kieli: Python

Dataset: GTSRB (German Traffic Sign Recognition Benchmark)

Summary

Vastaa

Sähköpostiosoitettasi ei julkaista.