16 adattudományi projekt forráskóddal az önéletrajzod erősítésére

Próbáltál néhány adattudományi projektet építeni az önéletrajzod javítására, de megijedtél a kód méretétől és a felhasznált fogalmak számától? Túlságosan elérhetetlennek érzed, és összetörték az adattudóssá válásról szőtt álmaidat? Összegyűjtöttünk neked tizenhat adattudományi projektet forráskóddal, hogy valóban részt vehess az adattudomány valós idejű projektjeiben. Ezek segítenek növelni az önbizalmat, és azt is elmondják az interjúztatónak, hogy komolyan gondolja az adattudományt.

Tudja?

A tökéletes ötlet megtalálása a projektjéhez az, ami jobban foglalkoztatja, mint maga a projekt megvalósítása, ugye? Tehát ugyanezt szem előtt tartva, összeállítottunk egy több mint 500+ projektötletet tartalmazó listát csak az Ön számára. Mindössze annyit kell tennie, hogy ezt a cikket könyvjelzőbe teszi, és elkezdi.

  1. Python projektek
  2. Python Django (webfejlesztés) projektek
  3. Python játékfejlesztési projektek
  4. Python mesterséges intelligencia projektek
  5. Python gépi tanulási projektek
  6. Python gépi tanulás Projektek
  7. Python Data Science Projektek
  8. Python Deep Learning Projektek
  9. Python Computer Vision Projektek
  10. Python Internet of Things Projektek

In this blog, különböző adattudományi projektpéldákat fogunk felsorolni az R és Python nyelveken. Válasszuk szét ezeket a nehézség alapján, hogy megfelelő utat tudj követni.

Maradj naprakész a legújabb technológiai trendekkel
Join DataFlair on Telegram!!!

Top adattudományi projektötletek

Itt vannak a legjobb adattudományi projektötletek forráskóddal:

Beginner Data Science Projects

1.1 Fake News Detection

Vezesse karrierjét új magasságokba a következő munkával: Data Science Project for Beginners – Detecting Fake News with Python

python project detecting fake news - data science project ideas

A sárga újságírás királya, a fake news a közösségi médiában és más online médiában terjesztett hamis információk és átverések egy politikai napirend elérése érdekében. Ebben az adattudományi projektötletben Python segítségével olyan modellt építünk, amely pontosan felismeri, hogy egy hír valódi vagy hamis. Építünk egy TfidfVectorizer-t, és egy PassiveAggressiveClassifier-t fogunk használni a hírek “Valódi” és “Hamis” osztályozására. Egy 7796×4 alakú adathalmazt fogunk használni, és mindent Jupyter Labben fogunk végrehajtani.

Nyelv: Python

Adatkészlet/csomag: news.csv

1.2 Közúti sávvonalak felismerése

Nézze meg a sávvonalak felismerése adattudományi projekt teljes megvalósítását: Real-time Lane Line Detection in Python

lane line detection ml project

Data Science Project Idea: Az utakra rajzolt vonalak irányítják az emberi sofőröket, hogy hol vannak a sávok. Ez utal arra is, hogy milyen irányba kell kormányozni a járművet. Ez az alkalmazás kardinális fontosságú a vezető nélküli autók fejlesztéséhez.

Elkészíthet egy olyan alkalmazást, amely képes azonosítani a sávvonalakat bemeneti képekből vagy folyamatos videóképekből.

1.3 Sentiment Analysis

Check the complete implementation of Data Science Project with Source Code – Sentiment Analysis Project in R

Data-Science R Project Sentiment Analysis

Sentiment analysis is the act of analyzing words to determine sentiments and opinions that may be positive or negative in polarity. Ez egyfajta osztályozás, ahol az osztályok lehetnek binárisak (pozitív és negatív) vagy többszörösek (boldog, dühös, szomorú, undorodott,…). Ezt az adattudományi projektet az R nyelven fogjuk megvalósítani, és a ‘janeaustenR’ csomag által létrehozott adathalmazt fogjuk használni. Olyan általános célú lexikonokat fogunk használni, mint az AFINN, a bing és a loughran, belső összekapcsolást hajtunk végre, és végül egy szófelhőt építünk az eredmény megjelenítéséhez.

Nyelv: R

Dataset/Package: janeaustenR

1.4 A Parkinson-kór felismerése

Az adattudományi projektötlet – A Parkinson-kór felismerése XGBoosttal

Python gépi tanulási projekt - adattudományi projektötletek

Az adattudományt az egészségügyi ellátás és a szolgáltatások javítására kezdtük használni – ha egy betegséget korán meg tudunk jósolni, az sok előnnyel jár a prognózisra nézve. Ebben az adattudományi projektötletben tehát a Parkinson-kór felismerését tanuljuk meg Python segítségével. Ez a központi idegrendszer neurodegeneratív, progresszív rendellenessége, amely hatással van a mozgásra, remegést és merevséget okoz. Az agy dopamintermelő neuronjait érinti, és évente több mint 1 millió embert érint Indiában.

Nyelv: Python

Adatkészlet/Package: UCI ML Parkinsons dataset

1.5 Color Detection with Python

Build an application to detect colors with Beginner Data Science Project – Color Detection with OpenCV

project in python on color detection

Hányszor fordult már elő veled, hogy látás után sem emlékszel a szín nevére? A különböző RGB színértékek alapján 16 millió szín létezhet, de mi csak néhányra emlékszünk. Ezért ebben a projektben egy interaktív alkalmazást fogunk készíteni, amely bármilyen képből felismeri a kiválasztott színt. Ennek megvalósításához szükségünk lesz egy címkézett adatra az összes ismert színből, majd kiszámítjuk, hogy melyik szín hasonlít leginkább a kiválasztott színértékre.

Nyelv: Python

Adatkészlet: Codebrainz színnevek

1.6 Agydaganatok felismerése adattudományi módszerekkel

Adattudományi projektötlet: Számos híres mélytanulási projekt létezik MRI szkennelési adathalmazon. Az egyik ezek közül az agydaganatok felismerése. Ezeken az MRI-felvételeken transzfer tanulást használhat, hogy megkapja az osztályozáshoz szükséges jellemzőket. Vagy betaníthatod a saját konvolúciós neurális hálózatodat a semmiből az agydaganatok felismerésére.

Adatkészlet: Agy MRI képadatkészlet

1.7 Levélbetegségek felismerése

Adattudományi projektötlet: A növények betegségeinek felismerése nagyon fontos szerepet játszik a mezőgazdaságban. Ennek az adattudományi projektnek a célja egy képalapú automatikus vizsgálati felület biztosítása. Ez magában foglalja a saját tervezésű képfeldolgozási és mélytanulási technikák használatát. A növényi leveleket egészségesnek vagy fertőzöttnek fogja kategorizálni.

Adatkészlet: Leaf Dataset

Intermediate Data Science Projects

2.1 Speech Emotion Recognition

Történjen meg a Data Science Project Example – Speech Emotion Recognition with Librosa

Python project - speech emotion recognition

Most tanuljuk meg a különböző könyvtárak használatát. Ez az adattudományi projekt a Librosát használja a beszédérzelem-felismerés elvégzésére. A SER az a folyamat, amely megpróbálja felismerni az emberi érzelmeket és affektív állapotokat a beszédből. Mivel hangszínt és hangmagasságot használunk az érzelmek hangon keresztül történő kifejezésére, a SER lehetséges; de nehéz, mert az érzelmek szubjektívek, és a hang annotálása kihívást jelent. Az mfcc, chroma és mel jellemzőket fogjuk használni, és a RAVDESS adathalmazt használjuk az érzelmek felismerésére. A modellhez egy MLPC-osztályozót építünk.

Nyelv: Python

Adatkészlet/csomag: RAVDESS adatkészlet

2.2 Nem és kor felismerése adattudománnyal

Lépjünk a gázpedálra & lenyűgözzük a toborzókat a végső adattudományos projekttel – Nem és kor felismerése OpenCV-vel

Python projekt kor és nem felismerése

Ez egy érdekes adattudományos projekt Python segítségével. Egyetlen kép segítségével megtanulod megjósolni egy személy nemét és életkorát. Ebben bemutatjuk neked a számítógépes látást és annak alapelveit. Építünk egy konvolúciós neurális hálózatot, és a Tal Hassner és Gil Levi által képzett modelleket használjuk az Adience adatkészlethez. Útközben néhány .pb, .pbtxt, .prototxt és .caffemodel fájlt fogunk használni.

Nyelv: Python

Dataset/Package: Adience

2.3 Diabéteszes retinopátia

Adattudományi projektötlet: A diabéteszes retinopátia a vakság egyik vezető oka. Kifejleszthetsz egy automatikus módszert a diabéteszes retinopátia szűrésére. Beteg és normális emberek retinaképein betaníthatsz egy neurális hálózatot. Ez a projekt osztályozni fogja, hogy a betegnek van-e retinopátiája vagy sem.

Adatkészlet: Diabéteszes retinopátia adathalmaz

2.3 Uber Data Analysis in R

Check the complete implementation of Data Science Project with Source Code – Uber Data Analysis Project in R

Data Science R Project Uber Data Analysis

Ez egy adatvizualizációs projekt ggplot2-vel, ahol az R-t és annak könyvtárait fogjuk használni, és különböző paramétereket fogunk elemezni, például az utazásokat a napi órák és az éves hónapok alatti utazások szerint. Az Uber Pickups in New York City adatkészletet fogjuk használni, és az év különböző időszakairól készítünk vizualizációkat. Ebből megtudhatjuk, hogy az idő hogyan befolyásolja az ügyfelek utazásait.

Nyelv: R

Dataset/Package: Uber Pickups in New York City adatkészlet

2.4 Driver Drowsiness detection in Python

Drive your career to new heights by working on Top Data Science Project – Drowsiness Detection System with OpenCV & Keras

Data Science Project Ideas - Driver Drowsiness Detection System

Drowsy driving is extremely dangerous and around thousands of accidents happen every year due to drivers falling asleep as driving. Ebben a Python projektben egy olyan rendszert építünk, amely képes felismerni az álmos sofőröket, és csipogó riasztással is figyelmeztetni őket.

Ezt a projektet Keras és OpenCV segítségével valósítjuk meg. Az OpenCV-t fogjuk használni az arc- és szemfelismeréshez, a Keras segítségével pedig a szem állapotát (nyitott vagy zárt) fogjuk osztályozni Deep neural network technikák segítségével.

2.5 Chatbot projekt Pythonban

Csevegőrobot készítése Python segítségével & lépj feljebb a karrieredben – Chatbot NLTK-val & Keras

Python chatbot projekt

A chatbotok az üzleti élet elengedhetetlen részét képezik. Sok vállalkozásnak kell szolgáltatásokat nyújtania az ügyfeleinek, és ez sok munkaerőt, időt és erőfeszítést igényel az ügyfelek kezeléséhez. A chatbotok az ügyfelek által feltett gyakori kérdések megválaszolásával automatizálhatják az ügyfélkapcsolatok nagy részét. A chatbotoknak főként két típusa van: Tartományspecifikus és nyílt tartományú chatbotok. A domain-specifikus chatbotot gyakran egy adott probléma megoldására használják. Ezért okosan kell testreszabni, hogy hatékonyan működjön az Ön tartományában. A nyílt tartományú chatbotoknak bármilyen típusú kérdést fel lehet tenni, ezért hatalmas mennyiségű adatot kell betanítani.

Nyelv: Python

Adatállomány: Intents json fájl

2.6 Kézzel írt számjegyek felismerése projekt

Practically implement the Deep Learning Project with Source Code – Handwritten Digit Recognition with CNN

python deep learning project - handwritten digit recognition

A kézzel írt számjegyek MNIST adatállománya széles körben elterjedt az adattudósok és a gépi tanulás szerelmesei körében. Ez egy lenyűgöző projekt az adattudományba való belekezdéshez és a projektben szereplő folyamatok megértéséhez. A projektet a Convolutional Neural Networks segítségével valósítjuk meg, majd a valós idejű előrejelzéshez egy szép grafikus felhasználói felületet is építünk, hogy a számjegyeket egy vászonra rajzoljuk, majd a modell megjósolja a számjegyet.

Nyelv: Python

Adatkészlet: MNIST

A Top Data Science Interview Questions

Advanced Data Science Projects

3.1 Image Caption Generator Project in Python

Nézze meg az adattudományi projekt teljes megvalósítását forráskóddal – Image Caption Generator with CNN & LSTM

python alapú projekt - image caption generator with CNN and LSTM

Ez egy érdekes adattudományi projekt. Az ember számára könnyű feladat leírni, hogy mi van egy képen, de a számítógépek számára egy kép csak egy csomó szám, amelyek az egyes pixelek színértékét reprezentálják. Tehát ez egy nehéz feladat a számítógépek számára, hogy megértsék, mi van a képen, majd a leírás létrehozása természetes nyelven, például angolul, egy másik nehéz feladat. Ez a projekt mélytanulási technikákat használ, ahol egy konvolúciós neurális hálózatot (CNN) hajtunk végre rekurrens neurális hálózattal( LSTM) a képfelirat-generátor létrehozásához.

Adatkészlet: Flickr 8K

Nyelv: Python

Framework: Keras

3.2 Credit Card Fraud Detection Project

Adattudományi projektek – Credit Card Fraud Detection with Machine Learning

Data Science R Project Credit Card Fraud Detection using ML - Data Science Project Ideas

Most már elkezdted megérteni a módszereket és fogalmakat. Lépjünk tovább néhány haladó adattudományi projektre. Ebben a projektben az R-t olyan algoritmusokkal fogjuk használni, mint a döntési fák, a logisztikus regresszió, a mesterséges neurális hálózatok és a Gradient Boosting osztályozó. A Card Transactions adathalmazt fogjuk használni a hitelkártya-tranzakciók csalárd és valódi osztályozására. A különböző modelleket illesztjük és teljesítménygörbéket rajzolunk rájuk.

Language: R

Dataset/Package: Card Transactions dataset

3.3 Movie Recommendation System

Explore the implementation of the Best Data Science Project with Source Code- Movie Recommendation System Project in R

data science movie recommendation project - data science projects

In this data science project, we will use R to perform a movie recommendation through machine learning. Egy ajánlórendszer más felhasználók preferenciái és böngészési előzményei alapján szűrési folyamaton keresztül küld javaslatokat a felhasználóknak. Ha A és B szereti a Home Alone-t, B pedig a Mean Girls-t, akkor A számára is javasolhatja – lehet, hogy neki is tetszeni fog. Ezáltal az ügyfelek továbbra is elkötelezettek maradnak a platform iránt.

Nyelv: R

Dataset/Package: MovieLens adatkészlet

3.4 Ügyfelek szegmentálása

Adattudományi projekt (forráskóddal együtt) – Ügyfelek szegmentálása gépi tanulással

Adattudományi R projekt ügyfélszegmentálás

Ez az egyik legnépszerűbb projekt az adattudományban. Bármilyen kampány lefuttatása előtt a vállalatok különböző ügyfélcsoportokat hoznak létre.

Az ügyfélszegmentálás a felügyelet nélküli tanulás egyik népszerű alkalmazása. A klaszterezés segítségével a vállalatok azonosítják az ügyfelek szegmenseit, hogy megcélozzák a potenciális felhasználói bázist. Az ügyfeleket csoportokba osztják olyan közös jellemzők szerint, mint a nem, az életkor, az érdeklődési kör és a vásárlási szokások, hogy minden egyes csoportot hatékonyan tudjanak megcélozni. K-means klaszterezést fogunk használni, és a nemi és életkori eloszlásokat is megjelenítjük. Ezután elemezni fogjuk az éves jövedelmüket és a költési értékeket.

Nyelv: R

Dataset/Package: Mall_Customers dataset

3.5 Mellrák osztályozása

Nézze meg a teljes implementációt: Data Science Project in Python – Breast Cancer Classification with Deep Learning

project in python breast cancer classification - data science project ideas

Visszatérve az adattudomány orvosi hozzájárulásaihoz, tanuljuk meg a mellrák felismerését Python segítségével. Az IDC_regular adathalmazt fogjuk használni az emlőrák leggyakoribb formájának, az invazív duktális karcinómának a felismerésére. A tejcsatornában fejlődik ki, behatolva a rostos vagy zsíros emlőszövetbe a csatornán kívül. Ebben az adattudományi projektötletben a Deep Learninget és a Keras könyvtárat fogjuk használni az osztályozáshoz.

Nyelv: Python

Adatkészlet/csomag: IDC_regular

3.6 Közlekedési táblák felismerése

Az önvezető autók technológiájának pontossága a közlekedési táblák felismerésére vonatkozó adattudományi projekt segítségével CNN segítségével, forráskóddal

python adattudományi projekt a közlekedési táblák felismeréséről

A közlekedési táblák és szabályok nagyon fontosak, amelyeket minden járművezetőnek be kell tartania, hogy elkerülje a baleseteket. A szabály betartásához először is meg kell érteni, hogyan néz ki a közlekedési tábla. Az embernek meg kell tanulnia az összes közlekedési táblát, mielőtt megkapja a jogosítványt bármilyen jármű vezetésére. Most azonban egyre több az autonóm jármű, és a közeljövőben nem lesznek emberi sofőrök. A közlekedési táblák felismerése projektben megtanulhatod, hogyan tudja egy program egy képet bemenetként elfogadva azonosítani a közlekedési tábla típusát. A német közlekedési táblák felismerésének referenciaadatkészletét (GTSRB) használjuk egy mély neurális hálózat létrehozásához, amely felismeri, hogy egy közlekedési tábla melyik osztályba tartozik. Egy egyszerű GUI-t is építünk az alkalmazással való interakcióhoz.

Nyelv: Python

Dataset: GTSRB (German Traffic Sign Recognition Benchmark)

Összefoglaló

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.