Próbáltál néhány adattudományi projektet építeni az önéletrajzod javítására, de megijedtél a kód méretétől és a felhasznált fogalmak számától? Túlságosan elérhetetlennek érzed, és összetörték az adattudóssá válásról szőtt álmaidat? Összegyűjtöttünk neked tizenhat adattudományi projektet forráskóddal, hogy valóban részt vehess az adattudomány valós idejű projektjeiben. Ezek segítenek növelni az önbizalmat, és azt is elmondják az interjúztatónak, hogy komolyan gondolja az adattudományt.
Tudja?
A tökéletes ötlet megtalálása a projektjéhez az, ami jobban foglalkoztatja, mint maga a projekt megvalósítása, ugye? Tehát ugyanezt szem előtt tartva, összeállítottunk egy több mint 500+ projektötletet tartalmazó listát csak az Ön számára. Mindössze annyit kell tennie, hogy ezt a cikket könyvjelzőbe teszi, és elkezdi.
- Python projektek
- Python Django (webfejlesztés) projektek
- Python játékfejlesztési projektek
- Python mesterséges intelligencia projektek
- Python gépi tanulási projektek
- Python gépi tanulás Projektek
- Python Data Science Projektek
- Python Deep Learning Projektek
- Python Computer Vision Projektek
- Python Internet of Things Projektek
In this blog, különböző adattudományi projektpéldákat fogunk felsorolni az R és Python nyelveken. Válasszuk szét ezeket a nehézség alapján, hogy megfelelő utat tudj követni.
Maradj naprakész a legújabb technológiai trendekkel
Join DataFlair on Telegram!!!
- Top adattudományi projektötletek
- Beginner Data Science Projects
- 1.1 Fake News Detection
- 1.2 Közúti sávvonalak felismerése
- 1.3 Sentiment Analysis
- 1.4 A Parkinson-kór felismerése
- 1.5 Color Detection with Python
- 1.6 Agydaganatok felismerése adattudományi módszerekkel
- 1.7 Levélbetegségek felismerése
- Intermediate Data Science Projects
- 2.1 Speech Emotion Recognition
- 2.2 Nem és kor felismerése adattudománnyal
- 2.3 Diabéteszes retinopátia
- 2.3 Uber Data Analysis in R
- 2.4 Driver Drowsiness detection in Python
- 2.5 Chatbot projekt Pythonban
- 2.6 Kézzel írt számjegyek felismerése projekt
- Advanced Data Science Projects
- 3.1 Image Caption Generator Project in Python
- 3.2 Credit Card Fraud Detection Project
- 3.3 Movie Recommendation System
- 3.4 Ügyfelek szegmentálása
- 3.5 Mellrák osztályozása
- 3.6 Közlekedési táblák felismerése
- Összefoglaló
Top adattudományi projektötletek
Itt vannak a legjobb adattudományi projektötletek forráskóddal:
Beginner Data Science Projects
1.1 Fake News Detection
Vezesse karrierjét új magasságokba a következő munkával: Data Science Project for Beginners – Detecting Fake News with Python
A sárga újságírás királya, a fake news a közösségi médiában és más online médiában terjesztett hamis információk és átverések egy politikai napirend elérése érdekében. Ebben az adattudományi projektötletben Python segítségével olyan modellt építünk, amely pontosan felismeri, hogy egy hír valódi vagy hamis. Építünk egy TfidfVectorizer-t, és egy PassiveAggressiveClassifier-t fogunk használni a hírek “Valódi” és “Hamis” osztályozására. Egy 7796×4 alakú adathalmazt fogunk használni, és mindent Jupyter Labben fogunk végrehajtani.
Nyelv: Python
Adatkészlet/csomag: news.csv
1.2 Közúti sávvonalak felismerése
Nézze meg a sávvonalak felismerése adattudományi projekt teljes megvalósítását: Real-time Lane Line Detection in Python
Data Science Project Idea: Az utakra rajzolt vonalak irányítják az emberi sofőröket, hogy hol vannak a sávok. Ez utal arra is, hogy milyen irányba kell kormányozni a járművet. Ez az alkalmazás kardinális fontosságú a vezető nélküli autók fejlesztéséhez.
Elkészíthet egy olyan alkalmazást, amely képes azonosítani a sávvonalakat bemeneti képekből vagy folyamatos videóképekből.
1.3 Sentiment Analysis
Check the complete implementation of Data Science Project with Source Code – Sentiment Analysis Project in R
Sentiment analysis is the act of analyzing words to determine sentiments and opinions that may be positive or negative in polarity. Ez egyfajta osztályozás, ahol az osztályok lehetnek binárisak (pozitív és negatív) vagy többszörösek (boldog, dühös, szomorú, undorodott,…). Ezt az adattudományi projektet az R nyelven fogjuk megvalósítani, és a ‘janeaustenR’ csomag által létrehozott adathalmazt fogjuk használni. Olyan általános célú lexikonokat fogunk használni, mint az AFINN, a bing és a loughran, belső összekapcsolást hajtunk végre, és végül egy szófelhőt építünk az eredmény megjelenítéséhez.
Nyelv: R
Dataset/Package: janeaustenR
1.4 A Parkinson-kór felismerése
Az adattudományi projektötlet – A Parkinson-kór felismerése XGBoosttal
Az adattudományt az egészségügyi ellátás és a szolgáltatások javítására kezdtük használni – ha egy betegséget korán meg tudunk jósolni, az sok előnnyel jár a prognózisra nézve. Ebben az adattudományi projektötletben tehát a Parkinson-kór felismerését tanuljuk meg Python segítségével. Ez a központi idegrendszer neurodegeneratív, progresszív rendellenessége, amely hatással van a mozgásra, remegést és merevséget okoz. Az agy dopamintermelő neuronjait érinti, és évente több mint 1 millió embert érint Indiában.
Nyelv: Python
Adatkészlet/Package: UCI ML Parkinsons dataset
1.5 Color Detection with Python
Build an application to detect colors with Beginner Data Science Project – Color Detection with OpenCV
Hányszor fordult már elő veled, hogy látás után sem emlékszel a szín nevére? A különböző RGB színértékek alapján 16 millió szín létezhet, de mi csak néhányra emlékszünk. Ezért ebben a projektben egy interaktív alkalmazást fogunk készíteni, amely bármilyen képből felismeri a kiválasztott színt. Ennek megvalósításához szükségünk lesz egy címkézett adatra az összes ismert színből, majd kiszámítjuk, hogy melyik szín hasonlít leginkább a kiválasztott színértékre.
Nyelv: Python
Adatkészlet: Codebrainz színnevek
1.6 Agydaganatok felismerése adattudományi módszerekkel
Adattudományi projektötlet: Számos híres mélytanulási projekt létezik MRI szkennelési adathalmazon. Az egyik ezek közül az agydaganatok felismerése. Ezeken az MRI-felvételeken transzfer tanulást használhat, hogy megkapja az osztályozáshoz szükséges jellemzőket. Vagy betaníthatod a saját konvolúciós neurális hálózatodat a semmiből az agydaganatok felismerésére.
Adatkészlet: Agy MRI képadatkészlet
1.7 Levélbetegségek felismerése
Adattudományi projektötlet: A növények betegségeinek felismerése nagyon fontos szerepet játszik a mezőgazdaságban. Ennek az adattudományi projektnek a célja egy képalapú automatikus vizsgálati felület biztosítása. Ez magában foglalja a saját tervezésű képfeldolgozási és mélytanulási technikák használatát. A növényi leveleket egészségesnek vagy fertőzöttnek fogja kategorizálni.
Adatkészlet: Leaf Dataset
Intermediate Data Science Projects
2.1 Speech Emotion Recognition
Történjen meg a Data Science Project Example – Speech Emotion Recognition with Librosa
Most tanuljuk meg a különböző könyvtárak használatát. Ez az adattudományi projekt a Librosát használja a beszédérzelem-felismerés elvégzésére. A SER az a folyamat, amely megpróbálja felismerni az emberi érzelmeket és affektív állapotokat a beszédből. Mivel hangszínt és hangmagasságot használunk az érzelmek hangon keresztül történő kifejezésére, a SER lehetséges; de nehéz, mert az érzelmek szubjektívek, és a hang annotálása kihívást jelent. Az mfcc, chroma és mel jellemzőket fogjuk használni, és a RAVDESS adathalmazt használjuk az érzelmek felismerésére. A modellhez egy MLPC-osztályozót építünk.
Nyelv: Python
Adatkészlet/csomag: RAVDESS adatkészlet
2.2 Nem és kor felismerése adattudománnyal
Lépjünk a gázpedálra & lenyűgözzük a toborzókat a végső adattudományos projekttel – Nem és kor felismerése OpenCV-vel
Ez egy érdekes adattudományos projekt Python segítségével. Egyetlen kép segítségével megtanulod megjósolni egy személy nemét és életkorát. Ebben bemutatjuk neked a számítógépes látást és annak alapelveit. Építünk egy konvolúciós neurális hálózatot, és a Tal Hassner és Gil Levi által képzett modelleket használjuk az Adience adatkészlethez. Útközben néhány .pb, .pbtxt, .prototxt és .caffemodel fájlt fogunk használni.
Nyelv: Python
Dataset/Package: Adience
2.3 Diabéteszes retinopátia
Adattudományi projektötlet: A diabéteszes retinopátia a vakság egyik vezető oka. Kifejleszthetsz egy automatikus módszert a diabéteszes retinopátia szűrésére. Beteg és normális emberek retinaképein betaníthatsz egy neurális hálózatot. Ez a projekt osztályozni fogja, hogy a betegnek van-e retinopátiája vagy sem.
Adatkészlet: Diabéteszes retinopátia adathalmaz
2.3 Uber Data Analysis in R
Check the complete implementation of Data Science Project with Source Code – Uber Data Analysis Project in R
Ez egy adatvizualizációs projekt ggplot2-vel, ahol az R-t és annak könyvtárait fogjuk használni, és különböző paramétereket fogunk elemezni, például az utazásokat a napi órák és az éves hónapok alatti utazások szerint. Az Uber Pickups in New York City adatkészletet fogjuk használni, és az év különböző időszakairól készítünk vizualizációkat. Ebből megtudhatjuk, hogy az idő hogyan befolyásolja az ügyfelek utazásait.
Nyelv: R
Dataset/Package: Uber Pickups in New York City adatkészlet
2.4 Driver Drowsiness detection in Python
Drive your career to new heights by working on Top Data Science Project – Drowsiness Detection System with OpenCV & Keras
Drowsy driving is extremely dangerous and around thousands of accidents happen every year due to drivers falling asleep as driving. Ebben a Python projektben egy olyan rendszert építünk, amely képes felismerni az álmos sofőröket, és csipogó riasztással is figyelmeztetni őket.
Ezt a projektet Keras és OpenCV segítségével valósítjuk meg. Az OpenCV-t fogjuk használni az arc- és szemfelismeréshez, a Keras segítségével pedig a szem állapotát (nyitott vagy zárt) fogjuk osztályozni Deep neural network technikák segítségével.
2.5 Chatbot projekt Pythonban
Csevegőrobot készítése Python segítségével & lépj feljebb a karrieredben – Chatbot NLTK-val & Keras
A chatbotok az üzleti élet elengedhetetlen részét képezik. Sok vállalkozásnak kell szolgáltatásokat nyújtania az ügyfeleinek, és ez sok munkaerőt, időt és erőfeszítést igényel az ügyfelek kezeléséhez. A chatbotok az ügyfelek által feltett gyakori kérdések megválaszolásával automatizálhatják az ügyfélkapcsolatok nagy részét. A chatbotoknak főként két típusa van: Tartományspecifikus és nyílt tartományú chatbotok. A domain-specifikus chatbotot gyakran egy adott probléma megoldására használják. Ezért okosan kell testreszabni, hogy hatékonyan működjön az Ön tartományában. A nyílt tartományú chatbotoknak bármilyen típusú kérdést fel lehet tenni, ezért hatalmas mennyiségű adatot kell betanítani.
Nyelv: Python
Adatállomány: Intents json fájl
2.6 Kézzel írt számjegyek felismerése projekt
Practically implement the Deep Learning Project with Source Code – Handwritten Digit Recognition with CNN
A kézzel írt számjegyek MNIST adatállománya széles körben elterjedt az adattudósok és a gépi tanulás szerelmesei körében. Ez egy lenyűgöző projekt az adattudományba való belekezdéshez és a projektben szereplő folyamatok megértéséhez. A projektet a Convolutional Neural Networks segítségével valósítjuk meg, majd a valós idejű előrejelzéshez egy szép grafikus felhasználói felületet is építünk, hogy a számjegyeket egy vászonra rajzoljuk, majd a modell megjósolja a számjegyet.
Nyelv: Python
Adatkészlet: MNIST
A Top Data Science Interview Questions
Advanced Data Science Projects
3.1 Image Caption Generator Project in Python
Nézze meg az adattudományi projekt teljes megvalósítását forráskóddal – Image Caption Generator with CNN & LSTM
Ez egy érdekes adattudományi projekt. Az ember számára könnyű feladat leírni, hogy mi van egy képen, de a számítógépek számára egy kép csak egy csomó szám, amelyek az egyes pixelek színértékét reprezentálják. Tehát ez egy nehéz feladat a számítógépek számára, hogy megértsék, mi van a képen, majd a leírás létrehozása természetes nyelven, például angolul, egy másik nehéz feladat. Ez a projekt mélytanulási technikákat használ, ahol egy konvolúciós neurális hálózatot (CNN) hajtunk végre rekurrens neurális hálózattal( LSTM) a képfelirat-generátor létrehozásához.
Adatkészlet: Flickr 8K
Nyelv: Python
Framework: Keras
3.2 Credit Card Fraud Detection Project
Adattudományi projektek – Credit Card Fraud Detection with Machine Learning
Most már elkezdted megérteni a módszereket és fogalmakat. Lépjünk tovább néhány haladó adattudományi projektre. Ebben a projektben az R-t olyan algoritmusokkal fogjuk használni, mint a döntési fák, a logisztikus regresszió, a mesterséges neurális hálózatok és a Gradient Boosting osztályozó. A Card Transactions adathalmazt fogjuk használni a hitelkártya-tranzakciók csalárd és valódi osztályozására. A különböző modelleket illesztjük és teljesítménygörbéket rajzolunk rájuk.
Language: R
Dataset/Package: Card Transactions dataset
3.3 Movie Recommendation System
Explore the implementation of the Best Data Science Project with Source Code- Movie Recommendation System Project in R
In this data science project, we will use R to perform a movie recommendation through machine learning. Egy ajánlórendszer más felhasználók preferenciái és böngészési előzményei alapján szűrési folyamaton keresztül küld javaslatokat a felhasználóknak. Ha A és B szereti a Home Alone-t, B pedig a Mean Girls-t, akkor A számára is javasolhatja – lehet, hogy neki is tetszeni fog. Ezáltal az ügyfelek továbbra is elkötelezettek maradnak a platform iránt.
Nyelv: R
Dataset/Package: MovieLens adatkészlet
3.4 Ügyfelek szegmentálása
Adattudományi projekt (forráskóddal együtt) – Ügyfelek szegmentálása gépi tanulással
Ez az egyik legnépszerűbb projekt az adattudományban. Bármilyen kampány lefuttatása előtt a vállalatok különböző ügyfélcsoportokat hoznak létre.
Az ügyfélszegmentálás a felügyelet nélküli tanulás egyik népszerű alkalmazása. A klaszterezés segítségével a vállalatok azonosítják az ügyfelek szegmenseit, hogy megcélozzák a potenciális felhasználói bázist. Az ügyfeleket csoportokba osztják olyan közös jellemzők szerint, mint a nem, az életkor, az érdeklődési kör és a vásárlási szokások, hogy minden egyes csoportot hatékonyan tudjanak megcélozni. K-means klaszterezést fogunk használni, és a nemi és életkori eloszlásokat is megjelenítjük. Ezután elemezni fogjuk az éves jövedelmüket és a költési értékeket.
Nyelv: R
Dataset/Package: Mall_Customers dataset
3.5 Mellrák osztályozása
Nézze meg a teljes implementációt: Data Science Project in Python – Breast Cancer Classification with Deep Learning
Visszatérve az adattudomány orvosi hozzájárulásaihoz, tanuljuk meg a mellrák felismerését Python segítségével. Az IDC_regular adathalmazt fogjuk használni az emlőrák leggyakoribb formájának, az invazív duktális karcinómának a felismerésére. A tejcsatornában fejlődik ki, behatolva a rostos vagy zsíros emlőszövetbe a csatornán kívül. Ebben az adattudományi projektötletben a Deep Learninget és a Keras könyvtárat fogjuk használni az osztályozáshoz.
Nyelv: Python
Adatkészlet/csomag: IDC_regular
3.6 Közlekedési táblák felismerése
Az önvezető autók technológiájának pontossága a közlekedési táblák felismerésére vonatkozó adattudományi projekt segítségével CNN segítségével, forráskóddal
A közlekedési táblák és szabályok nagyon fontosak, amelyeket minden járművezetőnek be kell tartania, hogy elkerülje a baleseteket. A szabály betartásához először is meg kell érteni, hogyan néz ki a közlekedési tábla. Az embernek meg kell tanulnia az összes közlekedési táblát, mielőtt megkapja a jogosítványt bármilyen jármű vezetésére. Most azonban egyre több az autonóm jármű, és a közeljövőben nem lesznek emberi sofőrök. A közlekedési táblák felismerése projektben megtanulhatod, hogyan tudja egy program egy képet bemenetként elfogadva azonosítani a közlekedési tábla típusát. A német közlekedési táblák felismerésének referenciaadatkészletét (GTSRB) használjuk egy mély neurális hálózat létrehozásához, amely felismeri, hogy egy közlekedési tábla melyik osztályba tartozik. Egy egyszerű GUI-t is építünk az alkalmazással való interakcióhoz.
Nyelv: Python
Dataset: GTSRB (German Traffic Sign Recognition Benchmark)