Har du försökt bygga några datavetenskapsprojekt för att förbättra ditt CV och blev skrämd av storleken på koden och antalet begrepp som används? Känns det för utom räckhåll och krossade det dina drömmar om att bli datavetare? Vi har samlat för dig sexton datavetenskapsprojekt med källkod så att du faktiskt kan delta i datavetenskapens realtidsprojekt. Dessa kommer att bidra till att öka självförtroendet och även berätta för intervjuaren att du menar allvar med datavetenskap.
Vet du det?
Att hitta en perfekt idé för ditt projekt är något som oroar dig mer än att genomföra själva projektet, eller hur? Med samma sak i åtanke har vi sammanställt en lista med över 500+ projektidéer bara för dig. Allt du behöver göra är att bokmärka den här artikeln och komma igång.
- Pythonprojekt
- Python Djangoprojekt (webbutveckling)
- Pythonprojekt för spelutveckling
- Pythonprojekt för artificiell intelligens
- Pythonprojekt för maskininlärning. Projekt
- Python Data Science Projects
- Python Deep Learning Projects
- Python Computer Vision Projects
- Python Internet of Things Projects
I denna blogg, kommer vi att lista olika exempel på datavetenskapsprojekt i språken R och Python. Låt oss separera dessa utifrån svårighetsgrad så att du har en ordentlig väg att gå.
Håll dig uppdaterad med de senaste tekniktrenderna
Gå med i DataFlair på Telegram!!!
- De bästa idéerna för datavetenskapsprojekt
- Anbördsprojekten för datavetenskap
- 1.1 Detektering av falska nyheter
- 1.2 Detektering av körfältslinjer på vägar
- 1.3 Sentiment Analysis
- 1.4 Detektering av Parkinsons sjukdom
- 1.5 Färgdetektion med Python
- 1.6 Detektering av hjärntumörer med datavetenskap
- 1.7 Detektering av bladsjukdomar
- Intermediate Data Science Projects
- 2.1 Speech Emotion Recognition
- 2.2 Känsla- och åldersdetektering med datavetenskap
- 2.3 Diabetisk retinopati
- 2.3 Uber Data Analysis in R
- 2.4 Driver Drowsiness detection in Python
- 2.5 Chatbotprojekt i Python
- 2.6 Projekt för handskriven sifferigenkänning
- Advanced Data Science Projects
- 3.1 Image Caption Generator Project in Python
- 3.2 Projekt för upptäckt av kreditkortsbedrägerier
- 3.3 Filmrekommendationssystem
- 3.4 Kundsegmentering
- 3.5 Klassificering av bröstcancer
- 3.6 Erkännande av trafikskyltar
- Resumé
De bästa idéerna för datavetenskapsprojekt
Här är de bästa idéerna för datavetenskapsprojekt med källkod:
Anbördsprojekten för datavetenskap
1.1 Detektering av falska nyheter
Driv din karriär till nya höjder genom att arbeta med Data Science Project for Beginners – Detecting Fake News with Python
Falska nyheter, som är en kung av den gula journalistiken, är falsk information och bluffar som sprids via sociala medier och andra onlinemedier för att uppnå en politisk agenda. I den här datavetenskapliga projektidén kommer vi att använda Python för att bygga en modell som exakt kan upptäcka om en nyhet är äkta eller falsk. Vi kommer att bygga en TfidfVectorizer och använda en PassiveAggressiveClassifier för att klassificera nyheter i “äkta” och “falska”. Vi kommer att använda ett dataset med formen 7796×4 och utföra allt i Jupyter Lab.
Språk: Python
Dataset/Paket: news.csv
1.2 Detektering av körfältslinjer på vägar
Kontrollera den fullständiga implementeringen av datavetenskapsprojektet för detektering av körfältslinjer: Realtidsdetektering av körfält i Python
Datavetenskaplig projektidé: Idé: Datavetenskaplig projektidé: De linjer som dras på vägarna visar förarna var körfälten finns. De hänvisar också till riktningen för att styra fordonet. Denna tillämpning är viktig för att utveckla förarlösa bilar.
Du kan bygga en tillämpning som har förmågan att identifiera spårlinjer från inmatade bilder eller kontinuerliga videoframar.
1.3 Sentiment Analysis
Kontrollera den fullständiga implementeringen av Data Science Project with Source Code – Sentiment Analysis Project in R
Sentiment analysis is the act of analyzing words to determine sentiments and opinions that may be positive or negative in polarity. Detta är en typ av klassificering där klasserna kan vara binära (positiva och negativa) eller multipla (glad, arg, ledsen, äcklad,…). Vi kommer att genomföra det här datavetenskapsprojektet i språket R och använda datasetet av paketet “janeaustenR”. Vi kommer att använda generella lexikon som AFINN, bing och loughran, utföra en inre sammanfogning och i slutet kommer vi att bygga ett ordmoln för att visa resultatet.
Språk: R
Dataset/Paket: janeaustenR
1.4 Detektering av Parkinsons sjukdom
Sätt din bästa fot framåt genom att arbeta med Data Science Project Idea – Detecting Parkinson’s Disease with XGBoost
Vi har börjat använda datavetenskap för att förbättra hälso- och sjukvården och tjänsterna – om vi kan förutsäga en sjukdom i ett tidigt skede har det många fördelar på prognosen. Så i den här datavetenskapliga projektidén kommer vi att lära oss att upptäcka Parkinsons sjukdom med Python. Detta är en neurodegenerativ, progressiv sjukdom i det centrala nervsystemet som påverkar rörelsen och orsakar skakningar och stelhet. Detta påverkar dopaminproducerande neuroner i hjärnan och varje år drabbar det mer än 1 miljon individer i Indien.
Språk: Python
Dataset/Paket: UCI ML Parkinsons dataset
1.5 Färgdetektion med Python
Bygg en applikation för att upptäcka färger med Beginner Data Science Project – Color Detection with OpenCV
Hur många gånger har det slagit dig att du, även efter att du har sett färgen, inte kommer ihåg namnet på den? Det kan finnas 16 miljoner färger baserade på de olika RGB-färgvärdena men vi kommer bara ihåg några få. Så i det här projektet ska vi bygga en interaktiv app som upptäcker den valda färgen från vilken bild som helst. För att genomföra detta kommer vi att behöva en märkt data med alla kända färger och sedan kommer vi att beräkna vilken färg som liknar det valda färgvärdet mest.
Språk: Python
Dataset: Kodbrainz Färgnamn
1.6 Detektering av hjärntumörer med datavetenskap
Datavetenskaplig projektidé: Det finns många kända projekt för djupinlärning på MRI-skanningsdata. Ett av dem är upptäckt av hjärntumörer. Du kan använda överföringsinlärning på dessa MRI-skanningar för att få fram de funktioner som krävs för klassificering. Eller så kan du träna ditt eget neurala konvolutionsnätverk från grunden för att upptäcka hjärntumörer.
Dataset: Dataset: Dataset med MRI-bilder från hjärnan
1.7 Detektering av bladsjukdomar
Data Science Project Idea: Sjukdomsdetektering i växter spelar en mycket viktig roll inom jordbruket. Detta datavetenskapsprojekt syftar till att tillhandahålla ett bildbaserat automatiskt inspektionsgränssnitt. Det inbegriper användning av egenutvecklad bildbehandling och teknik för djupinlärning. Det kommer att kategorisera växtblad som friska eller infekterade.
Dataset: Dataset: Leaf Dataset
Intermediate Data Science Projects
2.1 Speech Emotion Recognition
Utforska den fullständiga implementeringen av Data Science Project Example – Speech Emotion Recognition with Librosa
Låts oss lära oss att använda olika bibliotek nu. I det här datavetenskapsprojektet används librosa för att utföra Speech Emotion Recognition. SER är processen där man försöker känna igen mänskliga känslor och affektiva tillstånd från tal. Eftersom vi använder ton och tonhöjd för att uttrycka känslor genom rösten är SER möjligt; men det är svårt eftersom känslor är subjektiva och det är en utmaning att annotera ljud. Vi kommer att använda mfcc-, chroma- och mel-funktionerna och använda RAVDESS-dataset för att känna igen känslor. Vi kommer att bygga en MLPClassifier för modellen.
Språk: Python
Dataset/Paket: RAVDESS-dataset
2.2 Känsla- och åldersdetektering med datavetenskap
Sätt gasen i botten & imponera på rekryterare med ultimat datavetenskapsprojekt – Känsla- och åldersdetektering med OpenCV
Det här är ett intressant datavetenskapsprojekt med Python. Med hjälp av bara en bild lär du dig att förutsäga en individs kön och åldersintervall. I detta introducerar vi dig till Computer Vision och dess principer. Vi kommer att bygga ett konvolutionellt neuralt nätverk och använda modeller som tränats av Tal Hassner och Gil Levi för datasetet Adience. Vi kommer att använda några .pb-, .pbtxt-, .prototxt- och .caffemodel-filer på vägen.
Språk: Python
Dataset/Paket: Adience
2.3 Diabetisk retinopati
Datavetenskaplig projektidé: Diabetisk retinopati är en av de främsta orsakerna till blindhet. Du kan utveckla en automatisk metod för screening av diabetisk retinopati. Du kan träna ett neuralt nätverk på näthinnebilder av drabbade och normala människor. Detta projekt kommer att klassificera om patienten har retinopati eller inte.
Dataset: Dataset: Diabetic Retinopathy Dataset
2.3 Uber Data Analysis in R
Kontrollera den fullständiga implementeringen av Data Science Project with Source Code – Uber Data Analysis Project in R
Detta är ett projekt för datavisualisering med ggplot2 där vi kommer att använda R och dess bibliotek och analysera olika parametrar som resor efter timmarna på ett dygn och resor under månaderna på ett år. Vi kommer att använda datasetet Uber Pickups in New York City och skapa visualiseringar för olika tidsramar under året. Detta talar om för oss hur tiden påverkar kundernas resor.
Språk: R
Dataset/Paket: Uber Pickups in New York City dataset
2.4 Driver Drowsiness detection in Python
Driv din karriär till nya höjder genom att arbeta med Top Data Science Project – Drowsiness Detection System with OpenCV Keras
Sömnig körning är extremt farligt och omkring tusentals olyckor inträffar varje år på grund av att förare somnar under körning. I det här Pythonprojektet kommer vi att bygga ett system som kan upptäcka sömniga förare och även varna dem med ett pipande larm.
Det här projektet genomförs med hjälp av Keras och OpenCV. Vi kommer att använda OpenCV för ansikts- och ögondetektion och med Keras kommer vi att klassificera ögats tillstånd (öppet eller stängt) med hjälp av djupa neurala nätverkstekniker.
2.5 Chatbotprojekt i Python
Bygg en chatbot med hjälp av Python& ta ett steg uppåt i din karriär – Chatbot med NLTK Keras
Chatbots är en viktig del av verksamheten. Många företag måste erbjuda tjänster till sina kunder och det krävs mycket arbetskraft, tid och ansträngning för att hantera kunderna. Chatbots kan automatisera det mesta av kundinteraktionen genom att svara på några av de vanliga frågorna som ställs av kunderna. Det finns huvudsakligen två typer av chatbots: Domänspecifika chattrobotar och chattrobotar med öppen domän. Den domänspecifika chattroboten används ofta för att lösa ett visst problem. Så du måste anpassa den smart för att den ska fungera effektivt inom din domän. Chatbots med öppen domän kan få alla typer av frågor, så det krävs stora mängder data för att träna dem.
Språk: Python
Dataset: Intents json-fil
2.6 Projekt för handskriven sifferigenkänning
Djupinlärningsprojektet med källkod – handskriven sifferigenkänning med CNN
MNIST-dataset med handskrivna siffror är utbrett bland datavetare och entusiaster av maskininlärning. Det är ett fantastiskt projekt för att komma igång med datavetenskap och förstå de processer som ingår i ett projekt. Projektet genomförs med hjälp av Convolutional Neural Networks och för prediktion i realtid bygger vi också ett trevligt grafiskt användargränssnitt för att rita siffror på en canvas och sedan kommer modellen att förutsäga siffran.
Språk: Python
Dataset: MNIST
Få anställning som datavetare med Top Data Science Interview Questions
Advanced Data Science Projects
3.1 Image Caption Generator Project in Python
Kontrollera den fullständiga implementeringen av datavetenskapsprojektet med källkod – Image Caption Generator with CNN LSTM
Detta är ett intressant datavetenskapsprojekt. Att beskriva vad som finns i en bild är en enkel uppgift för människor, men för datorer är en bild bara en massa siffror som representerar färgvärdet för varje pixel. Så det är en svår uppgift för datorer att förstå vad som finns i bilden och att sedan generera beskrivningen på ett naturligt språk som engelska är ytterligare en svår uppgift. I det här projektet används tekniker för djupinlärning där vi implementerar ett Convolutional neural network (CNN) med Recurrent Neural Network (LSTM) för att bygga bildtextgeneratorn.
Dataset: Flickr 8K
Språk: Python
Språk: Python
Ramverk: Keras
3.2 Projekt för upptäckt av kreditkortsbedrägerier
Sätt din bästa fot framåt genom att arbeta med datavetenskapsprojekt – upptäckt av kreditkortsbedrägerier med maskininlärning
Nuförtiden har du börjat förstå metoderna och begreppen. Låt oss gå vidare till några avancerade datavetenskapsprojekt. I det här projektet kommer vi att använda R med algoritmer som Decision Trees, Logistic Regression, Artificial Neural Networks och Gradient Boosting Classifier. Vi kommer att använda datasetet Card Transactions för att klassificera kreditkortstransaktioner i bedrägliga och äkta transaktioner. Vi kommer att anpassa de olika modellerna och rita prestandakurvor för dem.
Språk: R
Dataset/Paket: Korttransaktioner dataset
3.3 Filmrekommendationssystem
Utforska genomförandet av Best Data Science Project with Source Code- Movie Recommendation System Project in R
I det här datavetenskapsprojektet använder vi R för att utföra en filmrekommendation genom maskininlärning. Ett rekommendationssystem skickar ut förslag till användare genom en filtreringsprocess som bygger på andra användares preferenser och surfhistorik. Om A och B gillar Home Alone och B gillar Mean Girls kan den föreslås till A – de kanske också gillar den. Detta håller kunderna engagerade i plattformen.
Språk: R
Dataset/Paket: MovieLens-dataset
3.4 Kundsegmentering
Sätt medaljen i pedal & imponera på rekryterare med datavetenskapsprojekt (källkod ingår) – Kundsegmentering med maskininlärning
Det här är ett av de mest populära projekten inom datavetenskap. Innan företag kör någon kampanj skapar de olika grupper av kunder.
Kundersegmentering är en populär tillämpning av oövervakad inlärning. Med hjälp av kluster identifierar företag segment av kunder för att rikta in sig på den potentiella användarbasen. De delar in kunderna i grupper enligt gemensamma egenskaper som kön, ålder, intressen och konsumtionsvanor så att de kan marknadsföra sig till varje grupp på ett effektivt sätt. Vi kommer att använda K-means-klustering och även visualisera köns- och åldersfördelningen. Sedan kommer vi att analysera deras årsinkomster och konsumtionsresultat.
Språk: R
Dataset/Paket: Mall_Customers dataset
3.5 Klassificering av bröstcancer
Kontrollera den fullständiga implementeringen av Data Science Project in Python – Breast Cancer Classification with Deep Learning
Vi återvänder till data vetenskapens medicinska bidrag och lär oss nu hur man upptäcker bröstcancer med Python. Vi kommer att använda datasetet IDC_regular för att upptäcka förekomsten av Invasive Ductal Carcinoma, den vanligaste formen av bröstcancer. Den utvecklas i en mjölkkanal och invaderar den fibrösa eller feta bröstvävnaden utanför kanalen. I detta datavetenskapsprojekt kommer vi att använda Deep Learning och Keras-biblioteket för klassificering.
Språk: Python
Dataset/Paket: IDC_regular
3.6 Erkännande av trafikskyltar
Att uppnå noggrannhet i tekniken för självkörande bilar med Data Science Project on Traffic Signs Recognition using CNN with Source Code
Trafikskyltar och trafikregler är mycket viktiga som varje förare måste följa för att undvika olyckor. För att följa regeln måste man först förstå hur trafikskylten ser ut. En människa måste lära sig alla trafikskyltar innan de får körkort för att köra något fordon. Men nu är autonoma fordon på frammarsch och det kommer inte att finnas några mänskliga förare i framtiden. I projektet om igenkänning av trafikskyltar kommer du att lära dig hur ett program kan identifiera typen av trafikskylt genom att ta en bild som indata. Det tyska referensdatasetet för identifiering av trafikskyltar (GTSRB) används för att bygga ett djupt neuralt nätverk för att känna igen vilken klass en trafikskylt tillhör. Vi bygger också ett enkelt GUI för att interagera med programmet.
Språk: Python
Dataset: GTSRB (German Traffic Sign Recognition Benchmark)