"topic:data-normalization" — Search

143 results for “topic:data-normalization”

FxNorm-Automix - Implementation of automatic music mixing systems. We show how we can use wet music data and repurpose it to train a fully automatic mixing system

Python13421Updated 3 days ago

automatic-mixingdata-normalizationintelligent-music-productionmachine-learning

praneet1988/CSBB-Shiny

Computational Suite for Bioinformaticians and Biologists (CSBB) is a RShiny application developed with an intention to empower researchers from wet and dry lab to perform downstream Bioinformatics analysis

R3618Updated 1 year ago

analysis-frameworkdata-analysisdata-normalizationdata-visualizationngsngs-analysisngs-pipelinershinyrshiny-applicationsingle-cellsingle-cell-rna-seq

azeezat123/Global_Terrorism_Exploratory_Data_Analysis-

An exploratory data analysis on a global terrorism dataset

142Updated 1 year ago

data-normalizationexploratory-data-analysispostgresqlpowerbipython

ghostintheshell-192/sheet-atlas

Cross-platform desktop app to search, compare, normalize and analyze Excel files. Data regions, column-level type correction, in-place export. Built with .NET 8 + Avalonia UI.

C#130Updated 5 days ago

avalonia-uicomparison-toolcross-platformcsharpcsvdata-analysisdata-normalizationdesktop-appdotnetexcelexcel-toolsfile-comparisonopen-sourcespreadsheetspreadsheet-analysisxlsxlsx

wbsg-uni-mannheim/PyDI

The PyDI framework provides methods for end-to-end data integration. The framework covers all steps of the integration process, including schema matching, data translation, entity matching, and data fusion. The framework offers traditional string-based methods as well as modern LLM- and embedding-based techniques for these tasks.

HTML120Updated 2 weeks ago

data-fusiondata-integrationdata-normalizationdata-translationentity-matchingentity-resolutioninformation-extractionschema-matching

msk610/MovieGrossPredictor

Machine Learning Algorithms to predict overall movie gross using IMDB dataset from kaggle

C++110Updated 5 years ago

data-normalizationmachine-learning-algorithmsmoviessupervised-learning

ermshaua/preon

preon (PREcision Oncology Normalization) is a fuzzy search tool for medical entities.

Jupyter Notebook80Updated 4 months ago

cancer-typesdata-integrationdata-normalizationdrug-name-extractionprecision-oncologypythonresearchsciencetext-mining

altunenes/asap-rs

Zero-dependency Rust implementation of ASAP (Automatic Smoothing for Attention Prioritization) for Time Series

Rust61Updated 1 month ago

algorithmsdata-normalizationdata-smoothingdata-visualizationdimension-reductionfftfourier-transformrust-statssignal-processingsmoothingtime-seriestime-series-analysiszero-dependency

ilgwonPark2/SystemAnalysisDesign

Term Project repository for System Analysis and Design course in ITM, Seoultech.

Python60Updated 6 years ago

analysisbig-datadatadata-analysisdata-collectiondata-miningdata-normalizationdata-visualizationdatabaseseoultech

deltafi/deltafi

DeltaFi is a flexible, code-light data transformation and normalization platform.

Java52Updated 1 week ago

data-normalizationdata-transformationdeltafinormalization

wefindx/metaform

A utility for defining metadata for data types and formats.

Python50Updated 4 years ago

data-alignmentdata-normalizationdata-preparationschema-alignment

Abdullah321Umar/ElevvoPathways-DataAnalytics_Internship-TASK3

🔷 Data Cleaning and Insight Generation from Survey Data 🔷 Cleaned and preprocessed Kaggle’s Data Science Survey data, handling missing values, duplicates, and categorical responses. Applied label encoding and normalization to prepare the dataset for analysis. Built 12+ visualizations (pie, scatter, box, line, heatmap, etc.)

Jupyter Notebook40Updated 4 months ago

attention-to-detailcleaned-csvcorrelation-analysisdata-normalizationdata-presentationdescriptive-statisticsdocumentation-writingfeature-engineeringinsight-extractioninsight-storytellingmatplotlibmulti-select-column-handlingpandaspdfpdfpagesproblem-solving-mindsetproject-organizationpython-programmingseaborn

cyrildever/es-normalizer

Contact data normalization adapted from the Empreinte Sociométrique's normalizers

TypeScript42Updated 2 months ago

data-normalizationjavascript-librarytypescript-library

emsalcengiz/data-normalize-with-etl-procesess

I made various data normalization operations with python scripts. Target data in CSV format

Python31Updated 2 years ago

data-normalizationetl-processpython-script

Yash22222/Data-Analysis-With-Python

This repository provides a practical introduction to data acquisition and analysis using Pandas. It covers loading datasets, exploring data, manipulating data, and gaining insights through statistical summaries. Ideal for beginners, it offers code examples and explanations to enhance your data manipulation skills using Pandas for Python.

Jupyter Notebook30Updated 9 months ago

binningdatadata-acquisitiondata-analysisdata-binningdata-cleaningdata-formattingdata-integrationdata-normalizationdata-preprocessingdata-sciencedata-transformationdata-wranglingdataframedescriptionnumpypandaspandas-dataframepythonpython3

okozolin/redux-toolkit-show-info-from-api

Web app to fetch artists events data via public API. Managing global state with redux-toolkit. Responsive design with material-ui. Cool animations and transitions

JavaScript30Updated 4 years ago

animationscreateasyncthunkcreateentityadapterdata-normalizationdata-persistencematerial-uimemoizationperformance-optimizationreactreduxredux-thunkredux-toolkitresponsive-design

themrityunjaypathak/Feature-Engineering

Feature Engineering with Python

Jupyter Notebook30Updated 2 weeks ago

column-transformerdata-normalizationdata-standardizationdummy-variablesimbalanced-dataiqrknn-imputerlabel-encodingmodified-zscoreonehot-encodingordinal-encodingoutlier-removalpipelinesimple-imputerzscore

mshavliuk/thesis

Transformer model for Biomarkers prediction: Evaluating the impact of ECDF normalization on model robustness in clinical data

TeX30Updated 1 year ago

data-normalizationdeep-learningelectronic-health-recordsmachine-learningmaster-thesismortality-predictiontime-series-forecastingtransformer-models

gabanox/llm-data-normalization-pattern

A production-ready serverless pattern for intelligent data normalization using Claude Haiku via AWS Bedrock

Python31Updated 1 month ago

awsbedrockclaudedata-normalizationdynamodbetllambdallmsamserverless

sushant1827/Finding-Donors-for-Charity-using-Machine-Learning

Machine Learning Nano-degree Project : To help a charity organization identify people most likely to donate to their cause

Jupyter Notebook21Updated 5 months ago

accuracyconfusion-matrixdata-normalizationdata-preprocessingf1-scorefbeta-scorefeature-importancefeature-selectionfinding-donorsgradient-boostinggridsearchcvmin-max-scalernaive-predictorskewed-datasupervised-learningtuning-parameters

J-

J-sephB-lt-n/knowledge-base

A large pile of interesting and/or useful information

Python20Updated 1 week ago

algorithmscausal-inferencedata-normalizationdatabasekelly-criterionlarge-language-modelsllmmachine-learningnlpobsidian-mdplotly-dashprompt-engineeringregexsemi-supervised-learningstatistics

Tanguy9862/AI-Powered-FDA-Drug-Scraper

Developed a Python-based web scraper leveraging generative AI with LangChain and GPT-4o-mini to extract and classify FDA drug approval data. Processed over 1,770 records, dynamically categorizing medications and treatment areas using LLMs to simplify complex medical information into actionable insights.

Python20Updated 1 month ago

data-classificationdata-normalizationgpt-4o-minilangchainllmsportfolioweb-scraping

guanjue/VISION_mouseHem_code

The data preprocessing pipeline for the VISION project (for mouse data)

R22Updated 5 years ago

data-normalizationdata-preprocessingepigenomicshematopoiesismouse-datapipelinesignal-to-noise

hurkanugur/Car-Price-Predictor

This project predicts used car prices using a feedforward neural network regression model implemented in PyTorch. Features include car age, mileage, and other attributes. The pipeline supports feature normalization, train/validation/test splitting, and visualization of training and validation loss curves.

Python20Updated 2 months ago

adam-optimizerbatch-normalizationcar-price-predictiondata-normalizationdeep-learninggradiogradio-appgradio-interfacehe-initializermean-squared-errormodel-evaluationmodel-trainingpandasprice-predictionpythonpytorchregression-modelsrelu-layerscikit-learntrain-validation-test

erreduarte/data-migration-project

Highlighting expertise in data migration, data normalization and standardization, this project demonstrates successful data transfer from Snowflake to Databricks. It emphasizes optimized data flow and enhanced accessibility through standardization, showcasing a commitment to ethical data practices.

21Updated 5 days ago

data-managementdata-manipulationdata-migrationdata-modelingdata-normalizationdata-optimizationdata-standardizationdatabrickssnowflakesql

HannahIgboke/A-Scalable-Database-system-for-Olist-store

The aim of this project is to develop, design, and build a comprehensive and scalable database system for Olist Store to handle potential increases in data volume and allow for more efficient data collection, retrieval, and organization.

20Updated 1 year ago

data-normalizationdatabase-designdatabase-triggersforeign-key-constraintsmysqlscalabilitysql

Mengbo-Li/ruvms

Removing unwanted variation in mass spectrometry data with missing values

R20Updated 3 weeks ago

data-normalizationmass-spectrometryruv

emanuele-tarchi-it/medical-triage-system

Clinical Decision Support System (CDSS) for Emergency Triage. Python implementation of regional healthcare protocols featuring complex logic, input normalization, and automated clinical pathways

Python20Updated 1 month ago

algorithmscareer-changeclinical-decision-supportcloud-computingcloud-engineer-pathdata-normalizationdigital-healthembedded-systemshealth-ithealthcarel31medical-softwareosspythonpython3raspberry-pitriagetriage-system

jkeys-ecg-nmsu/bioinformatics-scripts

A collection of bioinformatics and data mining scripts

Python10Updated 5 years ago

algorithmsalgorithms-implementedbioinformaticsbioinformatics-scriptsdata-miningdata-normalizationhamming-distanceiupacnucleotide-comparisonpythonsequence-alignment

Abdullah321Umar/Internee.pk-DataAnalytics_Internship-Assignment4

🌟 Fraud Detection in Application 🌟 Through Isolation Forest and K-Means Clustering, the project detects suspicious patterns like inconsistent income, duplicate entries, and unrealistic employment data. This end-to-end workflow transforms raw data into actionable fraud insights — enhancing trust and accuracy.

Python10Updated 3 months ago

anomaly-detectioncsv-handlingdata-cleaningdata-exportingdata-importdata-normalizationexploratory-data-analysisexportinterpretationmatplotlibmodel-evaluationpandaspcapythonreportingscalingscikit-learnseaborn

Page 1 of 5