"topic:data-catalog" — Search

150 results for “topic:data-catalog”

The Metadata Platform for your Data and AI Stack

data-catalogdata-discoverydata-governancedatahubhacktoberfestmetadata

OpenMetadata is a unified metadata platform for data discovery, data observability, and data governance powered by a central metadata repository, in-depth column level lineage, and seamless team collaboration.

TypeScript8.9k1.7kUpdated 2 hours ago

data-catalogdata-collaborationdata-contractsdata-discoverydata-governancedata-lineagedata-observabilitydata-profilingdata-qualitydata-quality-checksdata-validationdatadiscoverydataengineeringdataqualityhacktoberfestmcpmcp-servermetadatametadata-managementsnowflake

amundsen-io/amundsen

Amundsen is a metadata driven application for improving the productivity of data analysts, data scientists and engineers when interacting with data.

Python4.7k972Updated 18 hours ago

amundsendata-catalogdata-discoverylinuxfoundationmetadata

apache/gravitino

World's most powerful open data catalog for building a high-performance, geo-distributed and federated metadata lake.

Java2.9k751Updated 8 hours ago

ai-catalogdata-catalogdatalakefederated-querylakehousemetadatametalakemodel-catalogopendatacatalogskycomputingstratosphere

opendatadiscovery/odd-platform

First open-source data discovery and observability platform. We make a life for data practitioners easy so you can focus on your business.

Java1.4k136Updated 4 days ago

alertingbigdatadata-catalogdata-discoverydata-engineeringdata-explorationdata-governancedata-lineagedata-observabilitydata-pipelinesdata-platformdata-profilingdata-qualitydata-sciencedatacataloglineagemetadatametadata-managementobservabilityoss

intake/intake

Intake is a lightweight package for finding, investigating, loading and disseminating data.

Python1.1k151Updated 9 hours ago

data-accessdata-catalogpython

opendatadiscovery/awesome-data-catalogs

📙 Awesome Data Catalogs and Observability Platforms.

1.0k70Updated 3 days ago

awesomeawesome-listbig-datadata-catalogdata-discoverydata-engineeringdata-qualitydatacatalogdatadiscoverydataopsmetadatametadata-managementmlobservabilityopen-sourceopendataopensourceoss

rsyi/whale

🐳 The stupidly simple CLI workspace for your data warehouse.

Python72839Updated 3 months ago

data-catalogdata-discoverydata-documentation

marmotdata/marmot

Marmot helps teams discover, understand, and leverage their data with powerful search and lineage visualisation tools. It's designed to make data accessible for everyone.

Go52517Updated 4 days ago

bigdatadata-catalogdata-collaborationdata-discoverydata-explorationdata-governancedata-lineagedata-observabilitydatacatalogdatadiscoverydataengineeringlineagemcpmcp-servermetadata

gabledata/recap

Work with your web service, database, and streaming schemas in a single format.

Python35126Updated 1 week ago

data-catalogdata-discoverydata-engineeringdata-integrationdata-pipelinesetlmetadatarecap

tokern/piicatcherArchived

Scan databases and data warehouses for PII data. Tag tables and columns in data catalogs like Amundsen and Datahub

Python33899Updated 2 weeks ago

aws-athenaaws-glueaws-redshiftcatalogdatadata-catalogdatabasephipiipythonsnowflake

raystack/meteor

Meteor is an easy-to-use, plugin-driven metadata collection framework to extract data from different sources and sink to any data catalog.

Go22844Updated 3 weeks ago

bigdatacollectordata-catalogdata-managementdataopsextractorsmetadatascrapersinks

intake/intake-esm

An intake plugin for parsing an Earth System Model (ESM) catalog and loading assets into xarray datasets.

Python15854Updated 1 month ago

cesm-lensclimate-datasetscmip6data-accessdata-catalogearth-system-modelhacktoberfestintakepangeo

GoogleCloudPlatform/bigquery-data-lineageArchived

Reference implementation for real-time Data Lineage tracking for BigQuery using Audit Logs, ZetaSQL and Dataflow.

Java14841Updated 1 week ago

bigdatabigquerydata-catalogdata-governancedata-lineagedata-managementdataflowzetasql

Intugle/data-tools

The GenAI-powered toolkit for automated data intelligence.

Jupyter Notebook14642Updated 1 day ago

data-analysisdata-catalogdata-discoverydata-sciencedeveloper-toolsgenerative-aipythonsemantic-layersemantic-search

getmetamapper/metamapper

Metamapper is a data discovery and documentation platform for improving how teams understand and interact with their data.

Python816Updated 5 months ago

data-catalogdata-curationdata-discoverydata-warehousedjangometadatametamapperpythonschema-inspection

aws-samples/aws-dbs-refarch-datalake

Reference Architectures for Datalakes on AWS

HTML7831Updated 5 months ago

amazon-emrdata-analyticsdata-catalogdata-lakedata-transformationemr-clustergluehive-metastoreingest-data

GoogleCloudPlatform/datacatalog-connectors-rdbmsArchived

Sample code with integration between Data Catalog and RDBMS data sources.

Python7249Updated 5 months ago

data-catalogdatabase-managementdatacatalogdatacatalog-connectors-rdbmsgcpgreenplummetadata-extractionmetadata-managementmysqloraclepostgresqlpythonrdbmsredshiftsqlserverteradatavertica

google/grizzly

End-to-end DataOps platform deployed by Terraform.

Python6911Updated 2 months ago

airflowbigquerycloud-sqlcloud-storagecomposerdata-catalogdata-lineagedata-loss-preventiondataflowdataopsdataops-platformgcpgitgoogle-cloudgoogle-cloud-platformpubsubspannerterraform

opengeos/Earth-Engine-Catalog

The Google Earth Engine data catalog in CSV format

Python518Updated 18 hours ago

data-cataloggeospatialgoogle-earth-engine

rejot-dev/rejot

Supercharged Replication for Developers

TypeScript511Updated 1 month ago

data-catalogdatabasedeveloper-toolsdistributed-systemsevent-streamingmicroservices

commondataio/dataportals-registry

Registry of data portals, catalogs, data repositories including data catalogs dataset and catalog description standard

Python508Updated 1 week ago

data-catalogdata-discoverydata-portaldata-repositorydatasetdatasetsopen-dataopendataregistry

Tinkoff/data-detectiveArchived

Data catalog for everything in your company

Python5013Updated 4 months ago

data-catalogdata-detectivedata-governancedata-lineagemetadata

Bayer-Group/COLID-Documentation

The documentation repository is part of the Corporate Linked Data Catalog - short: COLID - application.

HTML476Updated 1 month ago

cloud-nativecoliddata-catalogdata-catalogueelasticsearchfairfair-datafindablelinked-datardfshacltriplestore

ihsn/nada

National Data Archive (NADA) is an open source data cataloging system that serves as a portal for researchers to browse, search, compare, apply for access, and download relevant census or survey information. It was originally developed to support the establishment of national survey data archives.

PHP4714Updated 4 weeks ago

catalogcataloguedatadata-catalogdata-catalog-backenddata-catalog-managementdata-documentation-initiativedata-portalddi-codebooknada

opendatadiscovery/odd-collectorArchived

Open-source metadata collector based on ODD Specification

Python4415Updated 8 months ago

data-catalogdata-discoverydata-governancedata-observabilitydata-piplinesdata-platformdata-profilingdatacataloghacktoberfestlineage

bonnard-data/bonnard-cli

Open-source agentic schema CLI. Optimised for claude code, gemini, codex and co-pilot. Skills included.

TypeScript432Updated 5 days ago

agenticagentic-analyticsagentic-schemaai-analyticsbigquerydata-catalogdatabricksdbtembedded-analyticsmcp-servermetricsmetrics-layermetrics-storemodel-context-protocolopen-sourcereliable-aisemantic-layersnowflakestructured-outputtext-to-sql

awesome-mlops/awesome-data-management

A curated list of awesome open source tools and commercial products to catalog, version, and manage data 🚀

404Updated 3 weeks ago

awesomeawesome-listdata-catalogdata-centric-aidata-lifecycledata-managementdata-management-platformdata-managerdata-pipelinedata-sciencedata-toolsdata-workflowsdataopsdataops-platformdataops-principlesdatascience

getstrm/pace

Data policy IN, dynamic view OUT: PACE is the Policy As Code Engine. It helps you to programatically create and apply a data policy to a processing platform like Databricks, Snowflake or BigQuery (or plain 'ol Postgres, even!) with definitions imported from Collibra, Datahub, ODD and the like.

Kotlin381Updated 1 month ago

bigquerydata-catalogdata-contractsdata-governancedata-processingdatabrickspolicy-enforcementsnowflake

GoogleCloudPlatform/datacatalog-connectors-biArchived

Sample code with integration between Data Catalog and BI data sources.

Python3214Updated 1 year ago

data-catalogdatacataloggcplookerlooker-sdkmetadatametadata-managementpythonqlikqlik-sensetableau

Page 1 of 5