Genmao Yu

StarRocks is a next-gen sub-second MPP database for full analytics scenarios, including multi-dimensional analytics, real-time analytics and ad-hoc query.

00Updated 2 years ago

uncleGen/hudiFork

Upserts, Deletes And Incremental Processing on Big Data.

00Updated 4 years ago

uncleGen/icebergFork

Apache Iceberg

00Updated 3 years ago

uncleGen/datax-webFork

DataX集成可视化页面，选择数据源即可一键生成数据同步任务，支持批量创建RDBMS数据同步任务，集成开源调度系统，支持分布式、增量同步数据、实时查看运行日志、监控执行器资源、KILL运行进程、数据源信息加密等。

00Updated 5 years ago

uncleGen/ReSwiftFork

Unidirectional Data Flow in Swift - Inspired by Redux

00Updated 5 years ago

uncleGen/PATFork

Performance Analysis Tool

Python00Updated 8 years ago

uncleGen/glint-fmFork

Factorization Machines on Spark and Glint

Scala00Updated 9 years ago

uncleGen/sqlflowFork

Brings SQL and AI together.

Go00Updated 6 years ago

uncleGen/spark-hive-streaming-sinkFork

A sink to save Spark Structured Streaming DataFrame into Hive table

Scala00Updated 7 years ago

uncleGen/spark-structured-streaming-jdbc-sinkFork

Spark Structured Streaming JDBC Sink

Scala00Updated 6 years ago

uncleGen/oryxFork

Oryx 2: Lambda architecture on Apache Spark, Apache Kafka for real-time large scale machine learning

Java00Updated 7 years ago

uncleGen/openapi-sdk-phpFork

The OpenAPI SDK for PHP with Composer support

PHP00Updated 7 years ago

uncleGen/schema-registry-uiFork

Web tool for Avro Schema Registry |

JavaScript00Updated 7 years ago

uncleGen/flinkStreamSQLFork

基于开源的flink，对其实时sql进行扩展；主要实现了流与维表的join，支持原生flink SQL所有的语法

Java00Updated 7 years ago

uncleGen/tranquilityFork

Tranquility helps you send real-time event streams to Druid and handles partitioning, replication, service discovery, and schema rollover, seamlessly and without downtime.

Scala00Updated 7 years ago

uncleGen/loghubFork

A collection of system log datasets for massive log analysis

00Updated 7 years ago

uncleGen/logparserFork

A toolkit for automated log parsing

Python00Updated 7 years ago

uncleGen/loglizerFork

A log analysis toolkit for automated anomaly detection

Python00Updated 7 years ago

uncleGen/sparklensFork

Qubole Sparklens tool for performance tuning Apache Spark

Scala00Updated 7 years ago

uncleGen/sparklintFork

A tool for monitoring and tuning Spark jobs for efficiency.

Scala00Updated 8 years ago

uncleGen/useful-scriptsFork

🐌 useful scripts for making developer's everyday life easier and happier

Shell00Updated 7 years ago

uncleGen/librdkafkaFork

The Apache Kafka C/C++ library

C00Updated 7 years ago

uncleGen/incubator-gobblinFork

Gobblin is a distributed big data integration framework (ingestion, replication, compliance, retention) for batch and streaming systems. Gobblin features integrations with Apache Hadoop, Apache Kafka, Salesforce, S3, MySQL, Google etc.

Java00Updated 8 years ago

Genmao Yu

Languages

Loading contributions...

Top Repositories

Repositories

Gists

Recent Activity