Aécio Santos
aecio
Postdoctoral Researcher at Centrum Wiskunde & Informatica (CWI).
Languages
Loading contributions...
Top Repositories
A super simple and clean latex beamer theme for slide presentations.
My wedding website.
Trabalho final de disciplina Programação Comercial do curso Análise e Desenvolvimento de Sistemas do IFPI. Aplicação Desktop desenvolvida utilizando a biblioteca de componentes gráficos Java Swing e vários padrões de projeto como MVC, Facade, Decorator, DAO, etc. Persistência usando banco de dados orientado a objetos DB4O.
GP4C - Genetic Programming for Crawling
Yet another simple static site generator... that works.
Sketches and indexes for estimating join-correlation.
Repositories
31A fast, distributed, high performance gradient boosting (GBDT, GBRT, GBM or MART) framework based on decision tree algorithms, used for ranking, classification and many other machine learning tasks. It is under the umbrella of the DMTK(http://github.com/microsoft/dmtk) project of Microsoft.
My personal website/blog
Yet another simple static site generator... that works.
A super simple and clean latex beamer theme for slide presentations.
My wedding website.
Sketches and indexes for estimating join-correlation.
Trabalho final de disciplina Programação Comercial do curso Análise e Desenvolvimento de Sistemas do IFPI. Aplicação Desktop desenvolvida utilizando a biblioteca de componentes gráficos Java Swing e vários padrões de projeto como MVC, Facade, Decorator, DAO, etc. Persistência usando banco de dados orientado a objetos DB4O.
A tool facilitating matching for any dataset discovery method. Also, an extensible experiment suite for state-of-the-art schema matching methods.
Python bindings for Tantivy
No description provided.
Protótipo de sistema distribuído de indexação e busca de textos (full-text search) e imagens ( metadata- and content-based search) baseado nas bibliotecas Lucene e LIRe. Implementado durante trabalho de conclusão do curso Análise e Desenvolvimento de Sistema no IFPI.
Trabalhos de RecSys DCC UFMG
Trabalhos práticos da disciplina Recuperação de Informação em 2011.1 do DCC-UFMG. Um indexador de uma coleções de páginas HTML. Contém implementações dos modelos de recuperação de informação vetorial (Vector Space Model) e BM-25, algortimo PageRank e uso de indexação de anchor text. O indexador utiliza indexação em disco baseada e ordenação externa.
OpenEBS Website and User Documentation
Wrapper code for Apache HttpClient that provides common page fetching functionality
No description provided.
A set of reusable Java components that implement functionality common to any web crawler
No description provided.
Java dataframe and visualization library
No description provided.
This project contains an infographic about the news propagation during the 2018 Brazilian elections. It was part of the Information Visualization course at NYU Tandon.
Sketch and LSH Index library for Java, including OPH methods as well as the Lazo method
P-score: reputation-based ranking on graphs
Statistical Machine Intelligence & Learning Engine
List of libraries, tools and APIs for web scraping and data processing.
A collection of awesome web crawler,spider in different languages
Docker - the open-source application container engine
Home page for the group
GP4C - Genetic Programming for Crawling
Implementation of algorithms for storing large unique key-value sets