"topic:pruning" — Search

558 results for “topic:pruning”

《李宏毅深度学习教程》（李宏毅老师推荐👍，苹果书🍎），PDF下载地址：https://github.com/datawhalechina/leedl-tutorial/releases

Jupyter Notebook16.4k3.1kUpdated 1 hour ago

bertchatgptcnndeep-learningdiffusionganleedl-tutorialmachine-learningnetwork-compressionpruningreinforcement-learningrnnself-attentiontransfer-learningtransformertutorial

VainF/Torch-Pruning

[CVPR 2023] DepGraph: Towards Any Structural Pruning; LLMs, Vision Foundation Models, etc.

Python3.3k373Updated 15 hours ago

efficient-deep-learningllmmodel-compressionpruningtransformersvision

neuralmagic/deepsparseArchived

Sparsity-aware deep learning inference runtime for CPUs

Python3.2k190Updated 6 days ago

computer-visioncpusdeepsparseinferencellm-inferencemachinelearningnlpobject-detectiononnxperformancepretrained-modelspruningquantizationsparsification

intel/neural-compressor

SOTA low-bit LLM quantization (INT8/FP8/MXFP8/INT4/MXFP4/NVFP4) & sparsity; leading model compression techniques on PyTorch, TensorFlow, and ONNX Runtime

Python2.6k297Updated 8 hours ago

auto-tuningawqfp4gptqint4int8knowledge-distillationlarge-language-modelslow-precisionmxformatpost-training-quantizationpruningquantizationquantization-aware-trainingsmoothquantsparsegptsparsity

quic/aimet

AIMET is a library that provides advanced quantization and compression techniques for trained neural network models.

Python2.6k447Updated 12 hours ago

auto-mlcompressiondeep-learningdeep-neural-networksmachine-learningnetwork-compressionnetwork-quantizationopen-sourceopensourcepruningquantization

he-y/Awesome-Pruning

A curated list of neural network pruning resources.

2.5k332Updated 10 hours ago

awesome-listmodel-accelerationmodel-compressionpruning

666DZY666/micronet

micronet, a model compression and deploy lib. compression: 1、quantization: quantization-aware-training(QAT), High-Bit(>2b)(DoReFa/Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference)、Low-Bit(≤2b)/Ternary and Binary(TWN/BNN/XNOR-Net); post-training-quantization(PTQ), 8-bit(tensorrt); 2、 pruning: normal、regular and group convolutional channel pruning; 3、 group convolution structure; 4、batch-normalization fuse for quantization. deploy: tensorrt, fp32/fp16/int8(ptq-calibration)、op-adapt(upsample)、dynamic_shape

Python2.3k477Updated 1 day ago

batch-normalization-fusebnnconvolutional-networksdorefagroup-convolutioninteger-arithmetic-onlymodel-compressionnetwork-in-networknetwork-slimmingneuromorphic-computingonnxpost-training-quantizationpruningpytorchquantizationquantization-aware-trainingtensorrttensorrt-int8-pythontwnxnor-net

neuralmagic/sparsemlArchived

Libraries for applying sparsification recipes to neural networks with a few lines of code, enabling faster and smaller models

Python2.1k157Updated 1 day ago

automlcomputer-vision-algorithmsdeep-learning-algorithmsdeep-learning-librarydeep-learning-modelsimage-classificationkerasnlpobject-detectiononnxpruningpruning-algorithmspytorchsmaller-modelssparsificationsparsification-recipessparsitytensorflowtransfer-learning

cupcakearmy/autorestic

Config driven, easy backup cli for restic.

Go1.8k98Updated 2 days ago

backupcliconfigconfig-drivendeduplicationincrementalincremental-backuppruningrestic

peremartra/Large-Language-Model-Notebooks-Course

Practical course about Large Language Models.

Jupyter Notebook1.8k444Updated 1 day ago

chatbotsfine-tuning-llmhfhuggingfacelangchainlarge-language-modelspeft-fine-tuning-llmpruningtransformersvector-database

open-mmlab/mmrazor

OpenMMLab Model Compression Toolbox and Benchmark.

Python1.7k242Updated 9 hours ago

autoslimclassificationdartsdetectionknowledge-distillationnaspruningpytorchquantizationsegmentationspos

PaddlePaddle/PaddleSlim

PaddleSlim is an open-source library for deep model compression and architecture search.

Python1.6k353Updated 1 day ago

bertcompressiondetectiondistillationernienaspruningquantizationsegmentationsparsitytensorrttransformeryolov5yolov6yolov7

tensorflow/model-optimization

A toolkit to optimize ML models for deployment for Keras and TensorFlow, including quantization and pruning.

Python1.6k346Updated 1 week ago

compressiondeep-learningkerasmachine-learningmlmodel-compressionoptimizationpruningquantizationquantized-networksquantized-neural-networksquantized-trainingsparsitytensorflow

huawei-noah/Efficient-Computing

Efficient computing methods developed by Huawei Noah's Ark Lab

Jupyter Notebook1.3k220Updated 3 days ago

binary-neural-networksknowledge-distillationmodel-compressionpruningquantizationself-supervised

openvinotoolkit/nncf

Neural Network Compression Framework for enhanced OpenVINO™ inference

Python1.1k288Updated 3 hours ago

bertclassificationcompressiondeep-learninggenaillmmixed-precision-trainingnlpobject-detectiononnxopenvinopruningpytorchquantizationquantization-aware-trainingsemantic-segmentationsparsitytensorflowtransformers

horseee/LLM-Pruner

[NeurIPS 2023] LLM-Pruner: On the Structural Pruning of Large Language Models. Support Llama-3/3.1, Llama-2, LLaMA, BLOOM, Vicuna, Baichuan, TinyLlama, etc.

Python1.1k130Updated 8 hours ago

baichuanbloomchatglmcompressionlanguage-modelllamallama-2llama3llmneurips-2023pruningpruning-algorithmsvicuna

jacobgil/pytorch-pruning

PyTorch Implementation of [1611.06440] Pruning Convolutional Neural Networks for Resource Efficient Inference

Python887205Updated 1 month ago

deep-learningpruningpytorch

alibaba/TinyNeuralNetwork

TinyNeuralNetwork is an efficient and easy-to-use deep learning model compression framework.

Python872131Updated 1 day ago

deep-learningdeep-neural-networksmodel-compressionmodel-converterpost-training-quantizationpruningpytorchquantization-aware-training

Syencil/mobile-yolov5-pruning-distillation

mobilev2-yolov5s剪枝、蒸馏，支持ncnn，tensorRT部署。ultra-light but better performence！