"topic:low-resource-machine-translation" — Search

17 results for “topic:low-resource-machine-translation”

This repository contains the code and data of the paper titled "Not Low-Resource Anymore: Aligner Ensembling, Batch Filtering, and New Datasets for Bengali-English Machine Translation" published in Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP 2020), November 16 - November 20, 2020.

Python15346Updated 1 year ago

bangla-dataset-machine-translationbangla-machine-translationbangla-nlpemnlp-2020low-resource-languageslow-resource-machine-translationlow-resource-nlpmachine-translationneural-machine-translationparallel-corporaparallel-corpus

Kartikaggarwal98/Indian_ParallelCorpus

Curated list of publicly available parallel corpus for Indian Languages

375Updated 4 years ago

corpusindian-languageslow-resource-languageslow-resource-machine-translationmachinetranslationmultilingual-translationneural-machine-translationnlpparallel-corporaparallel-corpus

cambridgeltl/ContrastiveBLI

Improving Word Translation via Two-Stage Contrastive Learning (ACL 2022). Keywords: Bilingual Lexicon Induction, Word Translation, Cross-Lingual Word Embeddings.

Python3610Updated 1 year ago

bilingual-dictionary-inductionbilingual-lexicon-extractionbilingual-lexicon-inductionbilingual-word-embeddingcontrastive-learningcross-lingual-embeddingscross-lingual-word-embeddingcross-lingual-word-embeddingsfasttext-embeddingsinformation-retrievallow-resource-machine-translationmachine-translationmbertpytorchself-learningword-alignmentword-embeddingsword-translation

yaoyiran/BLI-Reading-List

A 2024 Reading List for Bilingual Lexicon Induction (BLI) / Word Translation. Frequently Updated.

Python232Updated 1 year ago

bilingual-dictionary-inductionbilingual-lexicon-extractionbilingual-lexicon-inductionbilingual-word-embeddingcross-lingual-embeddingscross-lingual-word-embeddingcross-lingual-word-embeddingsinformation-retrievallarge-language-modelsllmslow-resource-machine-translationword-alignmentword-retrievalword-translation

Pzoom522/L1-Refinement

Code for "Cross-Lingual Word Embedding Refinement by ℓ1 Norm Optimisation" (NAACL 2021)

Python173Updated 3 years ago

cross-lingual-word-embeddinglow-resource-machine-translationnaacl2021transfer-learningword-translation

cambridgeltl/BLICEr

Improving Bilingual Lexicon Induction with Cross-Encoder Reranking (Findings of EMNLP 2022). Keywords: Bilingual Lexicon Induction, Word Translation, Cross-Lingual Word Embeddings.

Python133Updated 3 years ago

bilingual-dictionary-inductionbilingual-lexicon-extractionbilingual-lexicon-inductionbilingual-word-embeddingcross-encodercross-lingual-embeddingscross-lingual-word-embeddingcross-lingual-word-embeddingsfasttext-embeddingsinformation-retrievallow-resource-machine-translationmachine-translationpytorchrerankingself-learningword-alignmentword-embeddingsword-translationxlm-rxlm-roberta

cambridgeltl/prompt4bli

On Bilingual Lexicon Induction with Large Language Models (EMNLP 2023). Keywords: Bilingual Lexicon Induction, Word Translation, Large Language Models, LLMs.

Python112Updated 1 year ago

bilingual-dictionary-inductionbilingual-lexicon-extractionbilingual-lexicon-inductionfew-shot-learningin-context-learninglarge-language-modelsllamallmslow-resource-machine-translationmachine-translationmt5multilingual-modelsmultilingual-nlppromptprompt-engineeringpromptingpromptspytorchword-translationzero-shot-learning

clefourrier/CopperMT

[ACL 2021, Findings] Cognate Prediction Per Machine Translation

JavaScript100Updated 3 years ago

acl2021cognate-predictioncognatesfairseqlow-resource-languageslow-resource-machine-translationmachine-translationnmtsmt

machelreid/afromt

Code for the EMNLP 2021 Paper "AfroMT: Pretraining Strategies and Reproducible Benchmarks for Translation of 8 African Languages" by Machel Reid, Junjie Hu, Graham Neubig, Yutaka Matsuo

Python92Updated 3 years ago

low-resource-machine-translationmachine-learningnlp

andrea-cavallo-98/Low-resource-Machine-Translation

Multilingual finetuning of Machine Translation model on low-resource languages. Project for Deep Natural Language Processing course.

Jupyter Notebook82Updated 4 years ago

low-resource-languageslow-resource-machine-translationmachine-translationnatural-language-processing

HenningBuhl/low-resource-machine-translation

This repository is an open-source colleciton of various low-resource machine translation experiments.

Python72Updated 2 years ago

cascadingdeep-learningdirect-pivotingexperimentslow-resourcelow-resource-languageslow-resource-machine-translationlow-resource-nlpmachine-learningmachine-translationmachine-translation-modelsneural-machine-translationneural-networkneural-networksnlpnlp-machine-learningpivotingpythonstep-wise-pivotingtransformer

Rui0828/Learning-From-Mistakes-Prompting

LoResMT@ACL 2024: Learning-From-Mistakes Prompting for Indigenous Language Translation – A feedback-driven approach to enhance low-resource translation.

Python50Updated 1 year ago

chain-of-thoughtfew-shot-learningin-context-learninglow-resouce-languagelow-resourcelow-resource-machine-translationlow-resource-nlpmachine-translationnatural-language-processing

cambridgeltl/sail-bli

Self-Augmented In-Context Learning for Unsupervised Word Translation (ACL 2024). Keywords: Bilingual Lexicon Induction, Word Translation, Large Language Models, LLMs.

Python41Updated 1 year ago

bilingual-dictionary-inductionbilingual-lexicon-extractionbilingual-lexicon-inductionfew-shot-learningin-context-learninglarge-language-modelsllamallama2llmslow-resource-machine-translationmachine-translationmultilingual-modelsmultilingual-nlppromptprompt-engineeringpromptingpytorchself-learningword-translationzero-shot-learning

harshitadd/indicOCR

Low-Resource OCR

Jupyter Notebook20Updated 3 years ago

crawlerslow-resource-machine-translationocr

jchenghu/lowres_uski

Learning from Wrong Predictions in Low-Resource Neural Machine Translation. Basic implementation of the USKI (Unaligned Sentences Keytokens pre-training) method for Neural Machine Translation

Python10Updated 1 year ago

low-resource-machine-translationmachine-translationtransformer

edoardosignoroni/eff_archs_lowre

Results and code for the paper "Efficient Architetures for Low-resource Machine Translation" (Workshop on Advancing NLP for Low-Resource Languages at RANLP 2025 (Varna, Bulgaria), Sep 13)

Python00Updated 6 months ago

low-resource-languageslow-resource-machine-translationlow-resource-nlp

steventan0110/ParaCrawl

On-develop Bitext Mining Tool for low resource languages

Shell00Updated 3 years ago

bitext-mininglow-resource-machine-translation