西西嘛呦
taishan1994
NLP Scientist, Master of Wuhan University of Technology, Working on large language model, Worked as an algorithm engineer at Intellifusion.
Languages
Top Repositories
中文命名实体识别。包含目前最新的中文命名实体识别论文、中文实体识别相关工具、数据集,以及中文预训练模型、词向量、实体识别综述等。
基于pytorch的bert_bilstm_crf中文命名实体识别
使用BERT-BILSTM-CRF进行中文命名实体识别。
基于pytorch的中文三元组提取(命名实体识别+关系抽取)
中文信息抽取,包含实体抽取、关系抽取、事件抽取
langchain学习笔记,包含langchain源码解读、langchain中使用中文模型、langchain实例等。
Repositories
148记录量化LLM中的总结。
中文命名实体识别。包含目前最新的中文命名实体识别论文、中文实体识别相关工具、数据集,以及中文预训练模型、词向量、实体识别综述等。
Agent学习笔记。
中文文本纠错相关的论文、比赛和工具。
基于pytorch的bert_bilstm_crf中文命名实体识别
使用BERT-BILSTM-CRF进行中文命名实体识别。
基于pytorch的中文三元组提取(命名实体识别+关系抽取)
对llama3进行全参微调、lora微调以及qlora微调。
动手训练一个简单的CLIP模型,加深对CLIP的理解。
pytorch分布式训练
基于pytorch+bert的中文关系抽取
基于pytorch的中文意图识别和槽位填充
获取中文的笔画向量
使用bert进行事件抽取。
langchain学习笔记,包含langchain源码解读、langchain中使用中文模型、langchain实例等。
关系抽取
使用bert进行关系三元组抽取。
中文信息抽取,包含实体抽取、关系抽取、事件抽取
本仓库包含4万多条成语,并提供成语接龙实例。
No description provided.
基于Qwen2模型进行通用信息抽取【实体/关系/事件抽取】
基于pytorch+bert的中文文本分类
基于论文SpERT: "Span-based Entity and Relation Transformer"的中文关系抽取,同时抽取实体、实体类别和关系类别。
对标阿里和腾讯等机构的deepseek优化后的性能测试结果。
从头开始使用transfomer构建seq2seq(对对联)、自编码(新闻文本分类)、自回归(斗破苍穹小说续写)任务。
收集经常用到的一些python代码
以极简的代码实现文本分类,包括二分类、多分类、多标签分类。
动手训练一个简单的Llava模型。
基于pytorch_bert的中文多标签分类
异构图神经网络HAN。Heterogeneous Graph Attention Network (HAN) with pytorch