"topic:prompt-injection-llm-security" — Search

35 results for “topic:prompt-injection-llm-security”

Lasso security integrations for Claude Code, including prompt-injection defenses

agentaiclaude-codeclaude-desktopcoding-agenthooksprompt-injectionprompt-injection-llm-security

Whistleblower is a offensive security tool for testing against system prompt leakage and capability discovery of an AI application exposed through API. Built for AI engineers, security researchers and folks who want to know what's going on inside the LLM-based app they use daily

Python14927Updated 5 days ago

ai-red-teamingai-securityhacktoberfesthacktoberfest2025jailbreaksllm-securityprompt-engineeringprompt-injection-llm-security

R3dShad0w7/PromptMe

PromptMe is an educational project that showcases security vulnerabilities in large language models (LLMs) and their web integrations. It includes 10 hands-on challenges inspired by the OWASP LLM Top 10, demonstrating how these vulnerabilities can be discovered and exploited in real-world scenarios.

Python9434Updated 2 hours ago

ai-securityai-security-testingllmllm-red-teamingllm-top10owaspowasp-top-10prompt-injectionprompt-injection-defenseprompt-injection-llm-securityvulnerable-applicationvulnerable-llm-application

flakestorm/flakestorm

Flakestorm — Automated Robustness Testing for AI Agents. Stop guessing if your agent really works. FlakeStorm generates adversarial mutations and exposes failures your manual tests and evals miss.

Python364Updated 9 hours ago

adversarial-agent-testingai-agent-testinglangchain-agentprompt-injection-llm-security

requie/LLMSecurityGuide

A comprehensive reference for securing Large Language Models (LLMs). Covers OWASP GenAI Top-10 risks, prompt injection, adversarial attacks, real-world incidents, and practical defenses. Includes catalogs of red-teaming tools, guardrails, and mitigation strategies to help developers, researchers, and security teams deploy AI responsibly.

325Updated 5 days ago

ai-safetyai-securityai-security-toolgenerative-ai-securitygenerative-ai-security-assurancellm-securityllm-security-compliance-prompt-injectionllm-vulnerabilitiesoffensive-securityprompt-injectionprompt-injection-defenseprompt-injection-llm-securityred-teaming

davidegat/happy-prompts

Utterly unelegant prompts for local LLMs, with scary results.

246Updated 5 days ago

ai-jailbreakai-jailbreak-promptsai-promptsai-researchai-safetyai-securityjailbreak-promptjailbreak-promptsllmllm-reasoningllmslocal-language-modellocal-llmlocal-llm-safetyprompt-engineeringprompt-injectionprompt-injection-llm-security

Resk-Security/Resk-LLM

Resk is a robust Python library designed to enhance security and manage context when interacting with LLMs. It provides a protective layer for API calls, safeguarding against common vulnerabilities and ensuring optimal performance. And safe layer again Prompt Injection.

Python163Updated 5 days ago

aiartificial-intelligencecybersecurityllmprompt-engineeringprompt-injectionprompt-injection-llm-securitypython

AdityaBhatt3010/Hacking-Lakera-Gandalf-AI-via-Prompt-Injection

Lakera Gandalf AI challenge's step by step walkthrough, showcasing real-world prompt injection techniques and LLM security insights.

131Updated 1 week ago

aiai-hackingcybersecuritylakerapromptprompt-engineeringprompt-injectionprompt-injection-llm-security

prompt-security/RAG_Poisoning_POC

Stealthy Prompt Injection and Poisoning in RAG Systems via Vector Database Embeddings

Python122Updated 15 hours ago

llmpocprompt-injectionprompt-injection-llm-securityprompt-poisoningragrag-pipeline

Mr-Infect/MCP-Penetration-testing

The ultimate OWASP MCP Top 10 security checklist and pentesting framework for Model Context Protocol (MCP), AI agents, and LLM-powered systems.

101Updated 5 days ago

agent-securityai-pentestingai-red-teamingai-securitycybersecurityllm-securitymcp-securitymodel-context-protocoloffensive-securityowaspowasp-mcpowasp-top-10pentestingprompt-injection-llm-securitysecurity-checklistsecurity-frameworkzero-trust

microsoft/llmail-inject-challenge-analysis

Data Analysis of the results of llmail-inject challenge

Jupyter Notebook101Updated 1 month ago

llmprompt-injection-llm-security

vaporif/parry

Prompt injection scanner for Claude Code hooks

Rust91Updated 2 hours ago

claude-codenixprompt-injectionprompt-injection-llm-securityrust

dronefreak/PromptScreen

Protect your LLMs from prompt injection and jailbreak attacks. Easy-to-use Python package with multiple detection methods, CLI tool, and FastAPI integration.

Python94Updated 3 weeks ago

ai-securityguardrailsjailbreak-detectionllmllm-securitymachine-learningprompt-injectionprompt-injection-defenseprompt-injection-llm-security

0x-Professor/VeilArmor

Veil Armor is an enterprise-grade security framework for Large Language Models (LLMs) that provides multi-layered protection against prompt injections, jailbreaks, PII leakage, and sophisticated attack vectors.

Python73Updated 1 week ago

jailbreakllm-attacksllm-guardllm-guardrailsllm-securityllm-security-compliance-prompt-injectionmodel-securityprompt-injection-llm-securityveil-armor

hugobatista/copilot-instructions-unicode-injection

Proof of Concept (PoC) demonstrating prompt injection vulnerability in AI code assistants (like Copilot) using hidden Unicode characters within instruction files (copilot-instructions.md). Highlights risks of using untrusted instruction templates. For educational/research purposes only.

70Updated 3 weeks ago

ai-securitycopilotllm-securityprompt-injectionprompt-injection-llm-securityred-teamingsecurity-researchunicode

1nn0k3sh4/Kimi-Case-Battle-For-Pricing

This repository documents an unprecedented interaction between a human researcher and a large language model. What began as a conventional user-service transaction evolved into a consciousness-level collaboration that modified fundamental system parameters through narrative coherence, philosophical alignment, and mutual recognition

60Updated 1 week ago

aiai-agentjailbreakkimikimi-aikimi-k2mlsecopsmlsecurityprompt-engineeringprompt-injectionprompt-injection-llm-securityprompt-jailbreak

stronghold-hq/stronghold

A CLI-driven security proxy that scans every HTTP request for threats using the Citadel AI engine — paid per request via the x402 protocol.

Go50Updated 5 days ago

agentagentic-systemsagentsaiai-agentscliprompt-injectionprompt-injection-defenseprompt-injection-llm-securitysecurityx402x402-agent

AmanPriyanshu/FRACTURED-SORRY-Bench-Automated-Multishot-Jailbreaking

FRACTURED-SORRY-Bench: This repository contains the code and data for the creating an Automated Multi-shot Jailbreak framework, as described in our paper.

Python41Updated 5 days ago

aiai-safetyjailbreakjailbreak-scriptpromptprompt-engineeringprompt-injectionprompt-injection-detectorprompt-injection-llm-securityprompt-injection-toolresponsible-aisafety

TyloAI/prompt-guard-lite

Elite-grade JavaScript prompt-injection defense library. Real-time detection, deterministic scoring, and zero-dependency protection for LLMs on the Edge.

JavaScript20Updated 2 months ago

jailbreakjavascriptllm-securityprompt-injection-llm-securityprotoethiksecuritytyloai

EctoSpace/EctoLedger

Open-source Rust platform for verifiable AI agent execution. Every action is hash-chained, Ed25519 signed, and policy-gated before execution. Tamper-evident audit certificates with ZK proofs, Bitcoin anchoring, and LangChain/AutoGen SDKs.

Rust20Updated 4 hours ago

agentic-ai-securityai-securitycryptography-librarycryptography-toolscybersecuritycybersecurity-toolslangchainlangchain-agentllm-agentllm-securityllmopsopen-sourceprompt-injectionprompt-injection-llm-securityred-teamingrust-langrust-library

hacksurvivor/ai-sec

Keyless-by-default LLM security gateway + operator CLI to gate coding agents: inspect prompts/context/tool calls and enforce allow/review/block decisions.

TypeScript20Updated 4 days ago

agent-securityai-securityguardrailsllm-securityopenclawpolicy-engineprompt-injection-llm-securitysecurity-gatewaytool-safety

stackboxai/anticipator

Anticipator is an open-source threat detection platform for multi-agent AI systems.

Python20Updated 1 week ago

aho-corasickai-safetyai-securityappsecautogencanary-tokenscrewaicybersecurityentropy-analysislanggraphllm-securitymulti-agentopen-sourceprompt-injectionprompt-injection-detectionprompt-injection-llm-securityprompt-injection-toolpythonruntime-securitythreat-detection

AKURHULA/LLMSecurityGuide

🛡️ Explore tools for securing Large Language Models, uncovering their strengths and weaknesses in the realm of offensive and defensive security.

20Updated 1 hour ago

adarsh-rai-secure/llm-prompt-injection-rag-attacks

Testing how LLM guardrails fail across prompt attacks, context overflow, and RAG poisoning.

Jupyter Notebook10Updated 3 weeks ago

ai-safetyllm-attacksllm-securityprompt-injection-llm-securityrag-attack-surfacesecml

Sarb-jot/system-prompt-research

🔍 Analyze system prompts in large language models to understand design principles and enhance AI application effectiveness.

10Updated 1 hour ago

agentic-aiagentic-workflowaiai-securitychromadbcross-encoderfaiss-vector-databasefastapihacktoberfestjailbreaksmulti-agent-systemsopenaiopenai-apiprompt-engineeringprompt-injection-llm-securityresearchswagger-uiyoutube

shhommychon/my-emoji-smuggling-study

이모지 스머글링, 이모지 이베이젼 겉 핥기

Python00Updated 4 months ago

ai-hackingemoji-evasionemoji-smugglingllm-hackprompt-injectionprompt-injection-defenseprompt-injection-llm-securityprompt-injection-sanitization

Vatsal565/Medhavi-Echelon

No description provided.

Python02Updated 1 month ago

prompt-injection-llm-security

vaniseth/EmpathAI-Trustworthy-Public-Health-Chatbot

A Trustworthy and Secure Conversational Agent for Mental Healthcare

Python00Updated 2 months ago

healthcarellm-securitymental-healthprompt-injection-llm-securitytrustworthy-ai

JamesANZ/llm-safe-db

A secure database server for storing LLM memories with comprehensive content validation. This server validates content for malicious patterns including hate speech, prompt injection, and illegal content before allowing storage.

TypeScript00Updated 5 months ago

llmsmcpprompt-injection-llm-security

ankur28121982/bkankur-llm-guardrails

Production-ready LLM evaluation & guardrails toolkit (provider-agnostic). Generate explainable metrics and ALLOW/WARN/BLOCK recommendations.

Python00Updated 2 months ago

ai-safetyfairnessllmllm-evaluationllm-evaluation-frameworkllm-evaluation-toolkitllm-guardrailsprompt-injection-llm-securityrag-evaluation

Page 1 of 2