"topic:safe-ai" — Search

21 results for “topic:safe-ai”

Open framework for confidential AI

confidential-aiconfidential-computingintel-tdxprivate-aisafe-aisecure-aiteetrusted-execution-environment

FIBO is a SOTA, first open-source, JSON-native text-to-image model built for controllable, predictable, and legally safe image generation.

Python30616Updated 2 months ago

agentic-aiaicontrolable-image-generationcreative-aideep-learningenterprise-readyethical-aiimage-generationimage-generation-ailicensed-dataresponsible-aisafe-aismollm3sotatext-to-image

verivital/nnv

Neural Network Verification Software Tool

MATLAB14162Updated 2 months ago

assured-autonomyautonomycyber-physicalcyber-physical-systemsformal-methodsformal-verificationhybrid-systemsneural-networkneural-network-certificationneural-network-verificationreachabilityreachability-analysisrobustness-verificationsafe-aisafe-autonomytrustworthy-aitrustworthy-machine-learningverification

SagarBiswas-MultiHAT/PythonicHackathon-CLI

Sagar is a Python-based command-line virtual assistant for CSE students and cybersecurity learners. It supports single-line and multi-line commands to open trusted websites, play curated music links, and answer questions using an AI model—designed for safe automation, learning, and terminal-first exploration.

Python200Updated 1 month ago

aiautomationclicommand-linecsecybersecuritydeveloper-toolseducationalgroqjailbreakllmpythonsafe-aistudent-projectterminalvirtual-assistant

ksm26/Prompt-Engineering-with-Llama-2

The course provides guidance on best practices for prompting and building applications with the powerful open commercial license models of Llama 2.

Jupyter Notebook1411Updated 1 year ago

advanced-prompting-modelsai-applicationschain-of-thought-promptingcode-llamafew-shot-promptingindustry-standardslanguage-modelsllama-2llama-guardllm-interactionmeta-llama-2-chatnatural-language-processingopen-commercial-licenseprompt-engineeringprompt-engineering-modelsresponsible-airesponsible-ai-techniquessafe-ai

EzgiKorkmaz/AI-Safety

AAAI 2025 Tutorial on AI Safety

40Updated 1 year ago

adversarial-reinforcement-learningadversarial-rlai-safetyai-securityartifcial-intelligence-safetyartificial-intelligence-securitymachine-learning-safetyml-safetyml-securityreinforcement-learning-safetyresponsible-airesponsible-machine-learningresponsible-mlrlhfrobust-reinforcement-learningsafe-aisafe-reinforcement-learningtrustworthy-aitrustworthy-artificial-intelligencetrustworthy-machine-learning

pouyapd/SafeNav-RL

Safety-Constrained Reinforcement Learning for Assistive Robot Navigation

Python40Updated 1 day ago

assistive-roboticsautonomous-navigationppopytorchreinforcement-learningroboticsros2safe-ai

Haifawaeedd/SOEA-Benchmark

SOEA: Second-Order Error Awareness Benchmark for LLM Metacognitive Calibration in Biomedical NLI — Kaggle Google DeepMind AGI Cognitive Benchmarks Competition

Python10Updated 1 day ago

benchmarkbiomedical-nlpcognitive-benchmarkskagglelarge-language-modelsllmmetacognitionpubmedsafe-aiuncertainty-quantification

harunnryd/heike

Heike — The deterministic runtime for reliable AI agents. No more prompt roulette. 侍

Go10Updated 2 days ago

agentic-aiai-assistantdeterministic-aigoproduction-aisafe-ai

abisliouk/HS-MATH-LLM

Evaluate high school math reasoning in LLMs with baseline and Chain-of-Thought (CoT) prompts. Includes confidence calibration metrics, JSON output parsing, and reliability analysis.

Python10Updated 9 months ago

chain-of-thought-reasoningconfidence-calibrationgptinterpretabilityjson-parsingllmmodel-evaluationopenaiprompt-engineeringreliability-analysissafe-ai

Napiersnotes/AlignmentVirusV6

Production-Grade LLM Alignment Engine (TruthProbe + ADT)

Python10Updated 2 months ago

ai-safetyalignmentcontent-safetyllmsafe-ai

fitri-hy/chatbot-ai-experiment-nodejs

Safe for duplicate questions! || Antarmuka chatbot interaktif yang memberikan solusi cepat untuk pertanyaan pengguna.

JavaScript10Updated 1 year ago

aiapichatbotgeminigpthtmljavascriptnodejssafe-aisafebot

Safe-AI-in-Medicaid-Alliance/info

Collaborative hub for sharing and shaping AI best practices in Medicaid through the Safe AI in Medicaid Alliance (SAMA).

10Updated 3 months ago

aihealth-itmedicaidnistpublic-healthsafe-ai

JuroOravec/safe-ai-factory

Safety harness for autonomous AI agents: Spec-driven AI factory. Use with any agentic CLI. Language-agnostic. Safe by design.

TypeScript10Updated 8 hours ago

agenticai-agentsai-codingautonomous-agentsclidevtoolsdockerkubernetesllmsafe-aisandboxspec-drivenzero-trust

francescacraievich/mola-pointnet-verification

Formal verification of PointNet for LiDAR point clouds using ERAN and α,β-CROWN, with NSGA-III adversarial weights

Python00Updated 2 months ago

lidarmolapointnetsafe-aislamverified

Latchan-Ch/SafeMed-SSL

Official implementation of "Uncertainty-Guided Semi-Supervised Learning for Safe Medical Image Classification".

Jupyter Notebook00Updated 2 weeks ago

clinical-aideep-learningdisease-detectionfixmatchhealthcare-aiimage-classificationlow-resourcemachine-learningmalaria-detectionmedical-image-analysismedical-imagingmonte-carlo-dropoutpseudo-labelingpytorchsafe-aisemi-supervised-learningssltrustworthy-aiuncertainty-quantification

spalakollu/mcp-toolkit-examples

Production-ready examples and best practices for designing safe, scoped MCP tools for agentic AI.

00Updated 1 month ago

agentic-aiai-agentsai-toolsflaskjson-rpcmcpmcp-serverpermissionspythonsafe-aisecurity

Harder1850/alive-system-legacy

Deterministic AI system demonstrating strict separation between observation, pattern detection, and execution.

JavaScript00Updated 1 month ago

constitutional-ainon-executingsafe-aisystems-architecture

atremante26/SafetyLens

Evaluated model architectures and explainability techniques for content safety detection in conversational AI systems.

Jupyter Notebook00Updated 2 months ago

explainable-ainlpsafe-ai

houselearning/safeai-comeback-v2

SafeAI Comeback 2.0

TypeScript00Updated 1 week ago

aigeminigemini-apisafe-ai

wolfenix/llm-math-reasoning-analysis

🔍 Analyze the mathematical reasoning abilities of the Mistral-7B model using diverse prompting techniques on multi-step math problems.

HTML00Updated 1 hour ago

chain-of-thought-reasoningconfidence-calibrationcourse-projectdeep-learninggpthuggingface-transformersinterpretabilityjson-parsinglarge-language-modelsllmllm-evaluationmajority-votingmistral-7bopenaiprompt-engineeringreliability-analysissafe-aizero-shot