Source |
Schneier on Security |
Identifiant |
8607632 |
Date de publication |
2024-11-07 16:13:07 (vue: 2024-11-07 17:06:53) |
Titre |
Des défenses d'injection rapides contre les cyberattaques LLM Prompt Injection Defenses Against LLM Cyberattacks |
Texte |
Recherche intéressante: & # 8220; pirater l'Ai-Hacker: injection rapide comme défense contre les cyberattaques conduites par LLM 8220 ;:
Les modèles de grande langue (LLM) sont de plus en plus exploités pour automatiser les cyberattaques, ce qui rend les exploits sophistiqués plus accessibles et évolutifs.En réponse, nous proposons une nouvelle stratégie de défense adaptée pour contrer les cyberattaques axées sur la LLM.Nous présentons Mantis, un cadre défensif qui exploite LLMS & # 8217;Sensibilité aux apports contradictoires pour saper les opérations malveillantes.Lors de la détection d'une cyberattaque automatisée, les usines de Mantis ont soigneusement créé des entrées dans les réponses du système, conduisant l'attaquant à perturber ses propres opérations (défense passive) ou même à compromettre la machine de l'attaquant (défense active).En déployant des services de leurre vulnérables délibérément pour attirer l'attaquant et en utilisant des injections d'invites dynamiques pour l'attaquant, Mantis peut pirater de manière autonome l'attaquant.Dans nos expériences, Mantis a systématiquement réalisé plus d'efficacité de 95% contre les attaques automatisées basées sur LLM.Pour favoriser les recherches et la collaboration supplémentaires, Mantis est disponible en tant qu'outil open source: ...
Interesting research: “Hacking Back the AI-Hacker: Prompt Injection as a Defense Against LLM-driven Cyberattacks“:
Large language models (LLMs) are increasingly being harnessed to automate cyberattacks, making sophisticated exploits more accessible and scalable. In response, we propose a new defense strategy tailored to counter LLM-driven cyberattacks. We introduce Mantis, a defensive framework that exploits LLMs’ susceptibility to adversarial inputs to undermine malicious operations. Upon detecting an automated cyberattack, Mantis plants carefully crafted inputs into system responses, leading the attacker’s LLM to disrupt their own operations (passive defense) or even compromise the attacker’s machine (active defense). By deploying purposefully vulnerable decoy services to attract the attacker and using dynamic prompt injections for the attacker’s LLM, Mantis can autonomously hack back the attacker. In our experiments, Mantis consistently achieved over 95% effectiveness against automated LLM-driven attacks. To foster further research and collaboration, Mantis is available as an open-source tool: ... |
Notes |
★★★
|
Envoyé |
Oui |
Condensat |
“hacking accessible achieved active adversarial against are attacker attacker’s attacks attract automate automated autonomously available back being can carefully collaboration compromise consistently counter crafted cyberattack cyberattacks cyberattacks“: decoy defense defenses defensive deploying detecting disrupt driven dynamic effectiveness even experiments exploits foster framework further hack hacker: harnessed increasingly injection injections inputs interesting introduce language large leading llm llms llms’ machine making malicious mantis models more new open operations over own passive plants prompt propose purposefully research research: response responses scalable services sophisticated source strategy susceptibility system tailored tool: undermine upon using vulnerable |
Tags |
Hack
Tool
|
Stories |
|
Move |
|